高校精准资助应用大数据的现实困境和技术诉求_1

高校精准资助应用大数据的现实困境和技术诉求4.数据应用性和数据安全性的困境网络安全和信息化建设是一体两翼的两个方面,缺一不可,学生资助领域因为涉及个人信息、网络安全,尤其要重视数据安全,特别是个人信息数据的隐私保护。对于高校精准资助工作来说,大数据虽然在确立资助对象精准、形式精准等方面存在着各种优点,能够给人们提供海量数据,帮助决策者提高洞察力,帮助资助工作者对受助群体进行精准定位。但风险与优势是并存的,高校在获取信息的同时,个人信息被窃取的可能性也在增加,使个人隐私被侵害的可能性增大,这也是必须要避免的问题。三、高校精准资助工作应用大数据的技术诉求为解决上述困境,从技术角度,可以考虑从以下四个方面开展工作:1.充分利用数据相关性研究技术获取资源数据大数据研究中,“相关关系”和“因果关系”一直存在争论,但无论争论结果如何,大数据的相关性关系分析能对我们进行某项决策提供支持,数据之间的相关性分析也可以帮助人们更快更高效地发现事物之间的联系,有效地发现与度量相关关系仍具有重要研究价值,可以说,大数据相关分析已经成为大数据分析与挖掘的核心科学问题与关键应用技术。[7]纳入分析的范围可以重点考虑文本数据,因为在众多数据类型中,文本数据是存储和交换信息最自然的方式,尤其值得关注和研究。[8]文本数据挖掘是数据挖掘中的一个分支,又称文本知识发现,是指从大量文本数据中抽取隐含的、前所未知的、潜在有用的、可理解的模式和知识的过程。[9]大数据时代,网上大量出现非结构化数据,人们处理和接触最多的就是文本数据这种非结构化数据形式,充分利用文本主题挖掘与关联搜索等技术,进行基于关键词的查询扩展,提高文本数据挖掘与相关性搜索的准确性。基本原理是首先通过文本解析提取、文本预处理和文本索引等手段对文本信息进行预处理,然后通过主题发现模型构建、模型参数计算等步骤建立基于潜在语义关系的主题发现模型,最后实现文本的主题关联搜索。在具体的分析方法上,可以使用目前比较通用的一些定义和分析理论。用X,Y代表两个随机变量,首先分析一维变量,定义(x1,x2,……,xn)(y1,y2,……,yn)为X,Y的取值,n为样本空间大小。当X,Y均为一维变量时,可以视作样本的两个特征变量,则(x1,y1)(x2,y2)……(xn,yn)是n个样本在X,Y上的取值。进一步定义,X=(X1,X2,……,Xp),Y=(Y1,Y2,……,Yq)是p维、q维的随机向量,X1,X2,……,Xp和Y1,Y2,……,Yq分别是X和Y的特征值。定义E1为不知道X值预测Y值时产生的误差,E2为知道X值预测Y值时产生的误差,则:PRE=(E1-E2)/E1PRE值越大则表示X和Y的相关性越大,研究数据之间的相关性定量为研究PRE值的大小,这是一种适用于任何类型数据的相关系数。以此为基础,可以进一步研究定类变量、定序变量之间的相关系数,得出相关系数层次图,再进一步扩展到多变量相关系数,最后研究基于矩阵计算、基于距离的相关系数等,从而通过对相关系数的研究获取数据之间相关性的定量分析和准确判断。2.通过利用数据融合技术获取分析数据大数据的一个重要特征即数据类型繁多。现代互联网环境除传统数据格式,还出现了大量视频、图像等非结构化数据,其处理技术完全不同于传统的数据库和数据仓库技术。通过各种手段获取了与研究样本关联的相关性数据以后,如何通过技术手段把这些数据变成能统一处理和分析的数据是要解决的第二个问题,有效的手段之一是数据融合技术。大数据融合技术不同于传统数据库或数据仓库研究领域的数据抽取、集成、清洗技术,数据融合技术需要用动态的方式分析处理不同数据来源不同数据结构的数据,并将其转化为统一可识别处理的知识资源,形成知识库。知识库作为知识组织管理的一种特殊的数据库,是知识存储和计算的重要组织形式。[10]高校精准资助研究领域中的知识库,代表着能直接对是否资助对象进行判断的数据资源,数据融合也就可以视为:如何从海量异构数据中,通过数据融合技术,获得能直接进行处理判断依据的数据资源知识库,整个过程可以称之为知识融合。知识融合技术可分为知识评估和知识扩充,知识评估主要...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?