应用大数据技术开发数字档案信息资源的现实困境与策略研究

应用大数据技术开发数字档案信息资源的现实困境与策略研究米永宁+耿志杰Reference:近年来,档案界对大数据技术的研究较热,但整体来看在目前条件下应用大数据技术开发数字档案信息资源存在现实困境,数字档案信息资源开发中的数据化、结构化不足等问题与大数据技术的应用条件之间有一定距离。本文认为应该从完成数字档案数据化、结构化,捕获档案数据流建立档案数据资源库,强化档案数据流的分析处理等方面将大数据技术应用于数字档案信息资源的开发。Keys:大数据数字化数据化数字档案信息资源开发Abstract:Inrecentyears,ArchivesacademiahasbeenkeentoresearchBigdatatechnologies.Butallthingsconsidered,somerealisticpredica?mentreallyexistsinapplyingBigDatatechnologiestodevelopDigitalArchiveResourcesunderthecur?rentconditions,theunfinishedDatamation,Structur?alization,alongwithotherproblemscantmeettheconditionsoftheapplicationofBigDatatechnolo?gies.ThisarticlearguesseveralstrategiesshouldbetakentoapplyBigDatatechnologiestodevelopDig?italArchiveResources,e.g.ContinuetoworkfortheDatamationandStructuralization,thencapturetheArchivaldatastreamandbuildtheArchivaldatare?pository,enhanceanalysisandprocessingofArchi?valdatastreametc.Keywords:Bigdata;Digitalization;Datamation;Digitalarchiveresourcesdevelopment一、引言随着大数据技术的兴起,档案界的研究工作正在逐步深入。笔者在中国知网(CNKI)上,以“大数据”为Keys进行检索,检索时间为2013年1月1日至2015年12月31日,得到相关文章共计152篇。再将这些文章按照主题范畴进行分类,发现其主要涉及档案大数据概念、内涵与特点,大数据时代档案馆建设、应用技术和信息服务,档案工作机遇和挑战,档案大数据价值,数字档案大数据存储,档案管理,档案信息安全和资源管理等领域。在上述相关研究中,政府和商业界普遍认识到大数据技术和大数据思维带给电子商务、电子政务以及IT行业的冲击和挑战,档案界亦持有相同观点,认为在大数据技术背景下的档案信息化工作面临着新技术、新理念带来的机遇和挑战,亟待转型和创新。对于这一趋势,本文认为,在大数据技术的热潮下,档案界更需要保持冷静的头脑,理性认知大数据技术的同时,还需要认识到档案信息资源开发工作有其自身的规律、特点和任务,不必为了贴上大数据标签而透支大数据概念。[1]二、大数据技术应用于数字档案资源开发的现实困境在借鉴有关文献的基础上,笔者发现档案界在应用大数据技术开发数字档案信息资源的研究方面,持有的观点集中体现为:他们认为档案大数据时代已然到来,大数据技术能够应用于数字档案资源的开发。其依据一是大数据技术在商业领域较广泛的应用实践,应用成本逐渐降低且商业价值大幅提高,能够推动该技术不断成熟,因而有望进行大范围推广。二是我国数字档案资源存量和增量均较为庞大,因而大数据技术在这一领域有用武之地。本文认为,上述观点有其合理性,即我国的数字档案资源存量和增量庞大确是事实,但是更应该看到数量庞大的数据并不一定就是可用于大数据技术开发的数据。换句话说,该观点的持有者简单地将大数据的“4V”(Volume—数据体量巨大;Variety—数据类型繁多;Value—数据价值密度低和Velocity—数据处理速度快)特征等同于“数量庞大的数字档案信息”的特征。在综合相关文献研究及实际调研的基础上,我们认为应用大数据技术开发数字档案资源的理想状态应如图1所示。事实上,目前的档案工作条件与数字档案资源的大数据开发尚有一定距离。从现实角度来看,大数据技术应用于数字档案信息资源开发存在以下困境。(一)数字档案资源的建设方式无法满足大数据开发的要求数字化,不是数据化。[2]数字化和数据化之间的关系可以这样界定:数字化的重点在“技术”上,而数据化的重点在“信息”本身。“数字化带来了数据化,但是数字化无法取代数据化,数字化是把模拟数据变成计算机可读的数据,和数据化有本质上的不同”。[3]比如,谷歌公司和亚历山大图书馆合作对...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?