大规模古籍文本在中国史定量研究中的应用探索

大规模古籍文本在中国史定量研究中的应用探索摘要利用新的信息技术与面向数字人文研究的跨学科方法,采用大数据研究理念对古籍文本进行字词的历时词频分布规律可视化分析,以中国史定量研究为例,对部分中国史的经典宏观理论从量化角度进行了初步验证。认为大数据视域下的技术逻辑和人文逻辑相耦合的数字人文研究为人文社会科学经典理论的验证和拓展提供了更多研究空间与研究方法,有利于推进古籍文献深层次的幵发与利用。关键词大数据数字人文定量分析计量史古籍1•引言随着“大数据”时代的到来,对大规模历史资料进行定量分析已成为历史学研究中一种新的、行之有效的方法,通过统计分析从大规模数据中挖掘新事实、产生新认识,能够发现靠传统文献阅读无法发现的隐藏在历---本文于网络,仅供参考,勿照抄,如有侵权请联系删除---史文献中的史实与现象。20世纪中期以来,历史学定量分析逐渐成为国际学术研究中的一股新风潮,并服务于学界,现在学者们认为许多不具备数字特征的事物或事件,只要所研究的事物或事件存在特征并能加以量化,同样可进行定量研究,计量史学在经济史、政治史、社会史、人口史等领域研究中取得了很多的研究成果,发挥着巨大的作用。人文学科中的定量研究不仅能通过数据挖掘新发现,更能解释和理解这些发现,进而改变我们固有的历史和社会科学理论与认知。大数据给了人文学科研究的全新思维。人文学科研究往往会预先设定研究问题或理论模型和假设,然后去寻找相关材料,但部分研究因为材料收集有较强的主观性和选择性,往往倾向于重复确认“已知”,而忽略发现“未知”。因此,很难促进对社会事物整体规律形成统一且有效的认知。而大数据研究思维则不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。埃雷兹?艾登(ErezAiden)等在《可视---本文于网络,仅供参考,勿照抄,如有侵权请联系删除---化未来数据透视下的人文大趋势》(UNCHARTED:BigDataasaLensonHumanCulture)中以“谷歌图书”项目为背景,通过500多万本电子书不同词汇使用频度随时间的变化,讲述了大数据在研究历史文化、人类语言、社会名望、群体记忆等方面的重要作用,凸显了大数据对人文社会科学研究的变革意义。大数据时代的各种思潮和视角在不断涌现,大数据作为一种全新的资料,以其大大超越传统调查数据的样本量和时间跨度,为人文社会科学经典理论的验证和拓展提供了更多研究空间。而基于大数据的定量分析则为人文社会科学研究提供了一个全新的视角,传统人文社会科学的实证研究强调在理论的前提下建立假设,大数据时代重在发现知识与现象,在没有理论假设的前提下去预知,从海量的数据中发现知识,寻找隐藏在数据中的模式、趋势和相关性,揭示事物现象与发展规律,大规模的古籍文献扩大了人文学科资料的范围,提供了人文学科新---本文于网络,仅供参考,勿照抄,如有侵权请联系删除---的研究空间和新的研究可能。2.大数据视域下的传统古籍文献开发及利用分析目前,我国古籍文献的数字化已经比较成熟,文字层面的数字化也具一定规模,为古籍的深度开发与利用奠定了基础。古籍文献的统计分析是数字人文研究对古籍深度利用的基本需求,定量分析则是数字人文研究的一种主要研究方式。与传统的定性分析不同,定量分析是依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值的一种方法。因此,定量分析的应用使人文学科研究更趋于科学化。人文学科的研究者对定量分析的需求日趋强烈,研究者不再满足检索结果的简单罗列,更需要从计量学的角度对符合一定条件的古籍文献从作者、文献、体裁及年代等多角度进行统计分析。近年来学者在古代诗、词、古代文学及中国史等研究中采用定量研究的趋势更为明显,例如,武汉大学著名词学研究者王兆鹏教授把文献计量的方法成功地引入词学研究中,李伯重教授在史学研究中大量地采---本文于网络,仅供参考,勿照抄,如有侵权请联系删除---用量化方法,李中清教授通过定量方法提出了150年来中国精英出身家庭四个阶段论述,胡俊峰、俞士汶利...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?