基于新闻信息抽取的人文社科非正式科学交流研究

基于新闻信息抽取的人文社科非正式科学交流研究王晓笛李广建摘要:科学交流研究,是情报学长期关注的研究主题,其中非正式科学交流尤其是线下的交流活动作为一种重要的信息交流方式,但长期以来由于受到数据的限制一直不能进行大规模的研究。文章通过探索学术新闻中对于非正式科学交流活动的记录,将活动拆解为参与者、时间、地点、事件类型、报告题目、观点等元素,并对这些元素在新闻中的文本特征做了分析。研究证明利用信息新闻抽取,可以实现对非正式科学交流事件的了解,并可以以此为基础研究线下非正式科学交流的某些特征和规律。关键词:非正式科学交流;信息抽取;人文社科:G250.2:ADOI:10.11968/tsyqb.1003-6938.2018024ResearchontheInformalScientificCommunicationoftheHumanitiesandSocialSciencesBasedontheExtractionofNewsInformationAbstractScientificcommunicationisahotresearchtopicininformationscience.Informalcommunication,especiallythosehappenedinreallifeisanimportanttypeofcommunication.However,thereisnolargescalestudyonthistopicduetoalackofdata.Inthisstudyweexplorehowtheseactivitieshasbeendescribedinacademicnewsandsplitapieceofnewsintoparticipants,time,place,event,reporttitleandopinion.Westudiedthepatternsofhowtheseelementsarephrased.Basedontheseknowledgeweuseaprogramtoimplementaprocesswhichenablesustoextract160,312communicationactivitiesfromnewscrawledusingBingAPIandanexpertlist.Thenwecarriedoutageneralanalysisandacasestudy.Keywordsinformalscientificcommunication;informationextraction;humanitiesandsocialsciences1引言科學自诞生以来就伴随着科学知识的传播,从古希腊时期的口口相传,到近代以牛顿等科学家为代表的欧洲科学研究开始出现了相对正式的文字科学交流。进入20世纪后,随着《科学革命的结构》《无形学院——知识在科学共同体的扩散》等专著的出版,科学共同体的互动以及知识的交流作为一种特殊的交流形式开始得到研究者的关注,该研究在情报学领域被称为科学交流研究,是情报学长期关注的研究主题。前苏联著名情报学家米哈依诺夫将科学信息交流分为“正式交流过程”和“非正式交流过程”。正式交流过程指发生在科学信息生产者和科学信息消费者借助于科技文献进行科学信息交流的过程;非正式交流过程指的是信息生产者与利用者之间直接进行交流的过程,这种交流通常是口头进行的,一般的交流场景包括面对面交谈、电话会议、邀请或访问型现场讲座等。来自拉夫堡大学的Brittain[1]对非正式科学交流的比例做了研究,估计在整个研究和学术环境中,非正式科学交流所占比重在50%到80%之间,而在社会科学的实际应用、管理以及教学领域,非正式交流的比重甚至更高;Kraut等[2]的研究指出,非正式交流在组织交流形式中占有支配性地位。然而,从总体上看,当前对于非正式交流的研究依然较少,且数据规模都较小[3]。一个重要原因是难以获得相关数据,因此无法开展大规模研究[3]。Brittain[1]的研究表明,较小的研究规模对于从整体上理解非正式科学交流活动能起到的作用很小。近年来,大数据、多源数据融合以及人工智能等技术经历了快速发展,研究者提出了学术大数据的概念[4],这为情报学研究者利用学术大数据对非正式科学交流进行研究提供了数据基础和技术条件。当前已有学者开始探索利用各种互联网数据进行非正式科学交流的研究。如张立伟等[5]利用科学网中的博客数据对网络空间中科学家的非正式科学交流研究,识别了交流的主要推动力、交流的时间特征和主要内容等;邹儒楠和于建荣[6]利用小木虫论坛数据,从社会网络分析的角度研究了非正式科学交流中知识转移的问题;刘乙蓉[7]使用微博数据,对图书情报领域相关专家的交流网络以及交流内容做了研究。此外,还有研究者[8]利用诸如Github等平台的数据对虚拟社区创新知识传播进行研究。然而,从科学交流所发生的空间来看,上述研究均关注的是网络空间中的科学交流,正如方卿[9]所指出的,网络中的科学交流定位于“点对点”的个人交流...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?