基于共词分析的国内文本情感分析研究

基于共词分析的国内文本情感分析研究陈红琳魏瑞斌张玮摘要:[目的/意义]对国内文本情感分析的研究成果进行梳理与计量分析,有助于从不同角度了解主题研究状况、发文情况,对后续的研究具有一定的参考价值。[方法/过程]本文对发文期刊、作者团队进行统计分析,并利用共词分析法,研究关键词之间的联系,探讨近十年来在文本情感分析的研究热点及现状。[结果/结论]结果表明,我国近两年对文本情感分析的研究主要有基于情感词典的机器学习和神经网络的深度学习两种方法,文章最后指出了两种方法的研究现状及未来研究方向。关键词:文本情感分析;共词分析;情感词典;深度学习;神经网络DOI:10.3969/j.issn.1008-0821.2019.06.010〔〕TP391.1〔〕A〔〕1008-0821(2019)06-0091-11Abstract:[Purpose/Importance]Theresearchresultsoftextsentientanalysisweresortedoutandquantitativelyanalyzed,whichwashelpfultounderstandthestatusofsubjectresearchandpublishing,andithadcertainreferencevalueforsubsequentresearch.[methods/Procedures]Thispapermadeastatisticalanalysisofthepublishedjournalsandauthorteams,andusesco-wordmethodtostudytherelationshipbetweenkeywords,anddiscussedtheresearchhotspotsandcurrentsituationoftextsentientanalysisinthepastdecade.[Results/Conclusion]TheresultsshowedthattheresearchontextsentimentanalysisinChinainthepasttwoyearsmainlyincludedtwomethods:machinelearningbasedonemotiondictionaryanddeeplearningbasedonneuralnetwork.Atlast,thepaperpointedoutthefutureresearchdirectionofthetwomethods.Keywords:textsentimentanalysis;co-wordanalysis;emotionaldictionary;deeplearning;neuralnetwork目前,互联网的应用无论是广度还是深度,都呈井喷式飞速发展,伴随而来的是,网络中的数据以每天数亿计的速度快速增长。通过挖掘这些海量数据,我们能从中得到很多有价值的信息。近年来,越来越多的学者开始关注网络文本挖掘,其中文本情感分析成为最热门的研究问题之一,涉及政治、军事、经济、娱乐、生产生活等各个领域,通过分析其中蕴含的用户情感,了解用户喜好,将其作为决策依据。为了系统全面地了解评论内容、跟踪舆情,越来越多的组织及个人利用计算机技术,对网络中的用户文本信息进行分析,文本情感分析由此产生。文本情感倾向分析又称意见挖掘,是针对观点持有人对某产品、事件或人物等的评论,进行倾向性的研究。马晓玲等[1]提出了文本情感分析的研究框架,并从基础理论研究和应用研究两个角度对代表性成果进行了分析。拥措等[2]分析国内外短文本情感分析的研究方法、研究热点和研究趋势。1数据来源与研究方法1.1数据来源本文以CNKI(知网)为数据来源,于2018年8月5日,以“文本情感分析”为主题词,对CNKI全文数据库进行搜索,共得到1038篇文献,排除学位论文,并对所有文献进一步处理,删除无作者、无单位、无年代、无关键字、无学科主题、重复的文献,最终得到334篇文献。1.2研究方法提取適当词频的关键词能准确描述文献的研究内容,能代表该领域的研究主题[3],将文献的主题词两两统计出它们在同一篇文献中出现的次数,对这些词进行聚类分析,统计研究相关主题,从而找出领域研究热点,并分析未来研究趋势。本文采用Excel、Python、SPSS作为研究工具,通过Excel对数据进行基础分析,统计文献分布情况;利用Python进行词频统计,并构造共词矩阵;SPSS对共词矩阵进行聚类分析,统计当今研究热点。2研究基本情况2.1时间分布按发表时间对文献数量进行统计,结果如图1所示,从图1可以看出,国内在文本情感分析的研究开始于2006年,最早的一篇文献是叶强等[4]在《信息系统学报》上发表的“面向互联网评论情感分析的中文主观性自动判别方法》”,他们在论文中提出了一种中文主观性自动判别方法。图1显示“文本情感分析领域”每年的发文量基本呈现为一个线性增长。2014年之后,每年的发文量基本保持在50篇左右。从论文累积发表的数量看,该领域的论文数量呈现为指数函数,其增长的速度较快。这反映出该领域的研...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?