基于深度学习的COVID-19疫情期间网民情绪分析

基于深度学习的COVID-19疫情期间网民情绪分析刘洪浩---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除------本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---摘要:微博文本情绪分析技术在舆情监控等领域具有广泛应用。基于传统机器学习模型和情感词典进行情感分析的结果往往不够理想,如何提升性能成为该领域的一个主要挑战。本文中我们使用了基于深度学习的BERT以完成语言理解任务并与传统做法性能相比较,结果中BERT模型取得了更好的性能。之后我们---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---利用该模型进行三分类以分析COVID-19疫情期间的微博评论,总体上正面与中立情绪占主导。此外,我们也针对词频和词云进行相关分析,以期实现全方面了解此次疫情期间社会情感状态的目的。关键词:深度学习,词嵌入,BERT模型,情感分析,微博爬虫,文本处理:TP183:ADOI:10.3969/j.issn.1003-6970.2020.09.048【Abstract】:Sentimentanalysisofmicroblogtextiswidelyusedinpublicopinionmonitoringandotherfields.Theresultsofsentimentanalysisbasedontraditionalmachinelearningmodelsandsentimentdictionariesareoftennotideal.Howtoimproveperformancehasbecomeamajorchallengeinthisfield.Inthisthesis,weuseBERTbasedondeeplearningtocompletethelanguageunderstandingtask.Comparedwithtraditionalmethods,BERTmodelhasachievedbetterperformance.WeusethemodeltoanalyzemicroblogcommentsduringtheCOVID-19epidemicbyconductingathree-categoryclassificationandfindthatpositiveandneutralemotionsaredominant.Wealsoconductfurtheranalysisonwordfrequencyandwordcloudtogainmoreinsightsintotheemotionalstatesduringtheepidemic.【Keywords】:Deeplearning;Wordembedding;BERT;Sentimentanalysis;Microblogcrawler;Textprocessing0引言文本是用于情感分析的典型數据集。由于情感文本数据的迅速增长和极高应用价值,使得自动识别和分析人们在文本中表达的情感成为一种必要。社交网络文本情感分析被广泛应用于在金融[1]、市场[2]、社会[3]、娱乐[4]等诸多领域之中,关于文本情感识别算法相关的理论研究[5-7]也越发丰富。越来越多基---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---于社交网络的情感分析实践和研究的出现表明其实用性与科学性。微博短文本已成为国内数据的情感表达和舆论走向的代表,它为研究社会发展和人类行为特征提供更多可能性。新冠肺炎疫情备受社会各界关注。2020年1月1日至2月20日,疫情相关微博话题数超过200个。此次疫情为高热度的重大社会热点事件,对疫情期间的情感识别和可视化分析能客观反映出疫情舆情的发展动向,有助于有关机构制定合理科学的决策,具有较高研究价值。文本分类的精度取决于提取语义特征的方法和分类器的种类。本文关注基于深度学习的中文文本词嵌入方法与传统做法的比较和疫情期间情感分析。我们研究了基于深度学习中词向量技术的情感识别方法,利用BERT模型和Embedding层预训练方法,分别进行研究,实验对比中BERT预训练模型取得更加准确的结果。我们将利用BERT模型的分类结果对此次疫情全面分析,并给出疫情期间微博文本的词云表示,以提高情感分析的准确度,达到全面了解此次疫情期间社会舆情的目标。1相关工作本节简要介绍微博数据情感分析的相关研究,以及获得词嵌入的方法。1.1微博数据情感分析现有文献中已有较为丰富的针对微博文本的情感分析策略。王培名等人[8]设计了自适应的并发采集算法优化模拟登录和代理池的构造访客Cookie功能,高效获取微博数据,为微博数据采集策略提供了多样性。刘楠[9]针对微博短文本形式的情感分析,归纳新的细粒度情感分析流程,提出TF和TF-IDF归一化权重计算方法,与传统提取特征的方法相比,能够更准确判断出多种类情感的权重,实现了该方法有效性的评估。1.2词嵌入---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---词嵌入是一种词的数字向量化...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?