基于主题流与深学习的情感分析算法

基于主题流与深度学习的情感分析算法摘要:基于机器学习的情感分类方法已经取得了较大进展,但在大量情感分类方法中,往往都是结合词嵌入和传统的机器学习方法,缺乏对文本主题以及时序关系等因素的有效利用。针对上述问题,提出了一种基于主题流与深度学习的情感分类算法,通过分析文本的主题分布,并引入时序关系,在此基础上利用适合的长短记忆神经网络的深度学习方法进行情感分类。实验证明,基于主题流与深度学习的情感分类算法性能较好。关键词:NLP;情感分析;深度学习;主题流DOIDOI:10.11907/rjdk.181487中图分类号:TP312文献标识码:A文章编号:1672-7800(2018)008-0028-03英文摘要Abstract:Atpresent,sentimentclassification-methodbasedonmachinelearninghasmadegreatprogress,buta-mongthealargenumberofsentimentclassificationmethods,wordcombinationandtraditionalmachinelearningmethodsare-oftenused,andthereisalackofeffectiveuseofsuchfactors---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---astexttopicsandsequencerelationshipsinalargenumberofsen-timentclassificationmethods・Inordertosolvetheproblems,thispaperpresentsasentiment-classificationalgorithmbasedontopicflowanddeeplearning,itanalyzesthetopicdistributionofthetextandintroducesthe-sequencerelationshipandusesdeeplearningmethodssuchas-longshort-termmemoryneuralnetworkstoclassifythesentimen-t.Experimentsshowthatthesentimentclassificationalgo-rithmbasedontopicstreamanddeeplearningproposedinthispa-perhasbetterperformance・英文关键词KeyWords:NLP;sentimentanalysis;deeplearning;topicflow0引言随着互联网及电子商务的快速发展,人们在线上的活动越来越多,产生了大量带有主观色彩的信息。这些带有主观性的信息可以是用户对某次活动或服务的评价,或者是某新闻事件或文章的观点等,对这些信息进行挖掘,可使政府部门了解相关舆情,辅助决策,对用户进行个性化推荐以及对虚假评论进行检测。仅靠人工对这些信息进行分析将耗费大量的人力物力和时间,通过计算机进行数据挖掘和分析是一个热点,而情感分析是其中重要---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---的分支[1-4]o目前,情感分析的主要研究方法是传统的机器学习分类算法,如贝叶斯分类、SVM以及聚类等[5-6],这些算法主要分监督学习、无监督学习[7-8]o监督学习需要靠大量的人工标注,代价较高。相反,无监督学习不需要人工标注数据,可降低标注代价,但效果完全依赖于训练结果,无法有效提高性能。本文对文本信息进行了深入研究,通过挖掘文本的主题分布和时序关系,采用深度学习方法进行情感分类。1相关工作情感分析从2002年提出就受到广泛关注,在中英文情感文本中得到广泛应用,特别在线上评论和新闻评论的情感分析有了很大的发展。机器学习在情感分析中的应用受到研究者青睐[9-10]oSida等[11]提出了采用朴素贝叶斯和SVM相结合的方法,实验证明该方法取得了不错的结果。Deriu等[12]提出利用神经网络模型进行情感分析,其它传统方法相比效果较好。Catal等[13]提出了一种基于模糊聚类的方法,它是一种无监督学习方法,在减少人工标注的情况下取得了满意的准确率。Xia等[14]提出了一种集成技术,集合词性和词关系等多---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---种特征,并结合贝叶斯、信息炳以及SVM等方法进行广泛的对比试验,取得了一定进展和较好的实验结果。本文研究了基于机器学习的情感分析方法,如朴素贝叶斯、支持向量机(SVM,Support-VectorMachines)、神经网络模型[15]以及聚类等。通过分析文本特征,将文本映射为特征向量的表示形式,然后通过机器学习模型进行分类和预测。文本分析的一个重要研究方向就是自然语言处理。词是文本的基本组成单元,主题分析(LDA,LatentDirichletAllocation)是其中一个重要分支[16],不少研究者在该领域进行了大量的研究工作。王伟等[...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?