基于豆瓣短评数据的情感认同状况分析

基于豆瓣短评数据的情感认同状况分析张乃芳张钰彬摘要随着中国电影行业和社交网络的高速发展,公众平台汇聚了大量用户对于电影的评论。2021年春节档获得高票房的电影《你好,李焕英》引起了网友的高度关注。文章主要运用LDA主题模型对豆瓣网站上网友对《你好,李焕英》的短评文本进行数据分析,定量分析与定性分析相结合,挖掘观众对这部电影的态度和评论的焦点与特点。分析发现,观众对该电影有高度的情感认同,讨论主要聚焦在典型情节和主演的演技;关于喜剧电影是否应该笑中带泪的问题,成为对该电影评价的主要分歧点。《你好,李焕英》产生了良好的娱乐效果和社会教育效果。关键词LDA主题模型;数据分析;电影评论;可视化呈现G2A2096-0360(2021)09-0113-052021年2月12日电影《你好,李焕英》上映,截至2021年3月26日豆瓣评分为8.1分,是2021年春节档上映电影中唯一超过8分的电影,这一成绩好于89%的喜剧片,好于77%的剧情片。这部讲述母女亲情的喜剧电影,热度持续上涨,主演张小斐的演技备受好评,导演贾玲备受关注。作为一部现象级电影,《你好,李焕英》的成功必然是多方面因素共同作用的结果,电影获得超高票房的背后,契合观众需求是最重要的一点。从消费者角度评价电影,贴近大众生活,才能创作出人民群众喜闻乐见的电影。1研究数据与研究方法介绍1.1研究思路本研究先从豆瓣网友评价的整体态度入手,然后分析网友短评中的高频词,之后分析最受关注的热评,最后对采集到的所有短评进行主题聚类。分析对象由态度,到词语,再到段落,最后是对所有短评的数据分析,整个过程是对网友观后感的逐渐深入的分析过程。具体来说:第一步,根据豆瓣网友的评价星级分布,从整体上把握观众对这部电影的推荐指数;第二步,分析观众的短评高频词有哪些,从总体把握观众对于这部电影关注的侧重角度;第三步,提取观众短评里最受关注的热评,分析这些认同度最高的短评都是从哪些角度评价电影,以及其中包含的情感态度如何;最后,运用LDA主题模型,将观众的短评进行数据分析,根据数据结果划分内容主题,细致把握观众的关注点。1.2研究方法一直以来,广大导演、演员、自媒体都将豆瓣网评分、评论内容作为评论电影的重要依据并采用各种方式对豆瓣评论的内容进行分析。但是,时代发展使得越来越多的观众在网站发表自己对电影的看法,有一定知名度的电影在豆瓣上都有数量庞大的網友评论。传统影评分析方法无法应对海量的大众媒体新闻报道和公共舆论,如何利用自动化的方式对网友影评进行分析在此情况下显得尤为重要。本研究主要采用LDA主题模型对电影短评内容进行分析,并利用词云图对电影短评内容中词频较高的词进行可视化呈现。作为一种基于机器学习的文本内容分析技术,主题模型是一种使用概率的产生式模型来挖掘文本主题的新方法[1]。LDA是Blei等在2003年提出的一种统计主题模型[2],是近年发展起来的一种重要提取潜在主题的建模方法[3],该模型已经得到研究人员广泛认可,并被运用至各个研究领域。“LDA主题模型的主要作用是将语料库中大量非结构化的文本数据转换为可供研究人员进行分析的数据,并依据选定的参数进行文档-主题、主题-词的聚类工作,从而使研究者能够在较短时间内从语料库中得到一组可供解读的主题。”[4]相较于单纯的统计数据而言,LDA主题模型输出结果为一段包含各类意义的词群,人文研究者能够利用这些词群进行证伪、定性与定量相结合等方面的研究。这种技术方法在人文社科领域具有传统研究方法难以企及的优势。《你好,李焕英》影评属于带有主题性质的大规模文本,适合用此方法。2研究结果首先,根据豆瓣937198名网友对《你好,李焕英》打出的星级分数,统计出各星级所占比例,从总体上初步了解观众对这部电影的推荐态度。其比例分布如图1所示,其中1星和2星的评价只占2.8%,4星和五星占比高达77.6%,可见大多数观众对此电影持推荐态度,认为该电影值得一看。其次,以豆瓣网友的观后短评为分析对象,删除重复评价、无意义的短评以及星级评分为空值的短评后,共获得492条热度最高的有效短评。计算其词频,取词频最高的前50个词进行高频词分析。在这一部分的分析中...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?