一种网络论坛水军账号快速检测算法

一种网络论坛水军账号快速检测算法摘要:在分析网络水军灌水行为的基础上,提出一种网络论坛水军账号快速检测算法.该算法包含3步:首先通过统计分析网络论坛单日回帖情况,确定可疑区间;然后根据用户单日回复行为构建用户协作网络,并依据删减后的用户协作网络的聚类情况确定高可疑时段;最后通过高可疑用户的回帖时间特征分析判定其是否为网络水军.该算法采用“层层逼近”的策略,分3次排除正常用户和数据,不断缩小计算范围,具有计算量小、计算速度快的特点.利用该算法对“新浪网-娱乐论坛-影视世界版块-影行天下子版块”2010年全年的数据进行分析,实验结果表明,该算法不仅能有效发现网络论坛的单个水军账号,还能发现网络水军军团账号并确定炒作内容,准确率高.关键词:社交网络;用户行为分析;网络论坛;网络水军:TP393文献标识码:A截止2013年12月,我国网民规模已达6.18亿[1].尤其是随着Web2.0技术的成熟和普及,网络不仅成为人们获取信息、共享资源、交流观点的重要平台,也成为人们了解社情民意、揭露社会弊端、开展社会监督的窗口.然而网络固有的自由性、开放性、隐匿性等特点又为不法分子提供了可乘之机,出现了以网络炒作为营生的网络公关公司、网络推手和网络水军等不良互联网组织和个人.网络公关公司为了在网上炒作某个话题或人物来达到宣传、推销或者诋毁他人或产品的目的,雇佣大量网络水军,在网络推手的组织下以各种手法和名目,在互联网的各种平台大量发帖、回帖,炮制网络热点事件,捧红各色人物,形成虚假网络舆情,严重影响了网络舆论的发展方向.研究网络水军检测机制,对加强网络水军监管和治理,维护社会稳定与和谐、确保国家网络空间安全具有重大现实意义.1相关研究网络水军研究尚处于探索阶段.尚未发现国外公开发表的网络水军检测方面的文献,与之相关的研究主要集中在垃圾评论和垃圾评论发布者检测方面[2-17].激ndal等首次提出垃圾评论的概念并对其进行分类,在此基础上采用机器学习方法实现了电子商务网站中的垃圾评论检测[2-5].Benevenuto等采用分类技术通过分析用户发布的内容和用户行为特征实现了对垃圾评论发布者的检测[6-7].Mukherjee等认为和单个垃圾评论发布者相比,群体垃圾评论发布者具有更大危害,并提出了一种同时考虑用户行为频率和同谋行为特征的有监督学习模型,通过在人工标注的数据集上进行学习,实现了对垃圾评论发布者群组的识别[13].和国外相比,国内关于网络水军的研究更为活跃,但目前主要是一些传媒和管理专业的研究人员从传播学、管理学的角度,对网络水军的运行机制和治理对策进行了研究.近年来从技术层面对网络水军检测的研究也取得了一定进展.李纲等根据网络水军发布的信息具有很强的目的性和感情倾向性等特征,提出一种基于情感分类的网络推手识别方法,通过分析用户的情感倾向,统计正面感情信息和负面感情信息的比重来识别网络推手[18].范纯龙等采用人工方式分析了论坛中网络水军账号、水军帖的分布情况,发现在网络论坛中网络水军普遍存在,且具有较强的组织结构[19].Chen等对网络水军发帖回帖行为进行实证统计分析,发现网络水军具有和普通用户不同的行为模式,并提出一种语义分析和非语义分析相结合的网络水军检测机制\[20\].与之相关的研究还包括“网络马甲”检测,国内学者对该问题也进行了有益探索.Bu等利用复杂网络技术和语义分析技术,通过写作风格分析和链接分析实现了马甲账号的检测[21].Zheng等根据网络马甲通常成对出现、在发帖和回帖时互相呼应的特点,提出两种计算模型用以检测单个论坛内的网络马甲对账号和跨论坛的网络马甲对账号[22].垃圾评论和垃圾评论发布者检测方面的研究对网络水军检测有一定指导意义,但不能直接用于网络论坛水军账号检测,主要原因如下:1)垃圾评论和垃圾评论发布者检测算法主要针对的是以亚马逊为代表的商业网站,在这些商业网站中用户在对商品进行评论时除了提交文本信息外,还会对商品进行评分,当前的算法几乎都是通过分析用户的评分结果来识别垃圾评论和垃圾评论发布者的;而在网络论坛中,没有这种评分机制,无法利用现有算法检测网络论坛中的异常用户.2)现有的垃...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?