基于新浪微博开放平台的用户数据挖掘

基于新浪微博开放平台的用户数据挖掘周鑫,彭斯俊,罗熹(武汉理工大学理学院数学系,武汉430060)5摘要:新浪微博是中国国内最大的移动社交网络积累用户超过3.5亿,其中60为移动设备用户。随着新浪微博对用户隐私的重视,爬虫程序越来越难从网页上爬取新浪微博的用户数据。本文针对新浪微博开放平台所给出的API接口及其使用限制,给出了用户数据挖掘的需求和算法设计,并在随后的实证分析中挖掘了一个样本数据。通过对样本数据进行分析得到了新浪微博复杂网络相应的结构特征并绘制出了样本数据的网络结构图,验证了算法的可10靠性和有效性。关键词:新浪微博;开放平台;数据挖掘;复杂网络:TP391UserDataMiningBasedontheMethodofSinaWeiboOpen15APIZHOUXinPENGSijunLUOXiMathematicDepartmentSchoolofScienceWuhanUniversityofTechnologyWuHan430060Abstract:SinaWeiboisthelargestmobilesocialnetworkwithover350millionsubscribersofwhich60aremobiledeviceholders.NowadaysSinaWeiboisbecomingmoreandmore20focusedontheprivacyofusersthatmakesthetranditionalcrawlersunabletogetheruserinformationeasily.InthispaperneedsandanalgorithmisgivenaccordingtothelimitationsofSinaWeiboOpenAPIwhichcanbeeasilydeployedintotheapplication.Inthefollowingapproachesasampledataiscollecte---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---dwiththealgorithmwithwhichsomestructurefeaturesareobtainedwithpicturesofthenetworkthatverifiedthereliabilityandtheefficiencyofthe25algorithm.Keywords:sinaweiboopenAPIdataminingcomplexnetwork0引言近年来,随着移动技术的突飞猛进,移动社交网络获得了飞跃式发展。以Path应用为30例,Path是一个专注于照片分享的移动在线社交服务,在其iPhone应用2.0版本发布后由于其堪称完美的操作体验,在短短的两个月内的时间里积累了超过200万世界范围内的用户1。在线社交网络络服务也越来越注重移动用户的发展和积累。Facebook在2012年8月24日上线的新iOS应用在AppStore的平均应用评分已经从1.5星飞涨至4星2。截止2012年上半年,新浪微博已经积累了超过3.5亿用户,其中60的用户长期使用35移动设备登陆3,新浪微博已经成为中国大陆最大的移动社交网络。新浪微博最早始于2009年,在一年之后就开放了开发者开放平台,由于iPhone4在大陆的畅销越来越多的用户开始使用新浪微博,同时越来越多的移动应用开始提供新浪微博的接入以方便内容分享。目前为止,新浪微博在世界范围内已经被公认为与Twitter齐名的第二大移动社交应用,也是唯一被苹果官方集成到iOS系统内的中国大陆移动社交服务。40新浪微博从建立之初就非常注重服务的安全性,从提供接口服务之日起每隔一段时间就会更改接口的相关属---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---性和验证方式。最近一次的大型变更则是自2012.10.15起,新浪开放平台将禁止“累计使用人数小于10000”的应用使用V1接口,转而使用更安全更方便的V2作者简介:周鑫,(1987-),女,主要研究方向:系统控制与优化。通信联系人:彭斯俊,1960-),男,教授,主要研究方向:系统控制与优化。E-mail:whutpengsijun163(-1-接口,为移动用户提供更方便和更安全的接入4。在经过历次安全性提升之后,现在如果要对新浪微博的用户数据进行爬虫式挖掘已经非常困难,如果需要对用户数据进行挖掘就必须45要使用新浪开放平台的V2接口。随着移动社交网络的兴起和复杂网络技术的进步,人们开始越来越多的开始使用复杂网络方法研究移动社交网络的各种性质,如社团结构,网络传播等56,其中被研究最多的网络这是最早开放API的Facebook和Twitter7。现如今只要某知名公司涉足社交网络就会有不少学者对其社交网络服进行调查研究8,还有不少学者通过一些技术手段对中国的人人网50进行了分析9。在这些研究中大部分采取的技术手段依然是原始的爬虫技术——即一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。事实上,Matthew在其书10中曾指出,现在随着...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?