收稿日期:2012-10-19修回日期:2012-12-19作者简介:郭秋艳(1989-,女,硕士研究生,研究方向:数据挖掘㊁信息管理与信息系统;何㊀跃(1961-,男,博士,教授,研究方向:宏观经济㊁数据挖掘㊁信息管理与决策㊂新浪微博名人用户特征挖掘及效应研究郭秋艳何跃㊀㊀(四川大学商学院㊀成都㊀610064摘㊀要㊀以新浪微博中用户数据为基础,建立名气指数,并使用统计分析㊁相关分析㊁Apriori模型分析挖掘名人用户的总体特征关系特征和行为特征,以及创建转发影响力指数定量研究名人效应㊂研究表明:名人微博用户特征具有较强个性化,在微博活跃用户群体中具有极大的代表性;名人用户在微博中曝光度较高,通过公开自己的真实资料,提高自己的名气;企业可以根据自身需求,通过名气指数或转发影响力指数的结果进行微博营销决策关键词微博名人用户㊂㊀㊀㊀名气指数㊀Apriori㊀转发影响力指数㊀G350㊀㊀㊀㊀㊀㊀文献标识码㊀A㊀㊀㊀㊀㊀㊀㊀㊀㊀1002-1965(201302-0112-05StudyontheCelebrityUsers'CharacteristicsMiningandtheEffectsofSinaMicro-BlogGuoQiuyan㊀HeYue(BusinessSchoolofSichuanUniversity,Chengdu㊀610064Abstract㊀Thepaperestablishedthe'reputationindex'andusedstatisticalanalysis,correlationanalysisandtheApriorimodeltodigoutthecelebrityusers'overallcharacteristics,relationshipcharacteristicsandbehavioralcharacteristics,andbuiltforwardimpactindextostudythecelebrityeffectquantitativelybasedontheuserdataofSinamicroblogging.Thestudyshowsthatcharacteristicsofthecelebrityusersmicrobloggingarestronglypersonalizedandhavegreatrepresentationinthemicrobloggingactiveusergroups;thecelebritieshaveahighdegreeofexposureinthemicrobloggingandcanimprovetheirreputationbyopeningtheirownrealinformation;enterprisescanmakemi-crobloggingdecisionsthroughtheresultsofthereputationindexorforwardimpactindexaccordingtotheirneeds.Keywords㊀Micro-Blog㊀CelebrityUsers㊀ReputationIndex㊀Apriori㊀ForwardImpactIndex0㊀引㊀言微博是一个基于用户关系的信息分享㊁传播以及获取平台,用户可以通过WEB㊁WAP以及各种客户端组件,以140字左右的文字更新信息,并实现即时分享[1]㊂近两三年来,微博的发展得到了国内国外学术界的关注㊂国外对于名人用户专门性的研究相对较少,大部分文章都只是将其作为研究对象之一㊂如BorgsChristian,ChayesJennifer等介绍了简单的博弈论模型,得到了名人在社交网络中更新的竞争率[2]㊂ChaMeeyoung,BenevenutoFabrício等收集了大量来自Twitter的名人等用户数据以比较不同类型的用户在信息流动中所发挥的相对作用[3]㊂LautmanRóisín,CurranKevin等人在文献[4]中提及到英国的名人,以其在Twitter上公开展示的样品案件为例,讨论了在互联网上管辖权的相关问题对于名人效应的研究较少,而基于用户影响力的研究大多是建立了相关的模型㊂如Yung-MingLi等人提出了MIV(市场有影响力的值模型来评估影响力的强度[5]㊂国内研究微博客的相关文献中,对于用户特征的研究只有几篇㊂如:赵文兵㊁朱庆华等人以国内财经网站和讯微博为例,使用计量学方法,对用户特性进行统计分析[6]㊂王晓光以新浪微博为研究样本,考察了微博客用户基本行为特征和关系特征[7]㊂何黎等人通过对微博用户的信息和关系数据进行决策树分析㊁相关性分析和关联规则挖掘来发掘用户特征[8]㊂对名人用户特征研究的也只有一篇而且偏定性,如罗艺漫对世界杯期间体育名人微博的特征进行了分析[9]㊂国内对微博中名人用户的研究主要集中于名人微第32卷第2期2013年2月㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀情㊀报㊀杂㊀志JOURNALOFINTELLIGENCE㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀Vol.32㊀No.2Feb.㊀2013博影响[10]㊁名人微博战略[11]的研究这些研究大多是定性的因此㊂㊂,论文应用统计分析㊁相关分析㊁Apriori模型,以新浪微博中名人用户数据为基础,建立名气指数,分析名人用户的一般特征,以及创建转发影响力指数,定量分析名人效应㊂1㊀研究设计㊀1.1㊀样本数据㊀论文基于C#语言自行编写的爬虫程序抓取和收集新浪微博上的...