基于标签相似度的协作者推荐研究

基于标签相似度的协作者推荐研究陈翔,邱秀珍(北京理工大学管理与经济学院,北京,100081)摘要:针对目前虚拟协作社区中重视交互行为研究,缺乏协作行为研究的问题,从项目和协作者的角度出发研究社区的标签关系,提出根据协作者与项目的发生关系和项目标签集合获取基于协作者的标签共生信息,并用该共生信息来计算标签之间相似度,然后提出一种新的协作者工作偏好模型。结合协作者工作偏好和标签相似度研究协作者之间的关系,以及协作者与项目之间的关系,预测可能参与项目的协作者,提出协作者推荐算法。通过使用开源社区www.Codeplex.com的数据进行实验,并与其他推荐算法进行比较,证明本文提出的推荐算法能较好地应用于协作者推荐。关键词:标签相似度;虚拟协作;协作者推荐;开源社区中图分类号:TP393.08文献标志码:ATagsimilarity-basedcooperatorrecommendationChenXiang,QiuXiuzhen(SchoolofManagementandEconomics,BeijingInstituteofTechnology,Beijing100081,China)Abstract:Atpresent,researchesonvirtualcollaborativecommunityemphasizemoreoninteractivebehaviorbutignorecollaborativebehavior.Toaddressthisissue,westudythetagrelationshipfromtheviewoftheprojectandcooperator,andobtainthecooperator-basedco-occurrenceinformationbythecooperator-projectrelationshipandprojecttagcollection.Thenweusethisco-occurrenceinformationtocalculatethesimilaritybetweentags.Basedonthese,thispaperalsointroducesthemethodofmeasuringthesimilarityofworkpreferencesbetweencooperatorsandcalculatingthematchingdegreebetweencooperatorsandprojects.Theacquiredinformationcanthenbeusedincooperatorrecommendationalgorithm.Finally,byusingtheopensourcecommunitydatafromwww.codeplex.comandcomparingwithotheralgorithms,thispapertestsandverifiesthattheproposedrecommendationalgorithmcanwellforecastcollaborativebehavior.Keywords:tagsimilarity;virtualcollaborative;cooperatorrecommendation;opensourcecommunity0引言社会计算激发了用户交互、共享、协作和进行推荐的意愿[1],随着社会网络和协作计算的各类应用的迅速发展,出现了越来越多的协作共享社区站点。例如,在全球最大的开源服务社区网站Sourceforge上,目前约有340万开发人员在32.4万个项目上创建了各种功能的软件服务,约有4600多万的软件消费者通过目录服务与这些软件开发项目相连,每天有超过400万的下载量。其他的类似网站还有codeplex、Googlecode、RubyForge和Gitorious等等。而且,在这些协作共享社区网站上的服务和注册人员的数目每天还在递增,社会网络规模日趋庞大。社会网络已经渗透到商务协作开发、集成和推荐的全过程,基于社会网络研究协作流程和协作专家推荐等问题,是必然的技术发展趋势。基金项目:国家自然科学基金(71102111)作者简介:陈翔(1976-),男,副教授,主要研究方向:计算机软件及计算机应用,chenxiang@bit.edu.cn-1-用户模型是协同过滤算法的基础,而用户兴趣模型大都基于原始评分矩阵。近几年,评分矩阵的构造越来越重视社会网络信息的提取利用。文献[2]提出协同过滤算法,将社会网络信息用于协同过滤推荐。该算法的主要思路是向最近邻集合中加入社会网络成员,对于重叠的成员认为是相对“重要”的邻居,并赋予较高的权值,实现对最近邻成员进行修正的目的。实验证明,在协同过滤算法中,集成社会网络信息能够较好地改善推荐性能。文献[3]提出社会网络用户的概貌模型来自于用户之间的显性可达结构和兴趣,要分析和提炼用户的网络行为,使模型被优化得更加丰富和可靠。但是,目前大部分用户模型被建立在用户之间信息交互关系或朋友关系基础之上,未能反映与社会网络协作相关的协作信息。虚拟协作社区是开放的社会化网络,其标签能够有效地帮助用户理解和组织个人资源空间,使大量过载信息由发散到收敛,有助于用户借助其他人的标签来理解和发现感兴趣的信息资源[4]。文献[5]研究如何从用户给定的标签中推断用户偏好,并将基于标签的偏好描述...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?