基于模块化聚类的标签弹性推荐

基于模块化聚类的标签弹性推荐〔摘要〕[目的/意义]社会化标注系统为用户检索提供便利的同时也面临一些困扰,标签推荐研究有助于解决资源检索中精确度与召回率之间的两难抉择。[过程/方法]借助网络科学的理论与方法,通过对标签网络的模块化聚类处理获得主题聚类,采用度数中心度对主题聚类内部标签进行排名,根据特定规则选取Top-N标签数量。[结果/结论]实验结果显示,研究中提出的模块化Top-N标签推荐方法,具有可逐层细化的精确度和良好的召回率。该方法的弹性机制可为不同的检索要求提供差异化服务。〔关键词〕社会化标注;标签推荐;模块化聚类;标签排序DOI:10.3969/j.issn.1008-0821.2018.04.008〔〕G254.97〔文献标识码〕A〔〕1008-0821(2018)04-0058-07〔Abstract〕[Purpose/Significance]Socialtaggingsystemisalsofacingsomeinconveniencewhilefacilitatingtheretrievalofusers.Tagrecommendationresearchcanhelpsolvethedilemmabetweentheaccuracyandtherecallrateinresourceretrieval.[Process/Method]Withthetheoryandmethodofnetworkscience,thetopicclusterswereobtainedthroughthemodularityclusteringontagnetwork,thedegreecentralitywasusedtorankthetagsinthetopicclusters,thenumbersoftheTop-Ntagswereselectedaccordingtoaspecificrule.[Results/Conclusions]TheexperimentalresultsshowedthatthemodularityTop-Ntagrecommendationmethodhadtheaccuracyoflevel-by-levelrefinementandthegoodrecallrate.Theflexiblemechanismofthismethodcouldprovidedifferentiatedservicesfordifferentretrievalrequirements.〔Keywords〕socialtagging;tagrecommendation;modularityclustering;tagrankWeb2.0环境下,网络用户不仅是信息的接受者,同时也成为信息的组织者与架构者。文献网站、社交网站、图片网站、音乐网站等各种类型的网站纷纷采用社会化标注资源组织模式,允许并鼓励用户对网络资源进行标注,并根据标签向用户提供检索服务,从而使得社会化标注系统在互联网上迅速蔓延。与此同时,广大用户在享受社会化标注系统所带来的福利的同时,不得不面对其平层结构在资源检索中所造成的困扰。因此,以资源精确定位和有效覆盖为目的的社会化标注系统中的标签推荐研究引起了学术界的关注,并尝试建立多种推荐方法以满足上述目标及要求。本研究采用网络科学的理论和方法,基于标签之间的关联关系构建标签网络。结合网络模块化聚类和中心度排序,生成主题聚类并提取不同主题聚类中的推荐标签。同时对该方法的弹性机制与资源覆盖率进行了解析与测度,以期建立一种能够适应不同检索需求的具有可调整性的弹性标签推荐方法。1研究工作综述社会化标注系统中的相关资源都被赋予了不同的用户标签,通过标签能够直接引导用户直接到达资源层。尽管检索行为的最终标的物是目标资源,但是真正起到推荐作用的则是各类标签,而且其中的标签于用户的标注行为,又直接面对用户的检索行为。因此,学术界对于借助标签实现和辅助资源检索的标签推荐问题展开了相关研究,并在近年来取得了较为丰富的成果。德国学者I.Peters和G.Stock[1]在对标签网络的测量中发现了标签节点度值的幂律分布规则,在此基础上利用切断文档精确标签长尾部分中的标签形成搜索标签。研究表明,搜索标签与一般的大众分类和传统知识组织系统兼容,并且可以通过长尾标签限制点击量,提高了信息检索结果的精确度。K.Yi[2]等人通过研究发现资源的URL与标签之间在排名和频率方面存在幂律关系。通过对网页资源主题标签的调查显示,主题标签可以被用作相同资源的同现网址的索引词,从而能够基于幂律分布的主题标签对资源推荐产生影响。J.J.Jung[3]采用朴素贝叶斯和支持向量机的数据挖掘方法,通过每个类目中标签术语的使用频率对所收集的资源进行分类。该方法应用于标记社交网络服务上的未标记资源,能够提升资源获取的广度。J.Mao[4]及其合基于标签同现关系构建标签网络,采用PageRank和HITS方法利用链路对节点加权,通过将权重转换为资源的推荐分数的方式,将标签网络向“标签――资源”网络扩展。测试结果显...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?