基于P2P兴趣簇的个人数字图书馆复本策略研究

基于P2P兴趣簇的个人数字图书馆复本策略研究张红伟陈玲许萍摘要针对个人数字图书馆可用性和可靠性低的问题,提出一种基于P2P兴趣簇的个人数字图书馆复本策略,为构建个人数字图书馆共享系统提供参考。论文引入P2P兴趣社区思想搭建个人数字图书馆共享模型,在该模型中,系统从文件访问次数和个人数字图书馆负载两个层面检测是否需要创建复本,一旦启动复本创建程序,系统将热点文件复本创建在与该文件兴趣相似度较大、综合能力较强的个人数字图书馆中。仿真结果显示,该策略能有效提高系统的搜索成功率,平衡系统负载,提高系统的可用性和可靠性。关键词个人数字图书馆P2P复本兴趣簇共享分类号G250.72DOI10.16810/j.cnki.1672-514X.2018.05.013AbstractInviewofthelowavailabilityandreliabilityofpersonaldigitallibraries,aduplicatestrategyofpersonaldigitallibrariesbasedonP2Pinterestclustersisproposed,whichprovidesreferenceforconstructingpersonaldigitallibrarysharingsystem.ThispaperintroducestheideaofP2Pinterestcommunitytobuildapersonaldigitallibrarysharingmodel.Inthismodel,thesystemcheckswhetherthereisaneedtocreateduplicatesfromtwoaspectsofthenumberoffileaccessesandthepersonaldigitallibraryload.Oncetheduplicatecreationprogramisstarted,thesystemcreatesaduplicateofthehotspotfileinapersonaldigitallibrarywithasimilaraffinitytothefileandacomprehensiveability.Simulationresultsshowthatthestrategycaneffectivelyimprovethesearchsuccessrate,balancethesystemloadandimprovetheavailabilityandreliabilityofthesystem.KeywordsPersonaldigitallibraries.P2P.Duplicates.Interestcluster.Sharing.个人数字图书馆是公共数字图书馆服务的发展和延伸,个人数字图书馆不仅可以管理和使用个人信息资源,而且可以共享个人信息资源[1],促进资源的有效利用和知识再生。针对个人数字图书馆共享问题,很多学者做了大量研究[2-7],他们通过研究认为传统的C/S模式已经不适用于個人数字图书馆,分布式的P2P技术即将成为个人数字图书馆新的技术支撑。但是P2P技术也给个人数字图书馆共享体系带来了新的问题,复本问题就是其中之一。笔者就此问题曾在《基于P2P技术的个人数字图书馆复本策略》一文中提出一种基于P2P技术的复本策略[8],但是该策略没有考虑到个人数字图书馆的负载,容易造成网络拥塞。由此本文在前文的基础上进一步提出一种基于P2P兴趣簇的个人数字图书馆复本策略,该策略将有助于提高系统的可靠性和可用性,有利于负载均衡和提高资源搜索成功率。1基于P2P兴趣簇的个人数字图书馆模型1.1个人数字图书馆兴趣模型P2P网络有4种典型的体系结构:集中式P2P网络、全分布式非结构化P2P网络、全分布式结构化P2P网络和混合式P2P网络。全分布式非结构化P2P网络是一种纯粹的分布式网络,具有良好的容错性、可扩展性和负载均衡,是四种体系结构中最受欢迎的一种,应用范围最广[9]。本文采用全分布式非结构化P2P网络构建个人数字图书馆模型。目前,常用的兴趣模型表示方法主要有基于向量空间模型(VectorSpaceModel,VSM)表示法[10]、主题表示法、关键词表示法等,VSM模型使用简单、方便,是最常用的兴趣模型[11]。本文采用经典的向量空间模型作为个人数字图书馆(以下简称PDL)的兴趣表示模型。PDL的兴趣往往不止一个,并且随着时间的推进而不断发生变化,VSM模型将这些抽象的、动态的兴趣转化为可以计算彼此相似度的向量,比如PDLi的兴趣向量{PDLi1,PDLi2,…,PDLik,…,PDLin}表示PDLi共有n个兴趣,其中PDLik是PDLi中第k(1≤k≤n)个兴趣向量。VSM模型中,兴趣相似度采用夹角余弦表示,兴趣和兴趣、兴趣和PDL、PDL和PDL之间都可以计算兴趣相似度,比如,兴趣PDLik和兴趣PDLjr之间的相似度如公式(1)所示:Sim(PDLik,PDLjr)越大,PDLik和PDLjr之间的兴趣相似度越大,反之,PDLik和PDLjr之间的兴趣相似度越小。PDLi的第k个兴趣PDLik和PDLj之间的兴趣相似度如公式(2)所示:其中,Lj是PDLj的兴趣数量,PDLik和PDLj的兴趣逐一进行相...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?