基于云填充和蚁群聚类的协同过滤图书推荐算法

基于云填充和蚁群聚类的协同过滤图书推荐算法[摘要]针对传统协同过滤技术在图书推荐中效率不高、数据极端稀疏性及主观性强等问题,提出一种基于云填充和蚁群聚类的协同过滤图书推荐方法,首先根据蚁群聚类算法得到用户群分类,然后在进行协同过滤前预先通过云模型填充用户――项目矩阵,以降低数据的稀疏性。实验结果表明,该算法在推荐精度上有明显的提高。(关键词]协同过滤;蚁群聚类;云填充;图书推荐[]TP18;TP301.6[文献标识码JA(]1008-0821(2015)05-0078-05随着网络技术的不断发展,图书馆服务向个性化、智能化方向发展成为必然趋势。虽然现在各级图书馆都建立了信息服务平台,但大部分信息服务平台只是提供简单的查询功能,需要用户主动提交查询的内容,然而随着图书流通数据的不断积累,读者在这种平台中很难快速的获得所需要的信息,智能图书推荐系统则是通过分析不同用户的兴趣所在,主动帮助用户从海量的信息中找出感兴趣的信息,为用户提供个性化的信息服务。因此构建有效的智能图书推荐系统是提高图书馆信息服务水平的重要途径,为此研究者提出了很多推荐方法:基于内容的推荐,混合推荐和协同过滤等,同时结合先进的技术,如聚类,关联规则,贝叶斯网,神经网络和图论模型等来实现这些方法。目前协同过滤是应用最成功的推荐技术,在许多领域也得到了广泛的应用。但是它也仍然存在很多的问题。由于用户和资源种类的爆发式增长,用户――项目矩阵成了高维矩阵,与此同时,用户评分的资源却很少,一般情况下在1%以下。而图书馆中也会遇到同样的问题,图书数目会不断增加,并且随着时间的推移,借阅记录也会成阶梯式增长,数据的极端稀疏性大大降低了传统的协同过滤的推荐效率。目前文献提出了用k-means对用户进行聚类,以实现对用户――项目矩阵的降维,但由于k-means算法需要事先指定初始聚类中心,而初始聚类中心对聚类结果有较大的影响,所以具有一定的主观性,导致协同过滤图书推荐质量的降低。针对上述问题,本文提出了一种基于云填充和蚁群聚类的协同过滤图书推荐方法,尝试利用改进的蚁群聚类算法对用户进行聚类,然后在得到的小的聚类中,利用云模型对用户――项目矩阵进行填充,最后采用基于用户的协同过滤算法来计算用户间的相似性并找到最近邻居集,得到目标用户对未评分项目的预测评分,形成Top-N推荐。目的在于缩小目标用户最近邻的搜索范围,有效减少搜索开销,从而达到推荐效率的提高,同时,通过云模型填充用户――项目矩阵,有效地缓解数据极端稀疏性和主观性强的问题。1基于云模型的数据填充算法1.1云模型简介云模型是李德毅院士提出的一种定量定性转换模型,能够实现定性概念与其数值表示之间的不确定性转换。正态云模型是最重要的一种云模型,它利用云模型的3个数字特征期望,熵和超熵形成特定的发生器,生成与定性概念相对应的定量转换值。云发生器分为正向云发生器和逆向云发生器。正向云算法是由云的3个数字特征C(Ex,En,He)通过正向云发生器生成相应的云滴(x,y),而大量云滴聚集在一起形成云,实现定性概念向定量的转换。逆向云计算是由Ⅳ个云滴(x,y)通过逆向云发生器生成云的3个数字特征C(Ex,En,He),实现定量值到定性概念的转换。两朵云之间的相似度可以用两朵云的数字特征向量的夹角余弦来表示,计算如下:1.2基于云模型的云填充算法对于任何一个图书馆,读者对图书的评分记录是很少的,从而评估矩阵相当稀疏,导致推荐效果大大降低。为解决该问题,本文采用云填充的方法解决稀疏问题。其基本思想是:首先根据云相似性定义来计算项目之间的相似性,利用用户对相似项目的评分来预测未评分项目的评分,填充用户项目矩阵。具体的过程是,先找出未评分的项目,采用云模型计算项目之间的相似性,找出该项目的最近邻,最后得出未评分项目的评分。算法1:基于云模型的云填充算法输入:用户――项目矩阵输出:填充较完整的用户――项目矩阵Stepl:根据用户――项目矩阵,统计出项目的评分频度向量厶,然后通过逆向云计算,得出每一个项目的评分特征向量v(Exi,Eni,He,)(1≤i≤n);Step2:根据云的相似性度量公式(1)来计算...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?