推荐算法中用户兴趣偏好的研究

推荐算法中用户兴趣偏好的研究摘要:进入大数据时代以来,个性化推荐算法一直备受关注,不仅解决了信息过载的问题,而且从海量数据中挖掘很多有用的信息。当下,用不同的方法对用户的兴趣进行挖掘,通过对当前个性化推荐算法中用户兴趣偏好的文献进行归类分析,并提出其不足之处与改进的方向,为后续个性化推荐算法的研究提供理论参考。关键词:个性化推荐;兴趣偏好;研究综述个性化推荐,就是要根据用户的兴趣偏好向其推荐感兴趣的产品,因此挖掘用户的兴趣偏好是推荐算法的关键。传统协同过滤推荐算法的核心思想通过计算用户评分数据间的相似性作为评判用户兴趣相似的标准,主要采用Pearson相关系数、余弦相似度或改进的余弦相似度等度量标准,但仅仅依靠评分间的相似性不足以充分发现用户的兴趣所在。例如贾冬艳等人[1]在传统协同过滤推荐的基础上将用户间评分相似度的均值设定为阈值,将大于阈值的评分用户作为目标用户的兴趣相似用户。该方法解决了传统KNN算法的不足,虽然较传统方法提高了兴趣相似用户推荐的精度,但同样未真正挖掘用户的兴趣。分析现有的研究,主要通过以下两方面来表现用户兴趣偏好:一是基于项目属性聚类确定用户的兴趣类别;二是通过LDA主题模型,随着LDA模型在文本挖掘研究的兴起,该模型也被延伸到个性化推荐领域,挖掘用户的兴趣偏好,改善推荐算法的精度。1聚类之兴趣挖掘聚类分析是机器学习和多元统计分析中一种典型的分析方法,较为常用的实现算法有K-means算法、模糊C均值聚类算法(fuzzyC-means)等。在推荐系统中用聚类算法来获得用户的兴趣,主要是通过对项目属性聚类来实现。张莉等人[2]在基于用户聚类的协同过滤推荐的基础上,根据项目属性进行聚类确定用户的兴趣类别,并以此计算用户的活跃度,但因为算法涉及到对用户兴趣的评分项目的统计,因此增加了算法的时间复杂性,虽然不影响推荐的实时更新,但更新复杂。段元波等人[3]的研究中根据项目所属项目类别中的0-1矩阵,得到所有类别下用户评分项目的比例及各评分级别的比例,由占比高的评分级别作为用户对该项目类别的偏好,从用户评分偏置和用户项目类型偏好综合建立用户的兴趣模型。谭晋秀等人[4]依据K均值(K-means)算法发现用户关注的话题。采用K-means算法进行聚类中,K值的选择需要事先给定,同时初始聚类中心的选择会对聚类的结果产生影响,虽然这些问题可以通过多次实验进行优化来解决,但随着项目及其属性信息的更新需要不断的重复上述优化过程,会使得算法的时间复杂度不断增加,因此,在大数据背景下,通过该算法进行用户兴趣选择的实用性不强。除了采用K-means算法进行兴趣提取,也有的研究采用模糊C均值聚类算法。郭弘毅等人[5]用重叠社区发现算法将用户集合根据其社交网络结构进行划分,于同一社区内的用户存在相同的特性或相互影响,在此基础上采用模糊C均值聚类算法,利用用户的行为记录以及项目所属的类别,寻找与目标用户在泛化层面的兴趣偏好相似的用户集合,提出基于兴趣偏好的模糊聚类算法。Katarya和Verma[6]提出FCM算法,其是在K-means算法的基础上加以改进得到的,虽然性能更好,但在算法的初期同样需要设定一些参数,并且若参数的初始化选取不合适,也会直接影响聚类的效果。同时当数据集较大时,其实时性不能得到保证。现如今是大数据的时代,面对海量数据,通过聚类分析获取用户的兴趣偏好其实时性更是不能得到保障。2LDA模型之兴趣挖掘LDA(LatentDirichletAllocation)模型是于2003年由Blei等人[7]提出的一种三层贝叶斯概率模型,也叫做隐含狄利克雷分布,该模型能够很好的挖掘文本的主题分布。最近,LDA模型也被运用到推荐系统中以挖掘用户的潜在兴趣偏好。在现有算法中主要从两个角度进行研究。其一是用LDA模型来评估文本以获得推荐系统的额外信息。文献8中首次利用LDA模型从产品评论中挖掘用户的兴趣,然后结合矩阵分解模型来预测未知的项目评分。J&S等人[9]利用LDA模型从文本描述中推断项目的潜在特性,然后根据历史评分在相同的潜在主题空间中计算用户的偏好。在李慧等人[10]的研究中用LDA模型来挖掘博文的主题分布,得到博主之间的偏好相似性。Wang...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?