一种改进的缺失数据协同过滤图书自动推荐模型研究

一种改进的缺失数据协同过滤图书自动推荐模型研究杨玉枝摘要:针对图书馆图书协同过滤自动推荐系统,因数据缺失对图书推荐结果产生影响。该文借助广东岭南职业技术学院图书馆50万条样本数据,通过对部分变量缺失数据进行插值,设计一种改进的缺失数据协同过滤图书自动推荐系统模型(xDeepFM-D)。试验结果表明,在模型训练150轮后,测试集总损失为0.0728,AUC(AreaUnderrocCurve)为0.9274。对比常见推荐系统模型xDeepFM、DeepFM、FMDNN以及FM,AUC分别提升了0.17%、0.64%、1.27%、1.03%。xDeepFM-D模型为图书推荐系统提供了良好的应用条件。关键词:协同过滤推荐系统缺失数据数据插值:G250.76文献标识码:A:1672-3791(2021)04(a)-0181-06ResearchonanImprovedAutomaticBookRecommendationModelforCollaborativeFilteringofMissingDataYANGYuzhi(GuangdongLingnanInstituteofTechnologyLibrary,Guangzhou,GuangdongProvince,510663China)Abstract:Forthelibrarybookcollaborativefilteringautomaticrecommendationsystem,thelackofdatahasanimpactonthebookrecommendationresults.Basedonthe500000sampledatafromthelibraryofGuangdongLingnanInstituteofTechnology,thispaperdesignsanimprovedautomaticbookrecommendationsystemmodel(xDeepFM-D)forcollaborativefilteringofmissingdatabyinterpolatingthemissingdataofsomevariables.Thetestresultsshowthatafter150roundsofmodeltraining,thetotaltestsetlossis0.0728,andtheAUC(AreaUnderrocCurve)is0.9274paredwiththecommonrecommendationsystemmodelsxDeepFM,DeepFM,FMDNNandFM,AUCincreasedby0.17%,0.64%,1.27%,1.03%,respectively.ThexDeepFM-Dmodelprovidesgoodapplicationconditionsforthebookrecommendationsystem.KeyWords:Collaborativefiltering;Recommendationsystem;Missingdata;Datainterpolation.图书馆在读者借书环节,若选择自动推荐系统,将会给读者选书带来极大的便利。不仅可以提高读者选书挑书的效率,还可以提高图书的借阅使用频次,较好地促进图书的流转使用率。传统的图书推荐系统中,在读者选书环节,系统给读者提供的推荐信息存在准确性低的缺点。分析其主要原因,传统推荐系统仅凭借读者注册时填写的兴趣爱好信息来判断图书推荐优先级,存在一定程度的不合理性。比如:读者在图书系统中注册个人信息资料时,并没认真填写个人兴趣信息一栏,填报信息的准确性不高;还有部分读者随着时间的推移,兴趣发生了改变,但信息填报系统并没有及时更新读者的个人信息。综合这些因素都会对图书推荐信息准确率产生较大影响。然而主流的协同过滤图书自动推荐系统比较依赖较完整的庞大数据,而数据缺失对协同过滤图书推荐系统会产生较大影响。因此,设计一种改进的缺失数据协同过滤图书自动推荐系统模型,具有重要意义。1相关研究随着个性化推荐技术的发展[1-5],其在图书馆推荐中的应用逐渐成为了研究热点[6-10]。国内外很多學者也对其进行了研究[11-12],通过关联规则分析读者的借阅记录实现了图书馆藏图书的推荐、分析FP-growth关联规则算法在图书资源个性化推荐中的应用、分析读者在图书馆的日常借阅和检索行为构建了读者兴趣模型以及通过协同过滤算法实现了图书资源的个性推荐等。当前,图书馆的推荐系统大多数是基于内容的推荐技术和基于协同过滤的推荐技术,这些推荐系统虽然实现了读者大众数据的统计和分析,但是忽视了读者个性化信息的深层次特征。随着深度学习技术在计算机视觉CV和自然语言处理NLP等领域取得不错的效果,研究基于深度学习技术的推荐系统也成为当今的热门领域[13]。然而传统的图书自动推荐系统存在准确性低等缺点,因此该文着手研究基于深度学习技术的推荐系统,解决传统推荐系统的不足,为读者提供更加灵活的个性化图书推荐服务。xDeepFM模型[11]已经在广告、餐饮、新闻等领域具有应用成功的案例,如在Criteo、大众点评和必应新闻等3个数据集上对上述模型进行评测,这3个数据集分别对应广告推荐、餐馆推荐和新闻推荐等不同的应用场景,所采用的评测指标为...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?