基于TF-IDF和人工神经网络模型的众筹影响因素研究

基于TF-IDF和人工神经网络模型的众筹影响因素研究于昊卿摘要:随着社会经济的发展,教育资源不平衡的情况正在愈演愈烈。很多地区的适龄儿童因为没有合适的经济条件和物质基础,就难以享受到良好的教育资源。在这种背景下,教育众筹平台成了一个协调教育资料的渠道,众多贫困地区的教师可以在平台上发布申请书而获得社会大众的关注和支持。基于美国众筹网站的18万条申请记录数据进行了一系列分析,对教育众筹成败的影响因素做了深入讨论。首先,基于TF-IDF算法,对申请书中的文本关键词进行了提取,使得大众可以快速地了解到申请书的核心诉求。基于Python计算了单词的TF-IDF值,并统计出了最常出现的一些关键词,并分析了关键词对申请结果的影响因素。之后,建立了人工神经网络模型,实现了对申请结果的精准预测,并对项目的申请者和审核者提出了合理化的建议。关键词:TF-IDF算法;人工神经网络;影响因素分析;教育众筹:F23:Adoi:10.19311/j.cnki.1672-3198.2019.10.0511前言众筹网站www.donorschoose.org由一位美国人建立的,该众筹平台得到了世界各地人民的赞同与支持,K12学龄段的老师们都可在该众筹平台上发出请求书,申请社会上的帮助以改善学生的教学环境。因此,研究这些请求书能否被社会人士认同并成功获得相应的教育资源成为了众筹平台和老师们迫切关注的问题。它既能帮助众筹平台更关注高质量的请求,减少由于审核这些请求所带来的人力成本,又能帮助老师更好的发布请求来获得社会人士的支持。对于众筹影响因素的分析,国内外学者进行了诸多研究。Mollick分析了Kickstarter众筹网的数据,给出项目质量、项目目的以及项目发起人地理位置是重要因素。Colombo通过实证研究发现,项目发起人与项目支持者之间的联系强度也是一个影响众筹成功的关键因素。Frydrych在研究中指出目标金额对众筹融资成功具有反向的影响,Agrawal还指出地理位置也是影响项目成功的关键因素。在国内学术界,黄健青通过对追梦网的实证分析,指出目标额度、支持者、最小投资额和最小投资额人数是影响项目成功的主要因素。郑海超等指出融资额、融资时间和评论数是影响项目成功的关键因素。曾江红等从社会资本对众筹成功的影响因素研究中指出融资额与项目成功为负相关关系。本文后续章节结构为:第二章介绍了数据的来源、介绍和预处理过程;第三章展示了利用TF-IDF算法提取关键词的步骤,以及优化的流程和优化前后的提取结果;第四章建立了人工神经网络模型,通过优化得到了更加精准的预测结果;第五章总结了全文内容,并对未来发展提出了展望。2数据简介和数据预处理本文应用的数据,主要是来自于美国教育众筹网站(www.donorschoose.org)的申请记录。该网站始建于2000年,由一名纽约的老师创建。数据整体分为两个部分:Data.csv文件:包含了一个申请书填写的主题内容,包括项目ID、教师ID、教师称谓、申请年级、申请地区、申请时间、申请类别、申请书标题、申请书文本、资源需求概述、教师申请过的项目数和项目申请是否通过。Resource.csv文件:包含了项目申请的所有资源,包括项目ID、申请物品的名称、申请物品的数量和申请物品的单价。通过对数据的浏览和分析,首先对数据进行了如下几步的预处理工作:(1)将项目的申请时间、教师曾经的申请数量进行离散化处理。由于所有的18万条数据基本集中在同一年,因此我们将“申请时间”数据转化为“所在月份”,成为一个具有12个离散属性的特征变量;同时为了应用后续的分类预测模型,本文将“教师曾经的申请数量”进行离散化处理,根据数据的分布情况将该属性分为8个间隔不等的区间段,转化为具有8个离散属性的特征变量。(2)将申请书中有所“project_essay”字段进行合并。由于申请网站于2016年5月17日进行过改版,因此该时间前后的文本数据存在不一致性。经过分析可知,改版前的前两个文本信息“project_essay1”和“project_essay2”的内容基本与改版后的“project_essay1”一致,而改版前的“project_essay3”、“project_essay4”基本与改版后的“project_essay2”一致。因此,考虑到一个申请书全文的内容,本文将每个申请书的2-4个字段的文本信息进行...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?