随机森林方法在电信行业客户流失预测中的应用

doi:10.6043/j.issn.0438-0479.201608004基于分类回归决策树算法的专利价值评估指标体系邱一卉*张驰雨(厦门理工学院经济与管理学院,福建厦门361024)摘要:科学、准确的专利价值评估将有效地促进专利的产业化、商业化,是提升国家、企业综合实力的重要关键点。针对我国专利数据众多、指标关系复杂等特点,现有专利价值评估过程依赖人为主观,缺乏客观、合理评估方法等问题,提出了一种基于分类回归决策树(classificationandregressiontree,CART)模型的属性选择方法,用于构建专利价值评估的指标体系。实验结果表明相较于基于随机森林的属性选择方法,该方法不仅能有效地降低指标体系的规模,并且能提高评估建模的效率,在兼顾评估模型可解释性的基础上更好地提高专利价值评估的准确性。进一步通过枚举遍历的方法,约减指标集大小,构建出规模更小的指标体系,结合专家知识和实证研究,有效地验证了该指标体系的可解释性和现实意义。关键词:专利价值评估指标体系;属性选择;决策树算法:TP181文献标志码:A近年来,我国的专利总量快速增长。2015年,我国全年科研经费支出达14220亿元,比上年增长9.2%,全年受理专利申请279.9万件,为171.8万件授予专利权[1]。据世界银行统计,我国的科技成果转换率为15%,其中专利转换率为25%,专利推广率在15%~20%左右,与庞大的专利数量相比,如此之低的转换率使得大量优秀专利技术处于闲置和浪费状态,缺乏有效的专利价值评估手段就是影响专利快速转换的一大阻碍。若能快速有效地对专利进行评估,不仅可以节约60%的研究时间,更可以节省40%的研究经费[1~3]。因此,进行有效地专利价值评估是最为关键的一环。专利价值评估涉及诸多的指标,因此识别影响专利价值的关键指标有利于我们进行更加准确和有效的专利评估。近年来国内外学者在专利价值评估指标体系方面研究取得了不少成果,Park[4]和Hou[5]分别提出了影响专利价值评估的主要因素,也出现了CHI专利价值评估指标体系[6]和佐治亚太平洋(GeorgiaPacific)评估体系[7]等相关指标体系。杨丹丹、李清海、赵蕴华等[8~14]提出了影响专利价值评估的关键指标,并构建了专利价值评估指标体系。国家知识产权局于2012年出版了《专利价值分析指标体系操作手册》[15],该体系主要包括技术价值因素、法律价值因素及经济价值因素3个一级指标及一系列二级指标,为专利价值评估提供指导性的先验信息。综上,国内外学者对专利价值评估指标体系研究取得了不少成果,在实际应用邻域仍未形成统一的评估模型及标准。我国专利数据库也存在不完善、未标准化等问题使得很多国外的研究成果不适用于我国的专利价值评估,导致以往的专利价值评估过程中过于依赖人为评价、主观性太强,缺乏公正、合理和易操作的评估方法。在这一背景下,利用跨领域的新方法对专利价值评估指标体系进行进一步研究将具有重要的理论意义和实践价值。专利价值评估数据具有众多、指标关系复杂、类别不平衡等特点,为进一步提高评估性能,对专利价值评估数据进行属性选择、建立一个简约的专利价值评估指标体系十分必要。机器学习领域的属性选择分为三种模式:第一种模式是过滤器(Filter)方法,独立的对数据属性进行选择处理,与后续模型无关;第二种模式是包裹式(Wrapper)方法,直接把最终将使用的模型性能作为特征子集的评价准则;第三种模式是嵌入式(Embedding)方法,将属性选择过程与模型训练过程融为一体。一般而言,由于包裹式属性选择方法直接针对模型进行优化,因此从最终模型性能来看,包裹式特征选择比过滤式特征选择更好。Fisher’sratio、F-score[16]和Chi-Square[17]属性选择方法都是过滤器式的方法。这些方法无法检测属性---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---之间的关系,所选取的属性之间可能存在严重冗余,提高过拟合风险。而KP-SVM[18](Kernel-PenalizedSupportVectorMachine)和Boosting-SVM[19](BoostingSupportVectorMachine)则是嵌入式的属性选择方法,嵌入式的属性选择方法效率较高,它们在构造分类器的同时选择相关的属性。基于随机森林[20]的属性选择方法也是...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?