基于属性值大小的改进数据预处理方法研究

基于属性值大小的改进数据预处理方法研究刘强1,张强11.北京理工大学,管理与经济学院,北京,10081Liuqiang2k@163.com摘要:在多属性决策中,对于信息完整的决策矩阵,属性值的大小可能影响属性权重的分配,应用常用的数据预处理方法进行处理可能导致不合理的结果。本文对此问题进行了探讨,并提出了解决该问题的改进预处理方法,随后给出了研究示例,最后进行总结。关键词:多属性决策属性值数据预处理模糊集中图分类号:C931文献标识码:A1引言多属性决策中,决定方案排序的主要参数一个是属性间的相对重要性,属性的权重,另一个是方案所对应的属性值[1]。现有的研究决策的文献一般都从这两个因素出发,从属性值影响属性权重的角度进行研究的文献还不多见。在多属性决策中,由于多个属性间的矛盾性和不可公度性,需要将原始数据进行预处理,这一过程也称为属性值的规范化。数据预处理的作用有三:一是单调化,使决策矩阵中各个属性下性能越优的方案变换后属性值越大;其次是非量纲化,排除量纲选用对决策或评估结果的影响,仅用数值的大小来反映属性值的优劣;三是归一化,即把决策表矩阵中的数据均变换到[0,1]区间上。一般的说,数据预处理的本质是给出某个指标的属性值在决策人评价时的实际价值[2][3]。目前常用的数据预处理方法有线性变换、标准0-1变换、和向量规范化等。文章首先介绍了几种常用的数据预处理方法,进而分析了属性值大小对属性权重的影响以及常用数据预处理方法在处理此情况下的不足,并提出了一种新的数据预处理方法,希望使决策结果更加合理。2常用的数据预处理方法常用的数据预处理方法主要有有线性变换、标准0-1变换、和向量规范化等。简单介绍如下:设有m个方案,n个属性的决策矩阵为:Y={},变换后的决策矩阵记为Z={},,。设是决策矩阵第j列中的最大值,是决策矩阵第j列中的最小值。2.1线性变换线性变换是最简便的数据预处理方法,其处理方法如下:对效益型属性,令:=/(1)采用上式进行变换后,最差属性值不一定为0,最佳属性值为1。对成本型属性,令=1-/(2)经过式(2)变换后的最佳属性值不一定为1,最差为0。成本型属性也可以用下式进行变换=/(2’)用式(2’)变换后的属性值最差不一定为0,最佳为1,且是非线性变换。标准0-1变换标准0—1变换的方法是在线性变换的基础上,使每个属性变换后的最优值为1且最差值为0而进行的变换。同样分为效益型和成本型两种。对效益型属性j,令=(3)j为成本型属性时,令=(4)2.2向量规范化无论成本型属性还是效益型属性,向量规范化均用下式进行变换(5)这种变换也是线性的。3属性值大小对其权重的影响研究及常用数据预处理方法的不适用为了说明属性值大小对其权重的影响,我们首先引入以下例子:例1:学校扩建问题[2]。某地区现有两所学校,由于无法完全容纳该地区的适龄儿童,需要扩建其中的一所。在扩建时既要满足学生就近入学的要求,又要使扩建的费用尽可能小。经过调研,获得如表1所示的决策矩阵。问题是扩建哪个学校更好?表1学校扩建问题的决策矩阵学校序号费用(万元)平均就读距离(km)---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---16000.825001引入假设的表2。其中表2和表1的区别仅在表2的平均就读距离为表1中的10倍,其决策矩阵如下:表2学校扩建问题的决策矩阵学校序号费用(万元)平均就读距离(km)16008250010解例1的关键在于找到两个属性的权重,因此首先要对表1、表2进行数据的预处理。不难看出如果使用线性变换、标准0-1变换、和向量规范化进行数据预处理,两个表将得到相同的数据预处理结果,进而在此基础上进行的权重分配运算也将得到相同的结果。因此表1和表2得到的最终结果也是一样的。这个结果意味着儿童上学是平均走0.8公里还是走8公里是相同的,这是不合理的。容易看出,平均就读距离越短,决策者就会将更多的注意力集中到建校费用上,从而分配给建校费用的权重提高,分配给就读距离的权重减小;反之,平均就读距离越远,分配给就读距离所占的权重就越大,分配给建校的权重的就越小。如表1所示,由于两个建校位置平均就读距离分别是0.8公里和1公里,这样短距离...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?