商务数据识别及处理方法研究

文章编号:1009・8526(2005)02・0026・04商务数据识别及处理方法研究王世杰(广州航海高等专科学校软件学院,广东广州510725)摘要:依据数据的儿何形态来推断变量间函数关系的原理和Fuzzy嵌入文法概念,提出以数据曲线特征为依据的商务数据识别及处理方法•该模式识别方法中,特征重心是在赋了原始数据不同特征度条件下实现的,更接近人为表述数据曲线的心理特征,适应于商务数据的预处理•同时重点讨论了处理商务数据过程中的Web数据挖掘及有关的可行方法.关键词:商务数拯;特征;信息处理;识别中图分类号:TP393文献标识码:A商务数据识别(BusinessData,DT)是商务智能(Businesshitclligcncc,BD过程中的―个首要环节.商务智能的关键技术就是商务数据的识别和数据邕理.实现商务数据的获取、存储、处理和共享需要利用数据识别的技术商务数据识别技术的关键问题是如何对信息网络上的庞大数据流进行有效的扰取,怎样能够及时获取任意需求的有用数据或相关信息,同吋可以矩吋搜集商务信息数据并能利用实时系统提供相关的服务1这里只讨论部分所要解茯的主要问题.1商务数据识别及处理过程商务数据识别是从数据集中识别出有效的、新颖的、潜在有用的数据,由这些数据组合实现最终可理解的模式的高级处理过程•其数据集是数据库忙录的集合几模式是使用语言L表示的F中部分忻录的表达式E它所描述的数据集是集合F的一个子集心可知发现的数据是新的,表达式E也称为模式,也应该是新的,有使用价值,并能被用户所理解⑵.商务数据识别及处理过程如图1所示.可识别数数据识别-商务数据预处理-商务数据挖掘-模紬果评价据库茉帀库式1数据处理数期转换图1商务数据识别及处理过程商务知识收稿日期:2005-12-09基金项目:广东省教育厅自然科学基金项冃(0131)作者简介:王世杰(1951・),男,教授,主耍从事信息处理与电子商务研究1从图中可知,数据转换是将各类数据按照约定进行符号转换和归纳,如把连续值数据转换为离苗型数据、数据格式规范、或是把离散型数据转换为迫续型数据等商务数据识别的冃的是确定发现任务的操作对象,即商务冃标数据,是根据用户的需要从混合数据集中识别抽取的有效商务数据•商务数据处理一般包括消除噪声、推导计算缺值数据、消除重复记录、减少冗余及数据挖掘等,商务数据处理的主要目的是减小数据维数或降维(DinensionReduc2tbn),即从原特征中找出真正有用的特征以减少数则有:d,=据挖掘时要考虑的特征或变量个数.其中数据挖掘阶段首先要确定挖掘的任务或冃的,如数据分类、廉类、关联规则或序列模式发现等•在此基础上,决览使用什么样的处理方法或算法.2商务数据识别从技术的角度上看,商务数据识别就是从多种数据信息(包括文档、图形图像、声音)、有噪声的、属性模糊、随机储存的有量数据中,主要利用人工智能、模型匹配、文法识别、Web技术以及多种网络信息检索技术,在BtoAMtoB(Businesst)AgencyMachineMBusiness)*口BioAMtoC(Consumer)环境下,对商务服务器交互信息流的特征与成分进行实时分解、识别、求解以及提取特征的方法⑴.在利用观测样本/W,yjL-1.2.立变量X,y间的函数关系中,通常是计算各种模型下的相关关系数或进行假设检验,然后经过比较来确定较佳的匹配模型•这类方法工作量很大,效率较低,使用很不方便,尤其在非线性、图形以及语音识别等问题上,如何解决这类问题正是本文所要论述的.21数据曲线特征与滤波在利用平面上数据散点图来勾勒出隐藏在其中的曲线时,主要是根据点子的密集程度和密集点群的变化趋势,而那些远离密集点群和变化趋势之延拓区域的点子被人为地忽略掉•在人为估计曲线过程中有2点可取,一是对受随机干扰的数据按儿何分布状态进行滤波;二是对于可以利用的数据赋予'曲线特征”程度,曲线特征程度表示了数据可以反映Illi线特征的重要程度,曲线的特征主要是由曲线特征度较高的数据决定的⑶.设{(xityjl―訂为观测数据,满足x,<x2<<禺,数据曲线特征可记为:min(0%・y—(0丿0,0y,-y,(0丿0,0x+i(0丿0丿22,3,,n-\gj丄min(Cy}・y\(0)0,0卄-y2(0)0)i=1min(0片-儿(0)0,0yn.}-几(0丿0丿i=n(i)(2)1,di(G)/g&心丿(式中gi<GWmax{gj)0,©>G称G为数据(xif升啲...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?