基于数据流的移动数据挖掘研究综述

基于数据流的移动数据挖掘研究综述摘要:无线网络和移动设备的应用为我们带来巨大的便利,可以随时随地获得信息,同时它也引发了对高效数据流分析工具的需求。移动数据挖掘是在普适环境下的数据流挖掘,从连续的数据流中发现知识。讨论了数据流、数据流管理系统和移动数据挖掘以及它们的特点,介绍了该领域的一些研究成果,突出了面临的挑战和一些相应的策略,并对这些策略进行了比较,最后展望了这一领域的研究前景。关键词:移动数据挖掘;数据挖掘;数据流;普适计算中图法分类号:TP391文献标识码:A:1001-3695(2007)01-0005-051991年Weiser提出普适计算[1](UbiquitousComputing)。普适被认为是一种特殊的环境特征,随着移动设备以及网络的发展,这一特征越来越受到重视。RobertGrossman根据系统的复杂性、数据与算法的结合程度、数据模型、分布程度将数据挖掘系统划分为四代。经过十多年的发展,数据挖掘的研究重点逐渐从发现方法转向系统应用,注重知识发现策略和技术的集成以及学科之间的相互渗透。数据挖掘系统也从第一、第二代系统转向第三、第四代系统的研制。??移动数据挖掘属于第四代数据挖掘系统,它最大的特色是将数据挖掘转移到嵌入式设备和移动环境。自2002年以来,移动数据管理已经召开了两次国际会议,主要讨论都是围绕普适环境这一特征,讨论如何管理在该环境下的数据,开发移动设备上的复杂计算程序并进行移动数据挖掘。移动数据挖掘与传统挖掘方法不同,具有很多独特的地方,它们会导致传统的数据挖掘算法无效。这种现象主要的原因是在应用上的不同,即移动挖掘算法和系统需要为应用量身定做。??(1)传统的数据挖掘系统面向的应用是知识发现、模式识别、决策支持、预测预警等,它们关心挖掘结果的正确性、完整性,导致了这类应用空间消耗大、计算密集、计算时间长。??(2)移动数据挖掘系统面向的是移动用户,这些用户需要获得的是即时数据挖掘结果。对于一些检测和监控程序,甚至需要处理实时数据获得实时结果和反馈。如旅行或者出差的时候,用户无法在股票市场或PC机前关注自己的股票信息,但是又希望了解最新的股票动态,他们可以在智能手机等移动设备上通过移动数据挖掘系统对股市数据流进行挖掘,利用全局优化的方法自动筛选股票进行监视,并预测股票发展趋势[2]。再如,在交通工具上安装传感器,通过分析传感器回传的状态数据,及时发现可能发生严重事故的状态,提前报警,阻止事故发生[3]。??无线网络及移动设备带来的新基础架构和开发环境,引发了面向数据流分析系统的研究和开发。其研究目的是如何在普适性环境下进行挖掘,并提出一个较为通用的面向数据流的挖掘系统的架构。本文介绍了数据流环境的特点以及数据流管理系统,重点突出了普适环境和数据流给移动数据挖掘带来的挑战;详细描述了移动数据挖掘所采用的几种处理数据流的策略,着重介绍了AOG方法,并对这些策略进行了比较。??1数据流特点与数据流管理系统??数据流与移动数据挖掘紧密相关,移动挖掘的数据大部分是数据流,而且未来移动数据挖掘的一个发展方向是在数据流管理系统上建立移动数据挖掘系统。??网络上的数据是以流形式传输的,网络管理软件是最早包含了数据流处理的软件,它可以统计网络上的数据包,并可以进行实时的分析。随着数据流应用的发展,在设备中嵌入实时处理程序来处理数据流的方法已经不能满足应用需求,如卫星返回拍摄的图像数据、宇宙探测器发送探测数据、传感器监控器传回的实时状态信息。人们希望存储这样一些数据,使它们能够查询方便,所以提出了数据流管理系统(DataStreamMana ̄gementSystem,DSMS)。??数据流模型中,需要处理的数据可能不在内存或硬盘上,因为数据流是连续的,可能还没到达。数据流模型与传统关系数据模型有四个不同点[4]:①数据记录是在线的,即数据不是一开始就各就各位,其存储在管理系统中以备使用。②DSMS无法知道下一个到达的数据是什么,更无法控制待处理的数据记录的顺序,在同一个数据流中不行,跨数据流更加不可能。③本质上,数据流的长度可以是无限制的,DSMS可能需要接收高速连续的、随时间变化而变化的数据流。④数据流中的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?