WSN数据流离群点挖掘探究

WSN数据流离群点挖掘探究摘要:随着传感器网络技术的发展,WSN中的离群点检测成为近年来研究的热点,出现了很多检测算法。由于传感器节点能量有限,且产生的数据为流式数据,传统、静态的离群数据挖掘方法不再适用。如何在能量消耗最小的情况下,提高检测精度是需要解决的问题。关键词:无线传感网离群点检测:TP311.3文献标识码:A:1007-9416(2013)07-0086-01离群点检测又称异常检测、孤立点检测、偏差检测。Hawkins[1]给出了离群点的本质性定义:离群点是数据集中偏离大部分数据的数据,使人们怀疑这些数据的偏离并非由随机因素产生,而是产生于完全不同的机制。也就是说,离群点是数据集中与其他数据明显不一致的观测值。离群点检测在传感器网络中有许多重要的应用,例如异常事件检测,动物的行为改变,异常入侵检测等。离群点检测提供了数据可靠性、事件报告和网络安全等功能,在环境监测和濒危物种生活习性监督等领域有着广泛应用。离点群检测是数据挖掘的基本任务之一,与数据挖掘的其他任务一关联规则分析、分类分析、聚类分析等任务相比,离群点检测更加符合数据挖掘的本质。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---随着传感器网络技术的发展,WSN中的离群点检测成为近年来研究的热点,出现了很多检测算法。由于网络有限的资源,传感器网络中的数据挖掘技术受到了很多的限制,使得其离群点检测面临严峻的挑战[2],最棘手的问题是如何在能量消耗最小的情况下,提高检测精度。由于受到网络通信带宽有限、物理设备故障、恶劣环境及外界干扰等因素影响,传感器网络中节点收集的数据往往是不可靠不精确的,数据会出现异常、丢失、不一致等问题。在WSN中,离群点定义为那些明显偏离传感数据正常模式的数据[3]。在WSN中传感器节点用于监测物理世界,因此存在着代表正常行为和状态的传感数据模式。由于WSN特殊的特点,如资源受限,物理故障,及恶劣的环境影响等,无线传感器网络更容易产生异常值。很多课题研究如何在WSN中识别离群点原因的问题,包括错误检测,事件检测以及入侵检测。这一方向的研究值得深入探讨,以获得对决策有帮助的信息,而不是单纯地将离群点作为错误信息忽略掉。在许多研究中,为了减少不一致数据也就是离群数据对分析结果的影响,离群点常常被忽略或者作为噪声被处理,然而,“一个人的噪声可能是另一个人的信号”,不加分析地舍弃离群数据,可能导致重要信息的丢失[4]。例如在欺诈检测中,离群数据可能意味着欺诈行为的发生;在环境监测中,离群数据可能预示着灾害天气的到来;在入侵检测中,离群数据可能意味着---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---入侵行为的发生等等,由此可见离群数据检测是数掘挖掘领域的一项关键任务。如果可能,噪音和错误数据应该被忽略或纠正,因为噪音是随机的错误,不会对实际数据分析造成影响。而造成离群的其他原因应该识别出来,因为其中可能隐含研究者感兴趣的关于事件的重要信息。要将现有的离群点检测技术应用到传感器网络中,存在的主要问题有[5-8]:(1)大多数现有工作没有考虑多变量数,假设传感数据是单变量的。然而,有时候单个变量没有出现异常,但多个变量一起考虑时可能就是异常状况。(2)现有技术考虑邻居节点之间的空间关联,但如何选择合适的邻居范围是一个问题。而考虑数据事件关联性的时候,如何选择滑动窗口的大小也是个问题。(3)很少区别离群点究竟是事件还是错误。现有方法只是简单将离群点认为是错误。通常认为错误应该被删除,关于隐藏事件的重要的信息有可能丢失。实际上这些技术没有具体描述如何处理识别出来的离群点。(4)许多技术需要用户定义阈值,但我们往往难以定义一个合适的阈值。此外,如果WSN特征动态变化的话,设置固定的阈值也是不合理的。(5)这些技术假设传感节点是静止的,没有考虑节点移动性。如果将这些算法应用到动态网络环境中也存在一些问题。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---参考文献[1]HawkinsD.IdentificationofOutliers[M]・London:Chapman...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?