毕业设计开题报告-事件序列上频繁情节挖掘算法的研究

南京理工大学泰州科技学院毕业设计(论文)开题报告学生姓名:学号:专业:信息管理与信息系统设计(论文)题目:事件序列上频繁情节挖掘算法的研究指导教师:2014年1月19日开题报告填写要求1.开题报告(含“文献综述”)作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。此报告应在指导教师指导下,由学生在毕业设计(论文)工作前期内完成,经指导教师签署意见及所在专业审查后生效;2.开题报告内容必须用黑墨水笔工整书写或按教务处统一设计的电子文档标准格式(可从教务处网页上下载)打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教师签署意见;3.“文献综述”应按论文的格式成文,并直接书写(或打印)在本开题报告第一栏目内,学生写文献综述的参考文献应不少于15篇科技论文的信息量,一般一本参考书最多相当于三篇科技论文的信息量(不包括辞典、手册);4.有关年月日等日期的填写,应当按照国标GB/T7408—94《数据元和交换格式、信息交换、日期和时间表示法》规定的要求,一律用阿拉伯数字书写。如“2010年3月15日”或“2010-03-15”。毕业设计(论文)开题报告1.结合毕业设计(论文)课题情况,根据所查阅的文献资料,每人撰写2000字左右的文献综述:文献综述摘要近年来,在许多管理信息系统及决策支持系统中频繁出现了大量的有序事件,挖掘这些事件背后隐藏的规律具有十分重要的意义。本文研究了“情节”的相关概念及事件序列上的频繁情节挖掘算法,包括WINEPI、MINEPI、NONEPI等算法的设计思想和基本原理,分析了各种算法的优势和存在的不足。在此基础上,研究了应用Java语言实现算法的相关技术。关键词数据挖掘事件序列频繁情节NONEPINONEPI++1研究背景随着计算机网络技术的飞速发展,近年来在许多管理信息系统、信息分析系统及决策支持系统应用中出现了大量的由一系列值对(事件类型,发生时间)组成的事件序列,如网络监控日志、入侵检测序列、股票交易日志、基因序列等。这些事件序列背后隐藏了大量的规律,对他们进行挖掘和分析,可以发现事件之间的紧随关系,从而揭示系统潜在的行为模式,这种模式被定义为“频繁情节”。基于事件序列上的频繁情节挖掘已经成为时序数据挖掘领域的热点之一,它具有广阔的应用前景,为商业预测、决策提供了科学依据,目前已被广泛应用于电信故障诊断、股票趋势分析、道路交通监控、用户行为预测等领域。为了解决频繁情节挖掘问题,ManiLLa等人首先引入了情节的概念,并提出了两个经典算法WINEPI、MINEPI。其中,WINEPI基于滑动窗口(SLidingwindow)来定义支持度,而MINEPI是基于情节的最小发生来定义支持度。这些算法都采用了Apriori算法的基本思想,能挖掘出所有的频繁情节,但是在计算支持度时可能包含了多次重叠的发生,从而导致“过计数”问题。为此Laxman等人引入了“非重叠发生”的概念来定义一个情节的支持度,并且提出了一个高效的频繁情节挖掘算法NONEPI,该算法通过采用有限状态机来计算情节支持度,不足之处,该算法与Apriori算法类似,需要多遍扫描事件序列,并产生大量候选情节。虽然一些改进算法对产生的候选情节预先进行“剪枝”,提高了效率。然而,当事件序列很长时,多遍扫描序列仍然需要较高的空间和时间代价。为了克服以上算法的不足,本文拟在研究和实现NONEPI算法的基础上,对NONEPI算法进行改进,以期提高频繁情节挖掘的效率。2相关技术本文基于Eclipse平台及Java开发工具(JavaDevelopmentKit,JDK),应用Java语言实现NONEPI算法及改进的NONEPI++算法。2.1数据挖掘数据挖掘(Datamining)是数据库知识发现(Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。数据挖掘利用了来自如下一些领域的思想:(1)来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?