基于GT4数据挖掘系统模块设计

基于GT4数据挖掘系统模块设计摘要本文首先简要介绍基于GT4网格平台的数据挖掘系统结构及系统模块的划分依据,详细介绍该系统的用户接口模块、资源注册模块、全局数据挖掘模块、局部数据挖掘模块的设计过程。关键词GT4;数据挖掘;WebService;网格节点中图分类号TP392文献标识码A文章编号1674-6708(2012)72-0203-020引言计算机网络技术的普及给人们的生活带来了翻天覆地的变化,同时在网络上产生了大量杂乱无章的数据。而应用GlobusTookit4.0(简称GT4)技术构建网格平台,建立一个实用的基于网格的数据挖掘系统,为人们从分布的网络资源中寻找有价值的信息提供了新的技术支持。网格技术可以使分散在不同地理位置闲散计算资源实现共享,应用GT4的核心开发工具包(JavaWebServiceCore)和数据挖掘技术来处理分散的数据信息,管理网格平台中的资源就像对一台计算机操作一样,操作网格资源就像使用浏览器浏览网页一样方便。1系统结构设计系统的结构设计在整个软件工程中比较重要,是根据用源的整合和管理;第二,能够处理本地和远程计算机上的数户的需求而设计的,它是整个数据挖掘系统的基础。该平台的体系结构具有如下特点:第一,实现了网格平台下数据资据,实现串行/并行的数据挖掘;第三,系统节点间相互协作,增加和删除节点都比较容易,系统具有可维护性。1.1系统的实现目标利用日趋成熟GT4网格管理技术和数据挖掘技术来建立一个实用的分布式数据挖掘应用系统。当代社会的主要特征:数字化、信息化、网络化。网络基础设施日趋完善,软件、硬件资源配置合理稳定。利用现成的网络资源来建立一个网格开发平台具有一定的可行性。1.2系统模块划分依据基于GT4数据挖掘系统的数据源是分布式数据源,分布式数据源是指在物理上分布而逻辑上集中的数据源系统。分布式数据源存储特点具有:1)物理分布性,数据分散存储在网络中的多个节点上;2)逻辑全局性,物理上分散存储的在各个节点的数据逻辑上是一个全局数据源;3)节点自治性,各个节点的数据由本地用户管理,具有自治处理能力;在该系统中,处在这个网格中的每台计算机就是这个网格的一个节点,称之为网格节点。在众多的节点中,要有一网格中的每台计算机都是一个独立的网格节点,并且它是作个网格节点来控制和管理其他的节点,这个节点就叫做网格中心控制节点,决策支持都是由网格中心控制节点完成的。如果要完成某个数据挖掘任务,则可以由空闲的网格节点先按挖掘需求来完成本节点的挖掘任务,再由网格中心控制节点来汇总每个节点的数据挖掘情况。局部网格节点管理的信息具有局限性,涉及的范围较小,主要完成单个节点数据的管理,对局部的数据挖掘结果进行汇总分析,但是这些局部节点的数据与全局节点的数据又是有一定关联的。根据以上的分析可知,网格平台下的数据挖掘任务由全局数据挖掘与局部数据挖掘共同完成,基于GT4的数据挖掘系统主要包括以下几个模块:用户接口、资源注册、全局数据挖掘、局部数据挖掘。1-3系统模块的功能及接口设计本系统是建立在Java_WS_Core分布式计算体系之上的,为独立的WebService注册和发布的。每个节点都具有良好的独立性、可操作性和可移植性。为更好的完成系统的功能,将系统划分为四个模块,具体模块功能及接口设计如下:1)用户接口模块:该模块实现用户和网格系统资源间的交互,是系统的窗口,它是一个管理注册资源、全局数据挖掘资源和局部数据挖掘资源的图形界面,是其他三个模块之间的纽带,为了用户操作方便,用户界面采用图形界面的Web方式,这样就可以用浏览器来发布和查找己有的服务,并且为用户发布和查找服务提供统一的接口。2)资源注册中心模块:网格系统中的空闲的局部WebService资源在这里进行注册,由全局控制节点在资源注册中心及时的增加和删除局部WebService资源。局部WebService资源使用WSDL规范定义,主要完成对数据挖掘服务的提供者、数据挖掘的特定信息进行描述。数据挖掘服务的提供者的主要描述信息包括作为网格节点计算机的主机型号、硬盘大小、内存容量、所安装的操作系统、CPU和内存利用率等信息,并将其发布到资源注册库中。数据挖掘的特定信息描述主要包括数据挖掘算...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?