大规模机群系统的快速部署与动态配置

大规模机群系统的快速部署与动态配置摘要:随着计算需求的日益增大,机群系统的规模越来越大,节点数目越来越多,传统的机群部署与配置方法已经逐渐不能胜任。为此,在机群环境中部署了一套集中管理系统,将所有的部署与配置工作集中到少数几台服务器上,而无须对单个节点进行重复操作,实现对机群系统节点的快速部署,并对已安装的节点进行实时与动态配置,从而极大地减少了工作量,提高了效率。关键词:机群;可扩展标记语言;KickStart;PXE;模板;组件:TP311文献标志码:A:1001-3695(2008)06-1911-03Keywords:computercluster;XML;KickStart;PXE;template;component高性能计算是当前计算机科学中一个日趋重要的分支。而大规模的机群系统又是高性能计算中一个重要的组成部分。目前,大规模的机群系统在各个领域的应用越来越广泛,包括高能物理、金融、气象等诸多领域[1]。对于这些领域,随着计算需求的增大,机群系统的规模也越来越大,节点数目从几十、几百到几千、上万不等[2]。像欧洲粒子物理研究中心CERN,目前机群节点数目已经达到两千多个。在笔者所在的高能物理研究所,目前机群与网格环境的节点总数为300多个,但是随着BEPCⅡ(北京正负电子对撞机)改造工程的进行,计算需求将迅猛增长,机群、网格等计算系统的规模将成倍增长,总共节点数目至2010年将达到??4000个。机群节点数目的成倍增长,对机群系统的部署与管理来说是一个新的挑战,新的问题也不断出现。?ヒ?Linux平台为例,机群系统的部署与配置上常见的问题有:a)每个新增节点需要安装操作系统,传统的是从cdrom对单个节点进行安装。安装前需要填写大量的信息;安装完成后需要配置系统服务。b)节点按照所承担的不同功能,需要安装不同的软件包。c)需要定期升级某些软件包。d)在某些节点上,需要卸载某些软件包,或者安装新的软件包。e)节点上的软件包安装后,需要修改或者更新相应的配置文件或者启动某些服务才能生效。?フ庑┕ぷ魅绻?只是在单机上进行,显然是没有什么难度。但是当节点数目超过100个时,如果这些繁琐的安装与配置工作都由管理员手动逐个节点来完成,将会耗费巨大的人力与时间,而且效率低下,也容易出现错误。?フ攵哉庵智榭觯?传统的机群管理工具,如无盘工作站、网络计算机、硬盘克隆[3]等都不能完美地解决所有问题。?ピ诖蠊婺5幕?群系统上,建立一种集中、快速的方式来部署与动态配置机群系统是非常必要的。这样可以让所有的工作集中在几台服务器上,而无须对单个节点进行操作,同时能使节点动态更新自己的配置信息,从而简化工作量,提高效率。目前类似的系统有欧洲粒子物理中心(CERN)的QUATTOR[5]、意大利核物理研究所(INFN)的YAM+APT。为此,笔者在自己的机群系统上部署了一套集中管理系统(centralizedmanagementsystem,CMS),对目前的机群进行快速、集中的部署与动态的配置。1CMS的原理??CMS的目标是要将所有的部署与配置工作集中到几台服务器上(服务器的数目视机群的规模大小而定),而无须在每个节点机上执行重复安装与配置工作。因此,CMS的整体构架为C/S模型。所有的机群节点均是这些服务器的客户端。?ト缤?1所示,每个服务器各自承担一部分独立的功能,各个节点分别与这些服务器发生联系。?シ?务器按照其功能的不同,可分为三种类型,即配置信息管理服务器(configurationdatabase,CDB)、软件包管理服务器(softwarerepository,SWR)、自动安装服务器(automaticinstallationserver,AIS)。如果机群系统上节点数目小于100,这三个服务器可以集中在一台机器上。当节点数目更多时,由于网络带宽的限制,软件包服务器可以分布在几台机器上。CMS的目标是让这三个服务器协同工作,使得与服务器通信的各个客户节点能自动安装操作系统,自动安装、升级、删除软件包,并且完成自我配置与实时、动态配置(客户端节点根据CDB中配置信息的改变而自动更新本节点的配置信息)。2CMS的体系结构??CMS的服务器与客户端主要功能(图2)如下:??a)配置信息管理服务器CDB。CDB是节点机配置信息管理的核心,它主要用来保存所有目标节点的软、硬件等配置信息,如CPU、内存、硬盘、网络参数、...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?