□胡长爱朱礼军/中国科学技术信息研究所北京100038复杂网络软件分析与评价*1引言复杂网络理论的系统研究源于20世纪60年代匈牙利数学家Erdös和Rényi建立的随机图理论。随着小世界模型、无尺度网络模型在20世纪末被提出来,人们对来自不同领域的大量实际网络的拓扑特征进行了广泛的实证性研究,复杂网络逐渐成为各个学科领域的研究热点。为了方便有效地研究复杂网络,各类研究软件不断产生,如GUESS[1]、NetVis[2]、Pajek[3]等等。本文重点以Pajek、UCINET[4]、NetworkX[5]、NetMiner3[6]为代表,比较分析复杂网络软件的特点和发展现状,为复杂网络软件的选用提供依据。复杂网络,简而言之即呈现高度复杂性的网络。其复杂性[7]主要表现在以下几个方面:1结构复杂:表现在结点数目巨大,网络结构呈现多种不同特征。2网络进化:表现在结点或链接会随着时间的变化而产生或消失。3链接多样性:结点之间的链接权重存在差异,且有可能存在方向性。4动力学复杂性:结点集可能属于非线性动力学系统,结点状态可能会随时间发生复杂变化。5结点多样性:复杂网络中的结点可以代表任何事物,同一个网络可能存在代表不同事物的结点。6多重复杂性融合:即以上多重复杂性相互影响,导致更为难以预料的结果。实际的复杂网络会受到多种因素的影响和作用,各种网络之间密切的联系也会使它们相互产生影响,从而加大对复杂网络分析的难度。因此,一个简单易学且功能强大的分析工具,能给研究者很多的便利。2复杂网络软件的分析从整个复杂网络的发展看,社会网络的研究起到了很大的促进作用,很多复杂网络的软件是因为社会网络分析的需求而发展起来的。目前,复杂网络软件的数量已经很可观了,尤其是一些学术的可以免费获得的软件。这些软件的不同首先在于数据处理能力和计算速度上的区别。例如Igraph[8]可以处理上百万个数据点,Pajek、NetMiner3的数据处理能力也能达到百万级,但UCINET[9]的上限却只有三万多个数据点。另一个区别在于能否进行可视化。可视化可以说是复杂网络工具发展的一个重要的趋势。Pajek、NetMiner3等很多软件都具有可视化的功能。其他比较著名的可视化工具还有GDToolkit[9],NETDraw[10]等。它解决了文字和表格无法表达复杂的网络结构问题,也为挖掘网络内部有价值的信息提供了帮助[12]。除以上两点外,软件的直观易用,支持文档的可获得性和可理解性,也直接影响着软件的选用。这些区别主要缘于软件设计者对软件功能的定位不同,及自身的知识背景的差异。2.1典型复杂网络软件的研究复杂网络的特性是由一些特征参数进行描述的,主要包括结点度、介数、接近度、平均路径长度、聚类系数等。目前,复杂网络的基础研究主要围绕网络的中心性、鲁棒性与脆弱性、动态性、小世界特性和摘要:如今,复杂网络数据规模膨胀,文字和表格已无法展现其内部结构,同时妨碍了复杂网络隐藏信息的挖掘,复杂网络分析工具的产生解决了上述难题。文章归纳总结了复杂网络理论的基本内容,在广泛调查现有复杂网络处理软件的基础上,分析比较了各个软件的功能,提出量化评价指标,并对各个软件进行分析评价。关键字:复杂网络,分析软件,特征参数,评价模型DOI:10.3772/j.issn.1673—2286.2010.05.007*“”“国家十一五科技支撑计划课题知识组织系统的集成及服务体系研究与实”现(2006BAH03B03“”和科技文献信息服务系统关键技术研究及应用示范(2006BAH03B06资助“项目。中国科学技术信息研究所重点工作项目汉语科技词系统建设与应用工程——新能源汽车”领域完善及领域扩展(2009KP01-3-2资金项目。332010年第5期(总第72期2010年第5期(总第72期无尺度特性的判断等问题,这些内容的研究很多都落实到特征参数上。例如,中心性的研究涉及结点度、接近度、介数、特征向量、子图等的研究,鲁棒性与脆弱性涉及平均路径长度、聚类系数等特征参数。表1是四大软件主要特征参数展示情况对比,图1则是复杂网络常见问题与特征参数匹配图。复杂网络软件除了能够计算特征参数外,还需要统计、可视化、社团发现、动态网络分析等功能。表2列出了Pajek、UCINET、NetworkX、NetMiner3四大软件用于研究复杂网络方面的主要功能列表。因为对用户需求的定位不同,各软件在功能上也各有...