自动化色谱谱图解析——谱峰的自动识别与快速解析2009年5月May2009色谱ChineseJournalofChromatographyVo1.27N0.335l~355自动化色谱谱图解析-谱峰的自动识别与快速解析刘明明,夏炳乐,杨俊(中国科学技术大学烟草与健康研究中心,安徽合肥230052)摘要:结合基于高阶导数的谱峰识别方法和面积重现法,建立了一种完全[J动化的对包谱曲线进彳亍分割,c只别与快速解析的方法.其中.DW(Durbin—Watson)测试的引入和区分信号与噪声判据的采用减少了存包谱解折过程中的人为干预,降低了对操作人员专业知识和经验的要求,为实现色谱解析的自动化奠定了基础通过列模拟色谱和实验色谱的比较,验证了该方法是一个很有用的丁具,可以为色谱分析工作提供有的帮助,关键词:面积重现法;潜峰识别;色谱解析;DW测试中图分类号:0658文献标识码:A文章编号:1000—87l3(2009)03—0351—05栏目类别:研究沦丈Automaticpeakrecognitionandrapidresolutionofchromatographicsignalswithaself-compilingprogramLIUMingming,XBingle,YANGJun(ResearchCenterofTobaccoandHealth,UniversityofScienceandTechnologyofChina,gefei230052,China)Abstract:Areareproductionmethodwasintroducedincombinationwithpeakrecognitionalgo—rithmbasedonhigh—orderderivativestoautomatethechromatogramdivision,peakrecognitionandrapidresolution.Durbin—Watsonmethodandthecriteriontodistinguishthesignalandnoisewereadoptedtoreducetheuserinteraction.Theobjectivewasthattheoperatorsshouldbeabletoperformthismethodwithminimalexperienceandprofessionalknowledge.Themethodisausefultoolbyapplyingittotheresolutionofmodelandrealchromatographicsignals.Keywords:areareproduction;peakrecognition;resolutionofchromatographicsignals;DUrbjn—WarsonHiethod随着色谱技术的进步,色谱的分辨能力亦日益提高,在分析检测领域的应用也逐渐广泛.近年来,人们提出了许多色谱解析的方法,常见的有傅里叶自去卷积法.,小波变换法,神经网络法,正交投影法,曲线拟合法,遗传算法,免疫算法等.这些方法大部分需要人工干预,提高了对操作者的经验要求,影响了色谱解析技术的实用性,且多数方法在解析的过程巾耗时较长,解析效率较低,不能满足短时问内解析大量谱图的需求.2007年,Boe.报道了一种称为面积重现法的色谱模拟方法,它以修正的泊松模型为基础,对色谱曲线进行直接测量,通过训’算模型参数,可以实现对色谱曲线的快速模拟.对于分离的色谱峰,嘶积重现法可以取得很好的效果;但对于重叠的色谱峰,谱峰的参数难以测量,Boe以相同的峰形参数拟合所有的谱峰,忽略了不同组分之间色谱峰形状的差异,给解析结果带来了很大的偏差.文献[9]则提出了通讯联系人:夏炳乐,副教授.E—mail:xiabl@ustceducn基金项目:国家烟草专卖局科研基金项目(No1002001041)收稿日期:2008—1O-04另外一种基于色谱曲线高阶导数的谱峰识别方法.该方法是根据一阶导数确定组分的洗提区域,根据二阶导数确定谱峰的性质;但在色谱识别的过程中需要人工指定阈值以区分信号和噪声,这对于操作人员来说是一个很大的挑战.为了降低对操作者的经验要求,同时迅速地解析含有重叠峰的色曙曲线,我们将基于高阶导数的色谱识别方法加以改进,结合面积重现法,建立了一种完全自动化的色谱解析方法.经过对模拟色谱和实验色谱的比较,证实r该方法可靠快速,可以为日益增多的色谱分析工作提供一定的帮助.1原理1.1信号与噪声的判据在色谱曲线的自动处理过程中,区分信号与噪声是一个基本的问题.在传统的算法中,人们往往通过指定阂以的方法.来区分信号与噪声.当晌?352?色谱第27卷应大于闽值时为信号,否则为噪声.阈值的选取依赖操作人员的经验,并且需要进行多次尝试.本方法中采用了一种依据数据曲线的判据,它依赖数据自身的特点,不需要人为的指导.其主要思想可以通过以下两个公式描述:P=÷∑(1)凡s=——_一一P(2)lfilP即击÷∑—南即——=一——+P凡——I,:f+p而一2m()’+1…其中表示第i个数据点;为数据点的总数;p为数据点绝对值的平均值;s描述了数据曲线的加权平均,响应越大的数据点,对的贡献越小,因此s主要表...