一种基于先验信息BPSO的基因选择方法

一种基于先验信息BPSO的基因选择方法杨春,韩飞(江苏大学计算机科学与通信工程学院,江苏镇江212013)摘要:针对如何提高所选基因子集的可解释性和分类性能,提出一种耦合先验信息二进制微粒群算法(BPSO)的基因选择方法。基因灵敏度(GCS)信息和基因调控(GR)信息分别耦合进两个相互独立的共享全局最优位置的BPSO过程中,主要利用先验约束进行粒子群初始化、粒子更新、限制最大速度和自适应变异操作。在两个公开微阵列数据集上的实验表明,由于GCS和GR信息的约束,新方法选出的基因数目较少但具有较强的分类能力。关键词:基因选择;基因灵敏度;基因调控;二进制微粒群DOI:10.11907/rjdk.151385TP301:A:1672-7800(2015)007-0036-05基金项目:国家自然科学基金资助项目(61271385)作者简介:杨春(1990-),男,江苏盐城人,江苏大学计算机与通信工程学院硕士研究生,研究方向为模式识别、生物信息学;韩飞(1976-),男,安徽安庆人,江苏大学计算机与通信工程学院教授,研究方向为智能信息处理、进化计算。0引言基因表达谱数据已经广泛应用于疾病诊断和预测。但是基因表达谱数据具有高维度、小样本的特点,存在大量冗余基因信息。因此,采用基因选择方法去除冗余基因是十分必要的。根据基因选择过程中是否有分类器的参与,基因选择方法通常可以分为基于Fliter的方法、基于Warpper的方法和基于Embedded的方法3类[1]。基于Filter的方法通常根据某种规则,给每一个基因作一个重要性度量的排序,从而进行筛选;基于Warpper的方法将分类算法嵌入其中,并不断地反馈分类器的分类准确率作为评价准则,将分类决策和特征选择耦合在一起,该方法的分类效果要比基于Filter的好[2];基于Embedded的方法将基因子集的搜索和评价过程完全耦合到构建分类器的过程中,所选择的基因具有很低的可解释性。Wrapper法因其直接使用分类器分类性能作为特征子集的评价标准,从而可以选择出高分类预测率的基因的优点,受到越来越多研究人员的青睐。许多基于群体随机优化的特征子集搜索算法已经被广泛地应用在Wrapper法中,包括:遗传算法(Geneticalgorithms,GA)[3]、模拟退火算法(Simulatedannealing)[4]、蚁群算法(Antcolonyoptimization,ACO)[5]和微粒群优化算法(Pswarmoptimization,PSO)等。相比于遗传算法,PSO算法需要调整的参数少,因而简洁、收敛速度更快,更易实现[6];相比于模拟退火算法,PSO算法更易收敛于全局最优点[7]。二进制微粒群算法(BinaryPSO,BPSO)是PSO的一个离散版本,用于处理离散空间的组合优化问题。然而所有PSO算法都容易失去粒子多样性,从而在收敛时陷入局部最优,即“过早熟”现象。其主要原因在于PSO进化过程中随机因素太多,缺乏实际有效的先验信息对粒子的初始化和进化运动进行约束和方向性引导。为了有效利用先验信息来指导PSO的粒子进化,提高所选基因子集的识别率,增加所选基因的可解释性,文献[16]提出了耦合GCS信息BPSO的基因选择方法(BPSO-GCSI-ELM)。由于仅考虑一种先验信息,容易出现先验信息过于主导选择过程的现象,且耦合程度不高。本文在BPSO中耦合两种先验信息:基因灵敏度(Gene-to-classsensitivity,GCS)信息[8]和基因调控(Geneinteractionregulation,GR)信息,同时选取极限学习机(Extremelearningmachine,ELM)[9]作为分类器评价所选的基因子集。实验结果表明,本文提出的方法能够有效而快速地选取具有低冗余度且高识别率的基因子集。1相关理论基础1.1BPSO算法Kennedy与Eberhart[10]于1997年提出了二进制粒子群算法(BinaryPSwarmOptimization,BPSO)。在该算法中,粒子位置的每一位被限制为1或0,对速度则不作这种限制。BPSO算法并不直接优化二进制变量本身,而是引入模糊函数Sig(x),将粒子的速度转化为二进制变量取值为1的概率。在粒子更新过程中,速度越大,粒子位置取值为1的可能性越大,反之则粒子位置取值为0的可能性越大。其位置进化公式为:1.2极限学习机极限学习机是由黄广斌教授在单隐层反馈神经网络(Single-hiddenlayerfeedforwardnetwork,SLFN)的基础上,于2004年提出的一种简洁有效的机...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?