遗传HEREDITAS(Beijing)26(4):514~518,2004技术与方法人类遗传突变数据库及其应用庄永龙1,周敏2,李衍达1,沈岩2(1.清华大学自动化系生物信息学研究所,教育部生物信息学重点实验室,北京100084;2.中国协和医科大学基础医学院,北京100005;国家人类基因组研究北方中心,北京100176)摘要:随着人类基因组序列草图的完成,基因组突变的研究显得日益重要,而越来越多的突变信息的积累,使得各种突变数据库相继诞生。根据各种数据库的功能,对目前的人类突变相关数据库资源进行了分类总结,分类为突变数据库、单核苷酸多态信息数据库、与疾病相关的突变数据库、突变对蛋白质的影响、突变图谱以及特定基因的突变信息,分析该如何合理使用这些遗传突变数据资源,以及目前的突变数据库所存在的问题。关键词:突变数据库;遗传突变;SNP中图分类号:TP311.132文献标识码:A文章编号:0253-9772(2004)04-0514-05TheApplicationofHumanMutationDatabasesZHUANGYong2Long1,ZHOUMin2,LIYan2Da1,SHENYan2(1.InstituteofBioinformatics,TsinghuaUniversity,Beijing100084,China;2.InstituteofBasicMedicalSciences,ChineseAcademyofMedicalSciences,Beijing100005,China;ChineseNationalHumanGenomeCenter,Beijing100176,China)Abstract:ResearchesongenomemutationarebecomingmoreandmoreimportantwiththefinishofhumangenomeDNAdraft.Thisreviewistoclassifytheexistinghumanmutationdatabases,includingmutationdatabase,SNP(singlenucleotidepolymorphisms)databases,mutationdatabasesaboutdisease,mutationdatabasesaboutproteins,mutationdatabasesaboutmapandmutationinformationaboutspecificgene.Wealsogiveadviceonhowtoutilizethesemuta2tiondatabases,anddiscussproblemsofexistingdatabases.Keywords:mutationdatabase;geneticmutation;singlenucleotidepolymorphisms近年来,人类基因组计划(humangenomepro2ject,HGP)取得了重大进展,在美国、英国、日本、法国、德国和中国20个研究课题组的共同合作下,于2000年6月完成人类基因组测序工作框架图,2001年2月又公布了全序列的完成图。现有的研究结果表明,人类基因组含有3~4万个蛋白质编码基因[1]。随着人类基因组计划的进展,全面深入地研究人类基因组序列突变成为可能,且日益显示其重要性。序列突变为定位疾病易感基因和探索其作用机制提供了线索,突变分析还能帮助确定基因组的高突变区域和提供DNA突变、复制、修复机制研究的前景,有关突变机制的知识和突变相关的基序的确认能改进突变扫描和确认的策略,而突变和多态数据库的产生为科学家们进行相关领域的研究提供了重要的辅助工具。目前人们越来越关注单核苷酸多收稿日期:20030627;修回日期:20031112基金项目:973基金(No.2001AA221071)、国家自然科学基金(No.30200365)[SupportedbyNationalHighTechnologyResearchandDevelopmentProgramofChina(No.2001AA221071)andNationalNatureScienceFoundationofChina(No.30200365)]作者简介:庄永龙,(1977),男,江苏,博士研究生,研究方向:生物信息学。Email:zhuangyl99@mails.tsinghua.edu.cn;周敏,(1976),女,博士研究生,研究方向:生物信息学;此两位作者为并列第一作者通讯作者:李衍达,(1936-),男,院士,研究方向:生物信息学。Tel:010-62783081,Email:daulyd@mail.tsinghua.edu.cn4期庄永龙等:人类遗传突变数据库及其应用515态性(singlenucleotidepolymorphisms,SNPs),单核苷酸多态性是一种DNA突变,占全部基因组DNA突变的90%左右[2],在人类基因组中每相隔1kb就有一个SNP[3]。作为新一代的遗传标记(第一代的遗传标记是RFLP,第二代是各种短串联重复序列STR标记),这类多态性对群体遗传学、药物开发、法医学、癌症和遗传疾病甚至进化的研究起到了重要的作用。寻找研究SNP已成为人类基因组计划的内容和目标之一,计划制作出覆盖全基因组的至少为10万个SNP的图谱。网上有许多与突变和SNP相关的数据库贮存了从各种来源得到的研究结果,为研究者们提供了丰富的数据。本文根据目前与人类突变相关的各种数据库的功能,对目前的人类突变相关数据库资源部分是无害的突变。GDB的数据是...