长春花密码子使用偏好性分析[摘要]以长春花为研究对象,分析其密码子使用偏好性,以期为相关基因的异源表达、基因的预测、物种的进化研究提供指导。该研究以长春花的30437条蛋白质编码序列为数据来源,对长春花密码子组成和密码子偏性的各项参数进行了计算和统计分析。计算了长春花祜类卩引喙牛物碱(terpenoidindolealkaloids,TIAs)生物合成途径中25个关键酶基因含有大肠杆菌或酿酒酵母稀有密码子的比例。结果显示,长春花基因的平均GC量为42.47%,密码子第3位碱基平均GC量为35.89%。长春花屮共有28个密码子的同义密码子相对使用度(relativesynonymouscodonusage,RSCU)大于1,其中26个以A或T结尾。25个关键酶基因含有大肠杆菌稀有密码子的比例明显高于酿酒酵母稀有密码子的比例。长春花主要偏爱使用以A和T结尾的密码子;相比于酿酒酵母,其密码子使用特点与大肠杆菌的差异更大,推测酿酒酵母可能是长春花基因更合适的异源表达宿主。[关键词]长春花;基因组;密码子偏好性;诂类口引喙生物碱;生物合成途径CodonusdgebiasofCatharanthusroseusLIYingl,KUANGXuejunl,ZHUXiaoxuanl,ZHUYingjie2,SUNChaol*(1.InstituteofMedicinalPlantDevelopment,ChinaAcademyofMedicalScienccsandPekingUnionMedicalCollege,Beijing100193,China;2.InstituteofChineseMateriaMedica,ChinaAcademyofChineseMedicalSciences,Beijing100700,China)[Abstract]Thisstudyaimedtoprovideguidancefortheheterogenousgeneexpression,gcnopredictionandspeciesevolutionbyanalyzingcodonusagebiasofCatharanthusroseus.Thecodoncompositionandusagebiasof30437highconfidencecodingsequencesfromC.roseuswereanalyzedandtheproportionofrarecodonsofEscherichiacoliandSaccharomycescerevisiaein25genesinvolvedinthebiosynthosisofterpenoidindolealkaloids(TIAs)inC.roseuswerecalculated.TheresultsshowedthattheaverageGCcontentofthegeneswas42.47%;theaverageGCcontentofthethirdbasesincodonwas35.89%.Therelativesynonymouscodonusage(RSCU)of28codonsweregreaterthan1and26ofthemendedwithAorT.Theabove25gonosinvolvcdinTIAbiosynthesiscontainedmuchmorerarecondonsofE・colithanthatofS・cerevisiae.ItwasconeludedthatC・roseusmainlypreferedthecodonsendingwithAorTandtheruleofcodonusagewasmoredifferenttoE.colithanS.cerevisiae.Thus,S・cerevisiaemaybemoresuitablehostforheterologousexpressionofthesegenes.[Keywords]Catharanthusroseus;genome;codonbias;terpcnoidindolealkaloids;biosyntheticpathwaysdoi:10.4268/cjcmm20162213长春花Catharanthusroseus(L.)G・Don为夹竹桃科长春花属多年生草本植物,既是一种广泛栽培的观赏花卉,也是研究祜类卩引味生物碱合成的重耍药用模式植物。到冃前为止,已从长春花中分离出的生物碱达130个以上[1],主要是TIAs,其中一些已经在现代医疗领域得到了广泛的应用[2]。如长春碱和长春新碱,现已被广泛应用于何杰金氏病、恶性淋巴肿瘤、急性淋巴细胞型白血病、绒毛上皮细胞癌以及一些其他癌症的治疗;阿玛碱和蛇根碱作为高效降压药物在临床中使用;文多灵和长春质碱具有明显的降血脂作用[3]。密码子是牛物体信息传递的基本单位,一个氨基酸的密码子可以有1个或最多6个,编码同一个氨基酸的密码子叫同义密码子[4]。同一个物种的不同基因或不同物种同义密码子的使用频率不同,一些密码子使用频率更高,这种不均衡使用的现象称为密码子使用偏好性(codonusagebias,CUB)[45]。许多证据表明,密码子使用偏好性是突变压力和口然选择的结果[67]。此外,还和mRNA二级结构和稳定性[8],翻译的速度和准确度[9],蛋白质折叠[10]等因素有关。