舒爾金娜與哈佛大學(xué)生物學(xué)家Sean Eddy在《eLife》雜志的一篇新論文中描述了一種全新電腦程序,,可以讀取任何基因組序列并破譯其遺傳密碼。這個(gè)名為Codetta的程序有可能幫助科學(xué)家擴(kuò)大對(duì)遺傳密碼如何演變的理解,,并正確解釋新測(cè)序生物體的遺傳密碼,。
遺傳密碼是一套規(guī)則,告訴細(xì)胞如何將核苷酸的三個(gè)字母組合解釋為蛋白質(zhì),,通常被稱為生命的組成部分,。幾乎每個(gè)生物體,從大腸桿菌到人類,,都使用相同的遺傳密碼,。這就是為什么該代碼曾經(jīng)被認(rèn)為是一成不變的。但是科學(xué)家們已經(jīng)發(fā)現(xiàn)了少數(shù)離群索居的生物體,,即使用替代性遺傳密碼的生物體存在著一套不同的指令,。
這就是Codetta可以大顯身手的地方。該程序可以幫助識(shí)別更多使用這些替代性遺傳密碼的生物體,,幫助揭示遺傳密碼甚至發(fā)生變化的新線索,。目前,Codetta已經(jīng)分析了超過25萬個(gè)細(xì)菌和其他被稱為古細(xì)菌的單細(xì)胞生物基因組序列,,以尋找替代的遺傳密碼,,并且已經(jīng)發(fā)現(xiàn)了五種從未見過的情況。在所有五個(gè)案例中,,氨基酸精氨酸的代碼被重新分配到一個(gè)不同的氨基酸上,。據(jù)信這標(biāo)志著科學(xué)家首次在細(xì)菌中看到這種交換,并可能暗示改變遺傳密碼的進(jìn)化力量,。
研究人員說,,這項(xiàng)研究標(biāo)志著對(duì)替代遺傳密碼的大篩選。Codetta基本上分析了所有可獲得的細(xì)菌和古細(xì)菌的基因組,。該程序的名稱是密碼子和羅塞塔石碑之間的交叉,,羅塞塔石碑是一塊刻有三種語言的石板,密碼子是由三個(gè)核苷酸組成的,,構(gòu)成了遺傳密碼的一部分,。
舒爾金娜在過去五年中發(fā)展了Codetta背后的統(tǒng)計(jì)理論,編寫程序,,測(cè)試它,,然后分析基因組,。它的工作原理是讀取生物體的基因組,然后利用已知的蛋白質(zhì)數(shù)據(jù)庫來產(chǎn)生一個(gè)可能的遺傳密碼,。它與其他類似方法不同,,因?yàn)樗梢苑治龌蚪M的規(guī)模。舒爾金娜在2016年加入了艾迪的實(shí)驗(yàn)室,,該實(shí)驗(yàn)室專門從事基因組的比較,,在她設(shè)計(jì)的解讀遺傳密碼的算法上向他尋求建議。
到目前為止,,還沒有人對(duì)替代性遺傳密碼做如此廣泛的調(diào)查,。該系統(tǒng)有可能被用來確保存放蛋白質(zhì)序列許多數(shù)據(jù)庫的準(zhǔn)確性。研究人員說,,這項(xiàng)工作的下一步是利用Codetta搜索病毒,、真核生物以及線粒體和葉綠體等有機(jī)體基因組中的替代編碼。