“人類基因組不再是一個空殼了。”國際科學界5日宣布,“DNA元素百科全書”計劃(簡稱ENCODE)獲得了迄今最詳細的人類基因組分析數(shù)據(jù),以30篇論文的形式同時發(fā)表在英國《自然》雜志等多份學術刊物上。
人類基因研究再突破
這是“人類基因組計劃”之后國際科學界在基因研究領域取得的又一重大進展。人類基因組計劃讓我們得到了人類基因組圖譜,但其中許多基因過去都不知道有什么功能。研究者最常關注的是與編碼蛋白質相關的基因,但它們只占整個基因組的約2%。一個聚集了422位科學家的國際團隊,完成了解析基因組剩余部分(非編碼區(qū)域)的工作,人類基因組中約80%的基因都有某種確定的功能。
參與這項計劃的英國桑格研究所研究人員珍妮弗·哈羅說,如果說人類基因組計劃提供了一張地圖,那么ENCODE計劃就在這張地圖上標出了各個基因的功能信息。
這兩個計劃之間也有承上啟下的關系,在人類基因組計劃基本完成的2003年,國際科學界創(chuàng)建了ENCODE計劃。這也是一個大型國際合作項目,來自美國、英國、西班牙、日本和新加坡五國32個研究機構的科學家參與了此次項目,耗資1.5億美元。他們獲得并分析了超過15萬億字節(jié)的原始數(shù)據(jù),目前已經(jīng)全部公布。研究對147個組織類型進行了分析,以確定哪些能打開和關閉特定的基因,以及不同類型細胞之間的“開關”存在什么差異。
中科院北京基因組研究所副研究員嚴江偉認為,如果說人類基因組序列只是確定了字典里的字,現(xiàn)在ENCODE計劃等于為這些字加了注釋。“比如說研究先天性心臟病就可以去查心臟方面的基因。但目前人類基因功能的研究成果還是基礎研究,離應用研究還有一段距離。”
“垃圾DNA”并非垃圾
基因是遺傳的基本單位,到上世紀60年代,科學家認為基因是用以制造蛋白的DNA編碼。人類基因組中2.1萬個蛋白質編碼基因只占了整個基因組的1.2%,那么,其余98.8%的基因是做什么的?1972年,日本遺傳學家大野干給這些不能編碼蛋白質的DNA片段起了個名字,叫做“垃圾DNA”。
ENCODE項目的一個主要目的就是去分析那些“垃圾”的功能。經(jīng)過ENCODE合作項目的初步努力,現(xiàn)在科學家們可以說“80%的基因組是有功能的”。
其余的20%也不是垃圾,該項目的首席分析員伊萬·伯尼解釋說,雖然ENCODE只分析了147種不同類型的細胞,但總數(shù)上千。如果還檢測其他類型的細胞,功能可能會出現(xiàn)比例分化。“這就像是從80%到100%,”伊萬·伯尼說,“我們真的沒有任何多余的大區(qū)域DNA。這個‘垃圾’的比喻沒有多大用處。”
開關調控基因活性
人類基因組中的“垃圾DNA”實際上是一個龐大的控制面板,能調控數(shù)以百萬計基因的活性。如果沒有這些開關調控,基因將不能正常工作,而這些區(qū)域也許會導致人類患上疾病。
從遺傳學角度來看,同卵雙生的孿生子具有完全相同的基因組。但是雙胞胎即使在同樣的生活環(huán)境下也會表現(xiàn)不同的性格,這是因為基因活性是不同的,同樣的基因,有些基因活性大,有些活性小。
比如一種叫柳穿魚的花卉,大多是對稱的白色花瓣,有一些卻長成黃色五角星。這兩種花是同一種植物,樣子不同并不是因為它們的基因有差異,而是因為DNA甲基化模式讓一些基因“閉嘴”,這個基因活躍的時候花就是左右對稱的,如果它沉默,花朵就變成軸對稱。
這樣的例子在植物中很多,在動物中也被發(fā)現(xiàn)不少,甚至可以幫助了解癌癥起源。長久以來,人們了解到,當DNA發(fā)生變異時細胞很容易發(fā)生癌變。最近的一些研究表明,當表觀遺傳標記被干擾時,細胞也會更容易發(fā)生癌變,因為那些至關重要的基因被關閉了,而那些應當被關閉的基因卻被打開了。
正如同人類基因組計劃帶給生物醫(yī)學研究領域的革新意義,ENCODE項目也將推動生物醫(yī)學的前進,開辟研究新道路。這份基因組功能圖譜,其中包含有400萬基因的“開關”,這一重要的參考數(shù)據(jù)將有助于研究人員找到與人類疾病密切相關的區(qū)域。
專家訪談
人類基因“天書”有了注解
——專訪中科院北京基因組研究所曾長青研究員
記者:ENCODE計劃的成果對人類有何意義?
曾長青:意義非常重大。完成了人類基因組計劃和國際單體型圖計劃,相當于讓我們知道了我們的基因組的DNA排序與個體之間的差異。而ENCODE計劃則是分析在DNA序列上的各種功能信息,例如了解除了編碼蛋白的序列之外,在基因上或基因周邊還有哪些序列促進或抑制一個基因的表達,以及這些功能元件各自以什么樣的方式發(fā)揮作用。這相對于在全基因組范圍內,即在人類基因組這本天書上,加上了對于重要字詞、句式的注解,使我們能夠解讀天書中這些字句的含義。
記者:了解基因的功能有什么作用?對人類治療某些疾病有幫助嗎?
曾長青:ENCODE對于DNA上調控基因表達的體系做了詳細和深入的解析,這些知識結合其它研究所獲得的大量疾病相關基因,就可能幫助科學家針對這些基因的關鍵元件設計藥物靶點,或者針對不同個體易感基因上功能元件的多態(tài)性設計個體化治療方案,達到有的放矢的治療目的。另外,很多基因產(chǎn)物,例如多種有分解作用的酶蛋白參加藥物的代謝,了解了這些基因的功能元件,就可以根據(jù)這些元件上的遺傳多樣性檢測不同個體對于藥物的反應和代謝能力,從而設計個體特異的用藥方案,使藥物治療更加合理和準確有效。
記者:我國人類基因組學研究有哪些進展?
曾長青:我國雖然沒有直接參加ENCODE計劃,但像全球其他研究人員一樣,很多中國學者也在進行類似的探索。只是大家多是針對某一類型的功能元件或是某一區(qū)域的元件進行的研究,而ENCODE的研究則非常全面和系統(tǒng),在整個基因組范圍研究所有功能元件的類型、特點與機制。所有這些工作同ENCODE計劃的結果都對于徹底讀懂、讀通人類基因組這本天書有重要意義。此外,我國參加貢獻了1%和10%的人類基因組計劃和國際單體型圖計劃,這兩個計劃所獲得的對于基因組序列和多態(tài)性的信息正是ENCODE得以開展的基礎。(北京日報)