原標(biāo)題:人工智能設(shè)計(jì)出數(shù)千個(gè)新DNA開關(guān)
科技日報(bào)北京10月23日電 (記者張夢然)據(jù)《自然》雜志23日發(fā)表的論文,美國杰克遜實(shí)驗(yàn)室、麻省理工學(xué)院和哈佛大學(xué)布羅德研究所以及耶魯大學(xué)的團(tuán)隊(duì)利用人工智能(AI)技術(shù)設(shè)計(jì)出數(shù)千個(gè)新的DNA開關(guān)。這些新設(shè)計(jì)的元件能夠精準(zhǔn)控制基因在不同類型細(xì)胞中的表達(dá),為人類健康與醫(yī)學(xué)研究提供了前所未有的可能性。
盡管近年來,基因編輯和其他基因治療手段已讓科學(xué)家能夠在活細(xì)胞中修改基因,但要在不干擾整個(gè)生物體的情況下,只對某一類型的細(xì)胞進(jìn)行基因干預(yù),依然存在挑戰(zhàn)。這主要是因?yàn)閷τ诳刂苹蜷_啟和關(guān)閉的DNA開關(guān)——順式調(diào)節(jié)元件(CRE)的理解還不夠深入。此次創(chuàng)新的核心在于,新方法可以針對特定的細(xì)胞類型來提高或降低基因表達(dá),卻不會影響到身體其他部分。
團(tuán)隊(duì)采用了深度學(xué)習(xí)算法,基于數(shù)十萬個(gè)人類基因組中的DNA序列訓(xùn)練了一個(gè)模型。通過這個(gè)模型,他們可在實(shí)驗(yàn)室環(huán)境中測量3種細(xì)胞(血液、肝臟和大腦)中CRE的活性。該AI模型可預(yù)測任意序列的活性,從而揭示了DNA中新的模式以及CRE序列的語法是如何影響RNA生成量的。
基于上述發(fā)現(xiàn),團(tuán)隊(duì)構(gòu)建了名為CODA(計(jì)算優(yōu)化DNA活性)的平臺。通過結(jié)合實(shí)驗(yàn)數(shù)據(jù)和計(jì)算建模的迭代過程,該平臺不斷改進(jìn)其預(yù)測CRE生物學(xué)效應(yīng)的能力,成功設(shè)計(jì)出了自然界中未曾出現(xiàn)過的CRE。
經(jīng)過測試,新設(shè)計(jì)的合成CRE表現(xiàn)出了比天然存在的CRE更優(yōu)異的細(xì)胞類型特異性。它們不僅包含了促進(jìn)目標(biāo)細(xì)胞類型中基因表達(dá)的序列,還含有抑制非目標(biāo)細(xì)胞類型中基因表達(dá)的元素。目前,團(tuán)隊(duì)已在斑馬魚和小鼠身上驗(yàn)證了幾種合成CRE序列的有效性。
這一突破性進(jìn)展意味著,未來可能實(shí)現(xiàn)更加精確和個(gè)性化的基因療法,為預(yù)防和治療疾病開辟了新途徑。
在生物體內(nèi),并不是所有基因都會在合適的細(xì)胞和合適的時(shí)間點(diǎn)發(fā)揮作用。CRE的功能,就在于確保適當(dāng)?shù)幕蛟谡_的時(shí)間、正確的地點(diǎn)被激活。譬如,避免皮膚細(xì)胞使用了大腦所需的基因,或是防止成人體內(nèi)激活僅在早期發(fā)育階段需要的基因。此次團(tuán)隊(duì)不僅合成了全新的CRE,還展示了如何使用這些CRE選擇性地激活大腦、肝臟或血液細(xì)胞中的基因,同時(shí)確保這些基因在其他類型的細(xì)胞中保持沉默。這在生物醫(yī)學(xué)和技術(shù)上具有雙重重要意義。