清華新聞網(wǎng)5月21日電 5月19日,國際知名學(xué)術(shù)期刊《核酸研究》(Nucleic acids research)以“突破性研究論文(Breakthrough Article)”形式在線發(fā)表了清華大學(xué)自動(dòng)化系副教授汪小我課題組題為“基于深度生成式模型的大腸桿菌合成啟動(dòng)子設(shè)計(jì)“(Synthetic promoter design inEscherichia colibased on a deep generative network) 的研究論文。該項(xiàng)研究首次用人工智能方法設(shè)計(jì)產(chǎn)生全新的基因啟動(dòng)子,為生物調(diào)控元件的設(shè)計(jì)和優(yōu)化提供了嶄新的手段。

智能設(shè)計(jì)-實(shí)驗(yàn)驗(yàn)證-循環(huán)優(yōu)化
基因調(diào)控元件作為搭建合成生物系統(tǒng)的基石,在代謝工程、基因治療等領(lǐng)域有廣泛用途。工程生物系統(tǒng)的構(gòu)建需要大量具有優(yōu)良性能的調(diào)控元件作為支撐,以適配不同底盤細(xì)胞和工作環(huán)境的需求。過去,人工元件的獲取主要通過對自然元件的簡單改造,例如通過對天然序列的隨機(jī)突變、功能片段拼接組合等方法,結(jié)合定向進(jìn)化等實(shí)驗(yàn)來篩選獲得新的元器件。這些方法一方面成功率低,另一方面通常只能獲得與天然序列非常相似的元件,難以發(fā)現(xiàn)全新的調(diào)控元件。以100堿基長度的序列為例,其潛在的序列組合達(dá)到了4100種可能,但天然的元件僅占其中很小一部分,潛在的序列空間遠(yuǎn)超目前實(shí)驗(yàn)文庫的篩選能力。
隨著人工智能和大數(shù)據(jù)時(shí)代的到來,深度學(xué)習(xí)技術(shù)在復(fù)雜對象的特征表征、多模態(tài)融合、樣本自動(dòng)生成等問題中表現(xiàn)出獨(dú)特的優(yōu)勢,為生物分子的設(shè)計(jì)提供了新的可能。該研究將人工智能技術(shù)應(yīng)用于構(gòu)建全新的基因調(diào)控元件,從自動(dòng)化設(shè)計(jì)的角度,利用深度學(xué)習(xí)技術(shù)并融合生物先驗(yàn)知識來建立調(diào)控元件的生成模型。通過在計(jì)算機(jī)中的算法尋優(yōu)部分替代生物實(shí)驗(yàn)上的隨機(jī)搜索,可以大大提高實(shí)驗(yàn)的成功率。課題組在大腸桿菌中成功實(shí)現(xiàn)了全新基因啟動(dòng)子的設(shè)計(jì)與生成。該方法可以產(chǎn)生大量全新的啟動(dòng)子,經(jīng)過迭代優(yōu)化后實(shí)驗(yàn)驗(yàn)證成功率已超過 70%。這些由人工智能方法設(shè)計(jì)的全新元件具備了天然元件關(guān)鍵特征的統(tǒng)計(jì)特性,并同時(shí)具有一些非天然典型的序列模體,在整體序列排布上可以做到與天然啟動(dòng)子很低的相似性,降低了與天然基因組的同源重組風(fēng)險(xiǎn)。同時(shí),優(yōu)化后的人工元件可以具備比天然序列更高的轉(zhuǎn)錄活性。理論上,該方法可以產(chǎn)生數(shù)量遠(yuǎn)遠(yuǎn)超過天然啟動(dòng)子的全新元件,極大地豐富了可用于工程生物學(xué)研究的調(diào)控元件庫。
該研究從實(shí)踐上證明了利用人工智能方法創(chuàng)造全新生物調(diào)控元件的可行性,對推動(dòng)工程生物系統(tǒng)更加高效、安全、可控的智能化設(shè)計(jì)與構(gòu)建具有重要意義。人工智能技術(shù)與工程生物技術(shù)的交叉,未來將可能對促進(jìn)代謝工程、分子育種、基因治療等領(lǐng)域的發(fā)展產(chǎn)生深遠(yuǎn)影響。
該論文被《核酸研究》期刊編委會推選為突破性研究論文(Breakthrough Article)進(jìn)行亮點(diǎn)報(bào)道(占該雜志所有發(fā)文量的1-3%)。突破性研究論文入選標(biāo)準(zhǔn)是“回答了在核酸研究領(lǐng)域的長期關(guān)鍵性問題,開辟了新的研究領(lǐng)域,代表該刊發(fā)表的最具影響力和創(chuàng)新性的研究成果。”
自動(dòng)化系長聘副教授汪小我為論文的通訊作者,自動(dòng)化系博士生王也、王昊晨為論文共同第一作者,自動(dòng)化系博士后魏磊、教師劉莉揚(yáng)和生命學(xué)院本科生李帥霖為論文共同作者。該項(xiàng)研究受到國家自然科學(xué)基金創(chuàng)新研究群體項(xiàng)目的經(jīng)費(fèi)資助。
原文鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa325/5837049
《核酸研究》期刊官網(wǎng)“突破性論文”介紹鏈接:
http://www.narbreakthrough.com
供稿:自動(dòng)化系
編輯:李晨暉
審核:程曦