清華新聞網(wǎng)12月24日電 自新冠病毒流行以來,盡管重癥率降低,但是不斷出現(xiàn)的變異株導(dǎo)致突破性感染不斷發(fā)生。病毒的快速突變給疫苗和藥物干預(yù)帶來重大障礙,也為潛在的下一次大流行提供了可能。與此同時,現(xiàn)有模型尚未能將病毒突變的規(guī)律性和隨機性與最小數(shù)據(jù)和快速響應(yīng)需求整合起來。為此,清華大學(xué)基礎(chǔ)醫(yī)學(xué)院程功教授團隊與合作者開發(fā)了一種簡潔有效的語言模型,同時考慮病毒突變的規(guī)律性和隨機性,以預(yù)測可能流行的病毒變體和突變。
該模型通過構(gòu)建刺突蛋白S1序列的“語法框架”實現(xiàn)數(shù)據(jù)降維和語義表示,以把握模型的潛在規(guī)律性。同時,引入了“突變輪廓”的概念,即突變頻率,以納入隨機性。結(jié)合濕實驗驗證,這一模型成功地識別并驗證了多種具有顯著增強病毒傳染性和免疫逃逸能力的新冠變體。

病毒預(yù)測語言模型的建立
研究人員通過不斷更新三個不同時間點的序列數(shù)據(jù)(2022-2024),在XBB.1.16、EG.5、JN.1和BA.2.86等毒株的流行株或關(guān)鍵突變出現(xiàn)之前,便成功地將其預(yù)測。除此以外,研究結(jié)果還預(yù)測了可能導(dǎo)致未來流行病的未知變體。
這一研究不僅為理解新冠的變異提供了新的視角,也為新冠病毒疫苗和治療策略的開發(fā)提供了寶貴的信息。隨著新冠病毒的持續(xù)演變,這種模型的應(yīng)用將有助于全球公共衛(wèi)生界更好地準備和應(yīng)對未來的挑戰(zhàn)。
相關(guān)研究成果以“一種用于預(yù)測SARS-CoV-2演化的語言模型”(A predictive language model for SARS-CoV-2 evolution)為題,于12月23日發(fā)表于《信號轉(zhuǎn)導(dǎo)與靶向治療》(Signal Transduction and Targeted Therapy)。
清華大學(xué)基礎(chǔ)醫(yī)學(xué)院教授程功、軍事醫(yī)學(xué)研究院研究員魏從文、清華大學(xué)核研院博士后郭璇為論文通訊作者。清華大學(xué)基礎(chǔ)醫(yī)學(xué)院2020級博士生麻恩浩與郭璇為論文共同第一作者。研究得到科技部國家重點研發(fā)計劃、國家自然科學(xué)基金、深圳市醫(yī)學(xué)專項、深圳灣實驗室科研項目基金、深圳市“三名工程”、西南聯(lián)合研究生院科技項目、新基石科學(xué)基金和騰訊基金科學(xué)探索獎的支持。
論文鏈接:
https://doi.org/10.1038/s41392-024-02066-x
供稿:基礎(chǔ)醫(yī)學(xué)院
編輯:李華山
審核:郭玲