清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng),、歐洲科學(xué)院外籍院士孫茂松近日在北京接受中新網(wǎng)記者專訪時(shí)稱,,中國(guó)科技公司在大模型領(lǐng)域掀起的開(kāi)源浪潮向全球發(fā)出了中國(guó)“強(qiáng)音”,其技術(shù)在獲得國(guó)際認(rèn)可的同時(shí),,悄然扭轉(zhuǎn)了全球大模型文化,。
中國(guó)大模型領(lǐng)域已然掀起開(kāi)源熱潮。孫茂松表示,,DeepSeek的出現(xiàn)以及通義千問(wèn)的系列開(kāi)源產(chǎn)品極大推動(dòng)了國(guó)際大模型的開(kāi)源路線,,這對(duì)突破技術(shù)壟斷,促進(jìn)技術(shù)平權(quán),,提升人工智能的普惠性,,無(wú)疑具有十分重要的作用。
但孫茂松也直言,,長(zhǎng)期以來(lái),,在國(guó)際學(xué)術(shù)界,英語(yǔ)及以其為載體的文化作為強(qiáng)勢(shì)語(yǔ)言和文化在國(guó)際上占據(jù)主導(dǎo)地位,,中文內(nèi)容常常處于相對(duì)弱勢(shì),。在同等條件下,國(guó)際上更習(xí)慣使用西方開(kāi)源的基座模型,,這種“文化差異”造成的環(huán)境挑戰(zhàn),,需要付出加倍的技術(shù)努力才能克服。
不過(guò)上述局面在過(guò)去一年發(fā)生了顯著改變,?!敖陙?lái)國(guó)際開(kāi)源界比較知名的是LLaMA(Meta公司旗下人工智能模型),但是從去年開(kāi)始,,我覺(jué)得千問(wèn)已經(jīng)反超了,。”
他進(jìn)一步說(shuō),,目前從學(xué)術(shù)論文的角度來(lái)看,國(guó)際上很多研究都是基于千問(wèn)進(jìn)行,。在同樣尺寸的模型比較中,,有些效果在LLaMA上可能無(wú)法實(shí)現(xiàn),但在阿里千問(wèn)上卻可以做出來(lái),,這也充分說(shuō)明千問(wèn)的小模型性能更優(yōu),。
從這個(gè)典型例子來(lái)看,,孫茂松認(rèn)為,這意味著中國(guó)的大模型“文化”在國(guó)際上得到認(rèn)可,,這一點(diǎn)表面看上去似乎“波瀾不驚”,,但其實(shí)非常難能可貴。
最新消息顯示,,4月29日凌晨,,新一代通義千問(wèn)模型Qwen3(千問(wèn)3)宣布開(kāi)源,總共涉及8款不同尺寸的千問(wèn)3模型,。據(jù)悉,,阿里通義已開(kāi)源200余個(gè)模型,全球下載量超3億次,,其衍生模型數(shù)超10萬(wàn)個(gè),,超越美國(guó)Llama,成為全球第一開(kāi)源模型,。
以DeepSeek,、Qwen為代表的中國(guó)開(kāi)源模型實(shí)現(xiàn)先進(jìn)模型的參數(shù)權(quán)重、推理邏輯和工具鏈條的全開(kāi)源,,正在打開(kāi)人工智能商用的新局面,。
“盡管DeepSeek總體上是一個(gè)‘從1到2’的創(chuàng)新,但在人工智能反饋強(qiáng)化學(xué)習(xí)方面是開(kāi)源大模型中走得最遠(yuǎn)的,,將人類反饋?zhàn)兂闪巳斯ぶ悄芊答?。”談到DeepSeek時(shí),,孫茂松說(shuō),。
孫茂松特別強(qiáng)調(diào)了小模型的重要價(jià)值。從應(yīng)用的角度,,小模型可降低成本,,拓展應(yīng)用的普及度;從研究的角度,,小模型可有助于高??蒲袡C(jī)構(gòu)應(yīng)對(duì)資源約束帶來(lái)的研究挑戰(zhàn),這些都有很強(qiáng)的必要性,。
在他看來(lái),,大模型做得越好,就能衍生出越優(yōu)秀的小模型,;而在小尺度模型上的深入研究,,也能為大模型的發(fā)展提供重要啟發(fā)。
“基礎(chǔ)模型必須要有靈性,,要有慧根,?!睂O茂松說(shuō),就好比一個(gè)人比較聰穎,、機(jī)靈,,稍微點(diǎn)撥兩句就能領(lǐng)悟?;A(chǔ)模型有靈性,,才能比較容易達(dá)至“孺子可教也”的成效,不管是進(jìn)行更高層次的學(xué)習(xí)還是應(yīng)用都會(huì)更為順暢,。
在科學(xué)計(jì)算等前沿領(lǐng)域,,AI for Science(人工智能驅(qū)動(dòng)的科學(xué)研究)正成為重要突破口?!斑@是一個(gè)對(duì)基礎(chǔ)科學(xué)研究乃至顛覆性創(chuàng)新技術(shù)發(fā)展具有深刻意義的方向,,因?yàn)榇竽P蛯?duì)復(fù)雜系統(tǒng)的處理能力遠(yuǎn)超傳統(tǒng)方法?!?/p>
孫茂松認(rèn)為,,AI for Science的基本定位是啟發(fā)人類,作為人類科研工作者的重要補(bǔ)充,,或者彌補(bǔ)人類思考的闕如,,或者成百倍、成千倍地提高效率,。
對(duì)于未來(lái)發(fā)展,,孫茂松認(rèn)為,中國(guó)AI領(lǐng)域?qū)⒃诟邔哟紊厦媾R能力上的重要考驗(yàn),?!爱?dāng)你追趕到并駕齊驅(qū)的位置時(shí),下一步該往哪里走,?這呼喚我們?cè)诨A(chǔ)研究方面提出更深刻的學(xué)術(shù)思想和更具根本性的解決方案,。”他強(qiáng)調(diào),,中國(guó)必須在保持關(guān)鍵技術(shù)創(chuàng)新的同時(shí),,更加注重“從0到1”的原創(chuàng)性思想的培育和激發(fā)。
編輯:李華山