麻豆影视文化传媒在线看|果冻传媒91制片厂麻豆|性色网站|国产成人吃瓜网|麻豆文化传媒百度云|韩国黄色一级黄色片|成人电影区|糖心vlog是真的吗|黄瓜视频丝瓜视频香蕉视频|国产精品视频在一区鲁鲁,性感丰满美乳巨乳,蜜桔影院91制片厂,爱豆传媒陈可心作品名字

清華主頁 - 清華新聞 - 清華思客 - 正文

張亞勤:熱議的“中國版ChatGPT”,如何理解其意義?

來源:三聯(lián)生活周刊微信號(hào) 3-31 張宇琦

“經(jīng)過這兩次大的產(chǎn)業(yè)升級(jí)之后,中國在數(shù)字化支付、網(wǎng)絡(luò)、用戶終端,基本上都和美國在同一陣線,比其他所有國家都要好。我們?cè)谧罡叨说挠?jì)算芯片、算法系統(tǒng)和一些大的平臺(tái)性技術(shù)方面,現(xiàn)在感覺到是有些距離。但我覺得中國的創(chuàng)業(yè)者、工程師和科研人員,一旦把資源集中,并且有耐心,是可以趕上的。有很多挑戰(zhàn),但我還是充滿信心。”

盡管中國是ChatGPT未開放服務(wù)的區(qū)域之一,但2023年2月初,在ChatGPT正式發(fā)布兩個(gè)月后,這一聊天機(jī)器人程序在中國的熱度開始走高——與之相關(guān)的話題多次登上社交媒體熱搜榜單,A股市場(chǎng)上ChatGPT概念股板塊歷經(jīng)多番漲停潮,百度、阿里、京東、網(wǎng)易等科技公司相繼宣布推出或研發(fā)對(duì)標(biāo)產(chǎn)品的計(jì)劃。

在ChatGPT和同類產(chǎn)品引發(fā)持續(xù)熱議的當(dāng)下,大模型技術(shù)正在觸發(fā)IT行業(yè)怎樣的變革?我們應(yīng)該如何理解“中國版ChatGPT”的意義?在新一輪行業(yè)爆發(fā)期,中國AI產(chǎn)業(yè)會(huì)面臨怎樣的挑戰(zhàn)與機(jī)遇?就這些問題,本刊專訪了清華大學(xué)智能科學(xué)講席教授、智能產(chǎn)業(yè)研究院(AIR)院長、中國工程院院士張亞勤。

在學(xué)術(shù)界和工業(yè)界,以及人工智能前沿研究與產(chǎn)業(yè)應(yīng)用領(lǐng)域,張亞勤都有著堪稱輝煌的履歷。他在1997年成為IEEE(電氣電子工程師學(xué)會(huì))歷史上獲授會(huì)士榮譽(yù)最年輕的科學(xué)家;自上世紀(jì)90年代末起,曾在微軟公司工作16年,歷任微軟亞洲研究院院長兼首席科學(xué)家、微軟中國董事長等職位;在2014年9月到2019年10月之間擔(dān)任百度公司總裁。2019年底,張亞勤正式受聘于清華大學(xué),牽頭組建清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)。

大模型重構(gòu)行業(yè)生態(tài)

三聯(lián)生活周刊:ChatGPT的出圈代表了大模型的第一次成功嗎?

張亞勤:如果ChatGPT是指的一個(gè)產(chǎn)品,那它是大模型產(chǎn)品化和大眾化的最大成功。大模型已經(jīng)做了多年了,2020年GPT3.0的出現(xiàn)可以算是大模型的第一次成功。只不過那個(gè)模型更多是給專業(yè)人員用的,但在技術(shù)界已經(jīng)有很大的震動(dòng)。ChatGPT第一次有一個(gè)界面讓普通用戶使用。去年12月初,它剛剛出來的時(shí)候,我也注冊(cè)了,簡單用了一下,第一感覺是做得真好,會(huì)出很多錯(cuò),但語言能力很強(qiáng),后面又看到它很大的進(jìn)步。實(shí)際上,從GPT3.0到GPT3.5,做了兩年多,算法本身當(dāng)然改進(jìn)很多,但數(shù)據(jù)工程和系統(tǒng)工程尤其成功。算法里很大的改善是InstructGPT以及多了有人類反饋的強(qiáng)化學(xué)習(xí)(reinforcement learning from human feedback),用的人越多,迭代越快。那么現(xiàn)在GPT4就更不得了,功能比GPT3.5大多了。

但對(duì)我來說,ChatGPT更大的震撼在于它如此受歡迎!不到兩個(gè)月的時(shí)間就有了上億個(gè)月活用戶。其實(shí)生成式AI,在過去這兩年是進(jìn)展最快的技術(shù)。比如在AI作圖方面,有DALL-E、Midjourney、Stable Diffusion這些產(chǎn)品出來。我們學(xué)院也研究這類技術(shù),比如自動(dòng)駕駛的仿真模擬,也需要在機(jī)器人里面做生成,學(xué)生也發(fā)表了這方面的論文。總之,這個(gè)領(lǐng)域發(fā)展十分快,但沒有感覺跳變。

而ChatGPT確實(shí)是一次跳躍和質(zhì)變,是AI的一個(gè)里程碑。人機(jī)對(duì)話已經(jīng)做了半個(gè)多世紀(jì)了,進(jìn)步很大,但整體沒有實(shí)質(zhì)性的飛躍,主要應(yīng)用在某些垂直領(lǐng)域(比如聊天、客服等),整體感覺更多是玩具和工具,是個(gè)機(jī)器人,不能通過“圖靈測(cè)試”。但ChatGPT是第一個(gè)可以通過“圖靈測(cè)試”的智能體,我看到一個(gè)通用人工智能的雛形。

三聯(lián)生活周刊:在整個(gè)職業(yè)生涯中,你還經(jīng)歷過哪些類似的新技術(shù)爆發(fā)的時(shí)刻?

張亞勤:類似的讓我感到震撼的經(jīng)歷有幾個(gè)。一次是1986年,我剛到美國的時(shí)候,第一次用了蘋果Macintosh電腦。因?yàn)橹霸趪鴥?nèi),我們最初用的還是字符型的輸入,一行一行、一閃一閃的。到了美國之后,在學(xué)校的系里面第一次看到了帶鼠標(biāo)的電腦,看到它顯示得如此之清楚、漂亮。那時(shí)就感覺到,哇,原來電腦還可以這么做,圖形無界面,可以把鼠標(biāo)放在任何地方,相當(dāng)于立體化了。不僅僅能打字符,還可以用來畫圖。特別是出國前我們申請(qǐng)學(xué)校時(shí),每天還在用打字機(jī)打表格,一張一張地打,感覺很困難。到了美國看到這樣一個(gè)界面,完全是一個(gè)全新的體驗(yàn)。

還有一次體驗(yàn)是90年代初期,那時(shí)我在Sarnoff(注:美國桑納福研究院,現(xiàn)SRI研究院)。當(dāng)時(shí)我們?cè)谧龈咔鍞?shù)字電視,做視頻壓縮。我們第一次把所有系統(tǒng)集成在一起,加上5.1的立體聲關(guān)在一個(gè)黑屋子里,放了15分鐘SONY高清攝像機(jī)專門拍的高爾夫比賽/滑雪片段視頻,雪花和高爾夫球是那樣清晰,色彩是那樣鮮艷,大家都震撼于電視還可以這么清楚。那時(shí)候有很多人,包括政策制定者,反對(duì)數(shù)字電視,但那15分鐘放完,大家從黑屋子里走出來,都改變想法了。

再有就是2016年AlphaGo出來的時(shí)候。我自己也下圍棋,之前我不相信AlphaGo可以贏李世石,即使要贏,我想可能還需要至少5年左右。因?yàn)檫@是人類最難、最復(fù)雜的棋類,雖然我已經(jīng)在做AI,我還是沒法相信它能贏了世界最優(yōu)秀的九段。那次確實(shí)是第一次感受到AI的強(qiáng)大。

三聯(lián)生活周刊:過去相當(dāng)長一段時(shí)間,科技圈似乎都在等待下一個(gè)顛覆性的技術(shù)。人工智能行業(yè)內(nèi)也經(jīng)歷了所謂的寒潮。現(xiàn)在可以說這種停滯過去了?

張亞勤:對(duì)。2016年AlphaGo讓大家都感到AI很厲害的時(shí)候,人臉識(shí)別、語音識(shí)別其實(shí)已經(jīng)比較成熟,但大家仍然感覺AI只能做一件事。自動(dòng)駕駛給人的感覺很酷,但一直沒變成一個(gè)主流的東西。包括搜索也用了很多AI技術(shù),但大家可能感覺不到。總之,普通老百姓沒有感受到AI給生活帶來什么改變。但這次大家發(fā)現(xiàn),可以跟它直接對(duì)話了,它什么都知道,雖然有時(shí)候胡說八道,有時(shí)候說廢話和套話,但人也會(huì)這樣。而且它很多地方做得比普通人要好,比如寫東西很順暢,語法也很正確,還可以幫你寫程序、規(guī)劃任務(wù),在認(rèn)知層有了很大提升,開始有了通用人工智能的雛形。

我們一直在探索,哪條技術(shù)路線會(huì)走向通用人工智能。GTP3.0出來的時(shí)候,我們有一批人感覺到,大數(shù)據(jù)和超大模型可能是一個(gè)正確的方向,ChatGPT和GPT4.0+ 給大家?guī)砹诵判摹R?guī)模效應(yīng)很重要。因?yàn)槟P蜁?huì)自己進(jìn)行in-context learning(上下文學(xué)習(xí)),這在規(guī)模不夠大的時(shí)候看不出效果,但到一定規(guī)模會(huì)產(chǎn)生一些我們不知道的現(xiàn)象和能力。就像互聯(lián)網(wǎng),當(dāng)年Metcalfe(今年的圖靈獎(jiǎng)獲得者)定律提出,把N個(gè)人連在一塊,創(chuàng)造的效益是N的平方,呈指數(shù)型增長。模型的規(guī)模效益也是如此。

三聯(lián)生活周刊:大模型這條路走通后,會(huì)給整個(gè)AI行業(yè)帶來什么?

張亞勤:我覺得可以把GPT這個(gè)系列的生成式AI模型看作一個(gè)由大模型組成的AI操作系統(tǒng),和PC上的Windows,以及移動(dòng)的安卓、iOS基本具有相似的意義。一個(gè)新的操作系統(tǒng)出來是什么意思?下面的硬件、上面的應(yīng)用都會(huì)被重構(gòu)、重塑,形成一個(gè)新的生態(tài)。如果說PC互聯(lián)網(wǎng)的生態(tài)價(jià)值是1X,移動(dòng)互聯(lián)網(wǎng)的生態(tài)價(jià)值至少是10X,那么AI生態(tài)至少是100X。

PC時(shí)代,底層用的是英特爾的x86,在Windows上建立了許許多多的應(yīng)用,也因此被叫作溫特爾(WinTel)時(shí)代。到了移動(dòng)時(shí)代,Android和iOS的底層硬件都是ARM系統(tǒng),上面是各種不同的APP(應(yīng)用軟件)。當(dāng)然,APP公司本身可能變成巨大的公司,比操作系統(tǒng)更大,比如微信和TikTok這樣的Super APP(超級(jí)軟件)。

到現(xiàn)在這個(gè)云計(jì)算的時(shí)代,硬件有GPU、CPU、FPGA、ASIC,操作系統(tǒng)就是AI大模型,或許可以叫它GPTx或者基礎(chǔ)模型(Foundation Model,F(xiàn)M)。在AI還沒發(fā)展到這個(gè)階段的時(shí)候,有很多算法、模型、框架等,現(xiàn)在有了FM,你可以做各種各樣的應(yīng)用開發(fā):大模型上層還會(huì)有小模型,還可以有插件,和現(xiàn)有的APP組合在一塊。微軟目前在這方面做得最好,把能力組合到了搜索、Office和Azure云等每一個(gè)產(chǎn)品。

三聯(lián)生活周刊:這樣一個(gè)新的生態(tài),已經(jīng)在很快地形成了?

張亞勤:對(duì),但我也不認(rèn)為馬上就定了。在美國的話,OpenAI和微軟搶先了一步,但是谷歌實(shí)力也很強(qiáng),因?yàn)檫@里面其實(shí)很多最核心的技術(shù)是谷歌發(fā)明的。微軟和谷歌這兩家公司目前可能在全球領(lǐng)先所有人,無論是規(guī)模效應(yīng)也好,還是應(yīng)用場(chǎng)景、算法的成熟程度和產(chǎn)品的生態(tài)。當(dāng)然英偉達(dá)的GPU芯片和架構(gòu)最有競(jìng)爭力。那么在中國的話,百度應(yīng)該是走在最前面的。

三聯(lián)生活周刊:百度的CEO李彥宏在大模型產(chǎn)品文心一言的發(fā)布會(huì)上也提到,之前云計(jì)算行業(yè)比拼的是廠家的算力,以后可能會(huì)更看中模型本身。

張亞勤:對(duì),大模型變成操作系統(tǒng)之后,就形成了一個(gè)抽象層,開發(fā)者和用戶對(duì)下面用什么就不太關(guān)心了。比如你現(xiàn)在用電腦還會(huì)在乎下面是什么芯片嗎?無論算力多少、存儲(chǔ)多少,基本就被這個(gè)操作系統(tǒng)隔離了,你更關(guān)心的是模型能提供什么功能。所以對(duì)云公司來講,這也是重塑云的時(shí)刻。

三聯(lián)生活周刊:還有一種挺普遍的看法,認(rèn)為生成式對(duì)話產(chǎn)品會(huì)顛覆搜索引擎現(xiàn)有的商業(yè)模式,科技公司不得不自我革命。你也會(huì)這么認(rèn)為嗎?

張亞勤:我覺得不是。要是你沒有這個(gè)產(chǎn)品的話,別人會(huì)革你的命。我們?cè)谒阉鞯臅r(shí)候,其實(shí)是在找知識(shí),那現(xiàn)在有了生成式技術(shù),它確實(shí)提供了一種找到知識(shí)的新能力。所以沒辦法,新技術(shù)來的時(shí)候,一個(gè)公司說我沒有,那只能說太糟了。

但是有這個(gè)技術(shù)的話,生成本身又需要花很多錢,這也是谷歌遇到的問題。谷歌在搜索市場(chǎng)占有93%的份額,微軟只占3%,那3%的份額加點(diǎn)東西可能沒關(guān)系,93%的份額就要用很多算力,就會(huì)影響利潤。從這個(gè)角度說,所謂的顛覆市場(chǎng)可能是因?yàn)椋覀儌z做一模一樣的生意,但你谷歌的份額太高了,要比我(微軟)的成本高得多,微軟等于沒什么可失去的。在中國的話,百度可能會(huì)有優(yōu)勢(shì),因?yàn)樗盟阉骱腿斯ぶ悄芏己軓?qiáng),短期里挑戰(zhàn)它的公司不太多。但我想,有公司挑戰(zhàn)不是壞事,還是需要一些競(jìng)爭的。

后ChatGPT時(shí)代,中國AI產(chǎn)業(yè)的機(jī)遇

三聯(lián)生活周刊:百度發(fā)布文心一言大模型后,吸引了大量的關(guān)注和討論。實(shí)際上,自從ChatGPT推出,很多人就在問,國內(nèi)什么時(shí)候能有一個(gè)自己的ChatGPT。中國一定需要能和ChatGPT對(duì)標(biāo)的產(chǎn)品嗎?國內(nèi)大模型中文能力更強(qiáng)的原因可能是什么?

張亞勤:首先,我覺得這種多模態(tài)、預(yù)訓(xùn)練的大模型,特別是基于Transformer模型的,技術(shù)還會(huì)向前演進(jìn),所以不論是產(chǎn)品還是系統(tǒng),肯定會(huì)出現(xiàn)不止一個(gè)。而由于地域的區(qū)別和限制,中國會(huì)有自己的類似ChatGPT的產(chǎn)品,或者自己的操作系統(tǒng)。就像云一樣,美國有至少5個(gè)云,中國也有好多云,大家都會(huì)存在。

仔細(xì)看一下,你會(huì)發(fā)現(xiàn)ChatGPT中文做得也很好。這點(diǎn)其實(shí)很有意思,因?yàn)門ransformer模型一開始是用于翻譯的,在訓(xùn)練的時(shí)候就用了各種不同的語言。但它不僅僅是可以用很多語言工作,還在語言映射之間找到了結(jié)構(gòu),學(xué)到了語法、語義。所以,模型被訓(xùn)練的語言越多,其實(shí)會(huì)越好。如果要做中文大模型,最好里面也有英文和其他語言。

盡管我在百度曾經(jīng)做過五年總裁,但我對(duì)百度目前的產(chǎn)品和技術(shù)不了解,所以關(guān)于文心一言的細(xì)節(jié)你要問李彥宏。百度是在2018年就開始做這個(gè)大模型(ERNIE),在那前一年,Google發(fā)布了Transformer模型(BERT)。百度在人工智能方面的實(shí)力最強(qiáng),投入時(shí)間也最長。因?yàn)樽鏊阉骱屯扑]最需要AI,它也做各種各樣的AI產(chǎn)品,比如小度、無人駕駛、智能云,等等。所以大模型背后的技術(shù)是它必然涉及的。我認(rèn)為ChatGPT的“燈塔效應(yīng)”使得包括百度在內(nèi)的很多公司都發(fā)力了。中國最終會(huì)有多個(gè)橫向的大模型,百度有先發(fā)優(yōu)勢(shì)。

三聯(lián)生活周刊:有人會(huì)覺得文心一言很明顯還不夠成熟,推出得有點(diǎn)著急。當(dāng)然,模型的迭代有賴于人的反饋,很多技術(shù)上的考慮,普通人可能之前不是很了解。

張亞勤:我覺得一個(gè)產(chǎn)品成熟起來的最好方式,就是讓大家使用,用了之后,公司知道了反饋,相當(dāng)于大家一起幫助這個(gè)產(chǎn)品做得更好。事實(shí)上,ChatGPT很好的一點(diǎn)就在于,它讓整個(gè)行業(yè)意識(shí)到,原來很多不成熟的東西大家是可以接受的。谷歌研發(fā)這個(gè)東西的時(shí)間最長,它為什么不敢推一個(gè)產(chǎn)品出來?因?yàn)榇蠊緯?huì)害怕產(chǎn)品不完善、會(huì)犯錯(cuò),而ChatGPT相當(dāng)于提供了一個(gè)用戶的標(biāo)準(zhǔn)。包括ChatGPT為什么是由OpenAI推出來而不是和微軟一起發(fā)布?其實(shí)微軟已經(jīng)一直在產(chǎn)品中集成GPT4.0,看到ChatGPT用戶反饋好,微軟馬上光速推出,但它其實(shí)早就可以這么做。但大公司有時(shí)候會(huì)因?yàn)楦悴磺迨袌?chǎng)的接受度在哪里,比較謹(jǐn)慎。

因?yàn)槲乙呀?jīng)不在百度工作了,細(xì)節(jié)我不太知道,但我想,百度肯定是在比較之后,認(rèn)為用戶應(yīng)該是可以接受的。推出之后,顯然產(chǎn)品不完美,但是很多人會(huì)發(fā)現(xiàn)價(jià)值,會(huì)去使用。所以我覺得,這個(gè)推出的時(shí)間還是對(duì)的。GPT4和微軟的搜索結(jié)合起來的時(shí)候,在美國也有各種各樣的調(diào)侃。我覺得這些都正常,關(guān)鍵是要看主流是什么,它有沒有價(jià)值。如果它有問題,也有價(jià)值,但價(jià)值大于問題,大家就會(huì)用。如果都是問題,沒什么價(jià)值,這個(gè)產(chǎn)品自然而然就沒人用了。

三聯(lián)生活周刊:無論用ChatGPT還是文心一言,很多人都熱衷于比較中英文回答的差異。一些分析也提出,中文的自然語言處理可能面臨數(shù)據(jù)的局限,互聯(lián)網(wǎng)上中文語料的數(shù)量和質(zhì)量都不如英文語料。數(shù)據(jù)會(huì)成為中國研發(fā)這類大模型的限制嗎?

張亞勤:這是個(gè)好問題。我不認(rèn)為目前的模型用盡了所有的數(shù)據(jù)。現(xiàn)在我們生成的數(shù)據(jù)基本每一年都要翻倍,速度比摩爾定律要快,這適用于英文也適用于中文。中文語料的絕對(duì)數(shù)量可能少一些,但我不認(rèn)為目前是個(gè)限制,也不認(rèn)為以后會(huì)成為限制。有兩個(gè)原因。第一,可以用英文以及別的語言去訓(xùn)練語言模型。第二,以后模型里面的大部分?jǐn)?shù)據(jù)未必是語言,輸入輸出都可以是多模態(tài)的,視頻、語音都可以放進(jìn)去做訓(xùn)練。就像我們正在講話,有語言的交互,但視覺所產(chǎn)生的信息量其實(shí)也很大。我們現(xiàn)在看到的數(shù)據(jù)很多都還是用戶自然生成的數(shù)據(jù)、機(jī)器生成的數(shù)據(jù),但還有很多關(guān)于物理世界的數(shù)據(jù),比如說開車,車?yán)锂a(chǎn)生的數(shù)據(jù)量每天是TB級(jí)別的,生物世界也產(chǎn)生很高量級(jí)的數(shù)據(jù)量。總之,數(shù)據(jù)量是很大的,我不認(rèn)為這會(huì)是一個(gè)大的瓶頸。

但很重要的是,怎么用好數(shù)據(jù)。ChatGPT能做這么好,其實(shí)是在外圍花了很多工夫。數(shù)據(jù)來了之后怎么清洗?怎樣做半監(jiān)督的學(xué)習(xí)?他們做了很多這類調(diào)試,包括在肯尼亞雇了很多人做各種標(biāo)注、調(diào)試,還用了剛才提到的由人類反饋的強(qiáng)化學(xué)習(xí),相當(dāng)于我們每次用它都在反饋。所以,除了最重要的模型訓(xùn)練,這些環(huán)節(jié)也很重要。

三聯(lián)生活周刊:關(guān)于哪幾家公司會(huì)成為國內(nèi)大模型的頭部玩家,現(xiàn)在眾說紛紜。有人說只有云計(jì)算廠家才有足夠的算力基礎(chǔ),有人說擁有超級(jí)APP的公司掌握了獨(dú)家優(yōu)質(zhì)數(shù)據(jù)。做大模型需要怎樣的“入場(chǎng)券”?在后ChatGPT時(shí)代,國內(nèi)科技行業(yè)的最大機(jī)會(huì)可能在哪里?

張亞勤:我可以畫張圖來說這個(gè)問題。ChatGPT之后,整個(gè)行業(yè)的結(jié)構(gòu)會(huì)變成什么樣。

首先,最下面一層是云,這里面可能會(huì)有上萬個(gè)GPU(圖形處理器)或者XPU(某種處理器),表示算力。

接著往上一層是現(xiàn)行的IaaS(Infrastructure- as-a-Service,基礎(chǔ)設(shè)施即服務(wù))操作系統(tǒng),包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)、安全……

這一層上面,就是我們現(xiàn)在討論的基礎(chǔ)模型(foundational model),或者說MaaS(Model-as-a-Service,模型即服務(wù))。

在這個(gè)上面,還會(huì)有很多垂直基礎(chǔ)模型(Vertical Foundational Model,VFM)。比如,自動(dòng)駕駛的、蛋白質(zhì)解析的、氣象預(yù)報(bào)的、面向教育的……

這些垂直模型還可以相互結(jié)合起來,再形成不同的應(yīng)用,也就是SaaS(Software-as-a-Service,軟件即服務(wù))。

那么這樣看下來,基礎(chǔ)模型這一層當(dāng)然是有機(jī)會(huì),也需要具備底層才能有入場(chǎng)券,但其實(shí)不需要那么多人去做這一層。大部分的機(jī)會(huì)在垂直基礎(chǔ)模型這一層及以上的SaaS。

同時(shí),要在部署端(電話、個(gè)人電腦、物聯(lián)網(wǎng)、機(jī)器人、智能汽車等等組成的)把人工智能用上,需要做邊緣的模型部署,這一塊也存在很多工作。而且在部署端,模型不是越大越好,而是越小越好,越快越好。比如自動(dòng)駕駛,你把模型部署到車的時(shí)候,不會(huì)在乎它會(huì)不會(huì)寫詩,而是要精確,在最短的時(shí)間內(nèi)能把車開好,延時(shí)越短越好。邊緣的機(jī)會(huì)其實(shí)很大,所以我們現(xiàn)在在做邊緣計(jì)算、邊緣模型、模型交互、聯(lián)邦學(xué)習(xí)、小模型。

我覺得,可能有幾家中國公司都會(huì)做自己的系統(tǒng),最有可能就是BAT(指百度、阿里巴巴、騰訊),還有字節(jié)跳動(dòng)、華為都可能做。當(dāng)然,初創(chuàng)公司如果能拿到百億的投資也可以做,OpenAI就是這樣起來的。但我覺得,大家不一定都要一窩蜂去做操作系統(tǒng)這一層,主要的機(jī)會(huì)還是在上面的應(yīng)用。就像手機(jī)時(shí)代,大家不能都去做安卓、iOS,不去做頭條、滴滴、淘寶了。當(dāng)然,這個(gè)操作系統(tǒng)可能也不只有一家。

還有,同一個(gè)App也可以接入不同的系統(tǒng),和不同的基礎(chǔ)大模型結(jié)合起來。所以我覺得以后要考慮模型和模型之間的互動(dòng),怎么把它運(yùn)用起來,在模型之間工作,怎樣在模型里面把知識(shí)收集起來。

這樣做的一大好處是,過去做什么應(yīng)用都需要海量數(shù)據(jù),現(xiàn)在很多基礎(chǔ)數(shù)據(jù)通過預(yù)訓(xùn)練模型給你了,那么每家就可以結(jié)合自己的專有數(shù)據(jù)做fine-tuning(精調(diào)),做prompting(提示),做這種適應(yīng)就行了。之前做個(gè)公司,最怕數(shù)據(jù)不夠,因?yàn)閿?shù)據(jù)散著或者在別的公司那里。那在這個(gè)新的生態(tài)里面,它的模型已經(jīng)建好,甚至以后模型都不再需要那么多,可能從模型里面再抽取知識(shí)去用就可以了。

總之,我覺得有好多事可以做。ChatGPT的成功促進(jìn)了整個(gè)行業(yè)的生態(tài)改變,帶來新范式,這可能才是它真正的含義。

三聯(lián)生活周刊:目前行業(yè)各部分的參與者處在什么樣的狀態(tài)?

張亞勤:ChatGPT出來之前,GPT3.0/3.5和生成式AI已經(jīng)在業(yè)界引起很大關(guān)注,但美國已經(jīng)很快就形成了產(chǎn)品,比如做圖的DALL-E、Stable Diffusion、Midjourney,還有幫助生成文案的Jasper.ai,這些應(yīng)用馬上就實(shí)現(xiàn)了盈收,變成真正的公司了。

在中國的話,目前也有很多這樣的公司。ChatGPT是一個(gè)信號(hào),就是這東西行得通。所以現(xiàn)在中國的VC(風(fēng)險(xiǎn)投資)、高科技企業(yè),都開始意識(shí)到這件事的重要性。反正這個(gè)月每天都有很多人找我,希望給我們學(xué)院的團(tuán)隊(duì)投資,因?yàn)槲覀円恢痹趶氖逻@方面的工作。

現(xiàn)在大家都說想做大模型,可能只是“大模型”聽起來比較容易理解,未必是非要自己做那個(gè)平臺(tái)性的大模型,而是要去做上面的應(yīng)用,或者某一個(gè)垂直行業(yè)的模型。我想創(chuàng)業(yè)者最終都會(huì)調(diào)整好方向,找到不同的東西去做。目前大家都很興奮,每天絕對(duì)不無聊。

在基礎(chǔ)技術(shù)上下工夫

三聯(lián)生活周刊:在大國競(jìng)爭的背景下,GPT這類技術(shù)在早期就展現(xiàn)出這么強(qiáng)大的實(shí)力,戰(zhàn)略意義不言而喻。但我們?cè)谀承┉h(huán)節(jié)上可能受到一定限制,比如芯片的進(jìn)口。你會(huì)怎么看待這些問題?

張亞勤:這些都要考慮的。像2017年我還在百度的時(shí)候?yàn)槭裁礇Q定自己做昆侖芯片?那時(shí)就是我們所有AI任務(wù)的訓(xùn)練都需要大量的算力,買的GPU太貴,供不應(yīng)求,而且對(duì)我們的具體任務(wù)也不是最優(yōu)的。我們就決定自己做,開始給內(nèi)部業(yè)務(wù),后來變成獨(dú)立公司。

芯片的問題是個(gè)很復(fù)雜的問題。除了設(shè)計(jì),還有光刻機(jī)、制程、EDA等問題。我們需要在基礎(chǔ)的技術(shù)方面進(jìn)行長期和有耐心的投入,以及扎扎實(shí)實(shí)的研發(fā),沒有捷徑。

三聯(lián)生活周刊:和之前幾次行業(yè)變革發(fā)生時(shí)相比,這次中國的位置有什么不同,在積累上有什么不一樣?

張亞勤:在PC和互聯(lián)網(wǎng)時(shí)代剛開始的時(shí)候,中國基本上什么都沒有,所以全是copy to China(復(fù)制到中國)的。美國有什么,我們copy什么。到了移動(dòng)互聯(lián)網(wǎng)的時(shí)代,中國在一些領(lǐng)域做得比美國要好,比如說5G、移動(dòng)支付、微信、短視頻等。

那么到現(xiàn)在,我們經(jīng)過這兩次大的產(chǎn)業(yè)升級(jí)之后,中國在數(shù)字化支付、網(wǎng)絡(luò)、用戶終端,基本上都和美國在同一陣線,比其他所有國家都要好。我們?cè)谧罡叨说挠?jì)算芯片、算法系統(tǒng)和一些大的平臺(tái)性技術(shù)方面,現(xiàn)在感覺到是有些距離。但我覺得中國的創(chuàng)業(yè)者、工程師和科研人員,一旦把資源集中,并且有耐心,是可以趕上的。有很多挑戰(zhàn),但我還是充滿信心。

三聯(lián)生活周刊:在清華大學(xué)智能產(chǎn)業(yè)研究院(AIR),產(chǎn)業(yè)內(nèi)正在發(fā)生的變化會(huì)怎樣體現(xiàn)在工作中?

張亞勤:對(duì)我們來講,我們一直在做這事。我們沒有做那種超大規(guī)模的模型,學(xué)校做不合適,我們也不可能買上萬個(gè)A100/H100,但是我們一直在做多模態(tài)、強(qiáng)化學(xué)習(xí)、聯(lián)邦學(xué)習(xí)、生成技術(shù)、自動(dòng)駕駛和機(jī)器人。如果說改變的話,更多的是可以假定一個(gè)大的平臺(tái)已經(jīng)存在了,在這個(gè)平臺(tái)上,可以做更多的新研究。我們現(xiàn)在很多東西不再用自己做,可以用橫向的模型。實(shí)際上,我們每個(gè)團(tuán)隊(duì)都在研究,怎么能把這個(gè)東西融入到工作里面,這兩三個(gè)月做了很多這樣的討論。對(duì)所有做研究、做產(chǎn)品開發(fā)的人來說,面對(duì)ChatGPT都一樣震撼,我們看到大家對(duì)AI更有信心了,整個(gè)市場(chǎng),不管是投資人也好,企業(yè)也好,政府也好,都知道這個(gè)東西是這樣一個(gè)大的革新力量。我從2016年一直在講,人工智能是第四次工業(yè)革命的技術(shù)引擎,是我們這個(gè)時(shí)代最大的技術(shù)變革力量,聽的人有的信,有的不信,但現(xiàn)在大家都看到了AI的力量。而且AI現(xiàn)在所展現(xiàn)的只是冰山一角。

三聯(lián)生活周刊:你之前一直在產(chǎn)業(yè)的前沿,但這次的變革發(fā)生時(shí)在學(xué)院里面,會(huì)感到稍有遺憾嗎?還是說,在如今這個(gè)位置上,可以做你更感興趣的事情?

張亞勤:其實(shí)有好多人問我,你怎么不下場(chǎng)?我覺得,現(xiàn)在只是處在這個(gè)場(chǎng)的不同地方了。培養(yǎng)人做研究、和企業(yè)一塊創(chuàng)新,本來就是我這個(gè)時(shí)間想做的事。企業(yè)相當(dāng)于前線,我們?cè)诤蠓胶退鼈円黄鸷献鳎荚凇皥?chǎng)”里面,也感覺挺好的。而且我們現(xiàn)在每天都在和公司一起討論,一起規(guī)劃,一起研發(fā)。這是我們和企業(yè)合作的模式。

三聯(lián)生活周刊:這是清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)比較獨(dú)特的模式嗎?國內(nèi)的產(chǎn)學(xué)研結(jié)合目前處于一個(gè)怎樣的水平?

張亞勤:我覺得是因?yàn)槲覀兣c產(chǎn)業(yè)聯(lián)合得更緊密一些,這也是為什么我們叫智能產(chǎn)業(yè)研究院。

國內(nèi)產(chǎn)學(xué)研的結(jié)合整個(gè)做得還是不好,我也不能講美國做得有多好,但我覺得中國整體改善的空間還很大。因?yàn)榇蟛糠止鞠氲倪€是今天的產(chǎn)品,這樣它就覺得離“研”比較遠(yuǎn)。如果公司很大,它能想到明天的下一代產(chǎn)品,甚至想到后天的產(chǎn)品,這個(gè)時(shí)候公司就會(huì)想到和學(xué)校合作,因?yàn)閷W(xué)校在做最前沿的研究。但如果你就想做今天的產(chǎn)品,學(xué)校也做不好,因?yàn)樗皇亲霎a(chǎn)品的地方。所以研究和產(chǎn)業(yè)自然就沒法結(jié)合好。

在美國的話,很多公司像微軟一樣,自身就有研究院,想問題會(huì)想得很長遠(yuǎn)。還有很多制藥公司對(duì)研發(fā)投入巨大,而且會(huì)看10年之后怎么辦,可能是因?yàn)橐环N藥只能占領(lǐng)市場(chǎng)10年。那么這個(gè)時(shí)候,產(chǎn)學(xué)研的合作就比較容易一些。國內(nèi)還是需要時(shí)間。我覺得也是自然而然有的,10年甚至5年前,都很難和國內(nèi)企業(yè)合作。現(xiàn)在發(fā)現(xiàn)比原來好一些了,但是沒那么完美,一點(diǎn)一點(diǎn)來。

編輯:李華山

2023年04月03日 08:16:35

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.