中國存儲系統(tǒng)的先行者
——記中國工程院新當選院士、清華大學(xué)計算機系教授鄭緯民
學(xué)生記者 何思萌 記者 呂婷 攝影 李派 李柱石

鄭緯民
走起路來健步如飛,上起課來激情澎湃,談起研究來妙語連珠……你或許不太相信,年過七旬、白發(fā)蒼蒼的鄭緯民現(xiàn)在仍是課題組里每天最早到達實驗室的那個人。組里的師生笑稱鄭老師是位“模范生”,每次見他不是在實驗室就是在會議現(xiàn)場,研討、講課、debug、攻克技術(shù)難關(guān)……在過去的幾十年里,鄭緯民唯一的愛好就是搞研發(fā)、帶學(xué)生。
1965年,鄭緯民考入清華大學(xué)自動控制系時,計算機還只是自動控制系的一個專業(yè),算法、存儲、系統(tǒng)等基礎(chǔ)理論的研究,國內(nèi)還比較落后,沒有人能準確判斷中國的計算機事業(yè)將有怎樣的未來。
改革開放后,鄭緯民先后前往美國、英國從事分布操作系統(tǒng)與函數(shù)語言編譯研究。回國后聚焦計算機并行/分布處理研究,并率先在高性能存儲領(lǐng)域深耕發(fā)力。
2016年,鄭緯民及其團隊參與的項目斬獲有著世界超級計算應(yīng)用領(lǐng)域“諾貝爾獎”之稱的“戈登·貝爾獎”,實現(xiàn)了我國高性能計算應(yīng)用成果在該獎項上零的突破。

2019年,鄭緯民當選中國工程院院士
在存儲系統(tǒng)領(lǐng)域,從一張白紙到世界領(lǐng)先,中國花了不到半個世紀,這一近乎奇跡的“逆襲”,鄭緯民功不可沒。
存儲系統(tǒng)背后的團隊
在足球場大小的機房里,密密麻麻存放著高速運轉(zhuǎn)的設(shè)備,一臺臺超級計算機正在執(zhí)行快速計算任務(wù)。“超級計算機”,顧名思義,擁有超大的數(shù)據(jù)存儲容量和超快速的數(shù)據(jù)處理速度,其中所涉及的技術(shù)遠比目之所及的龐大機器更為復(fù)雜。繞不過去的核心技術(shù)就有集群計算機設(shè)計、CPU設(shè)計、網(wǎng)格計算、高性能存儲等等,層出不窮的難題擺在計算機系高性能計算研究所時任所長鄭緯民面前,作為計算機系統(tǒng)結(jié)構(gòu)學(xué)科帶頭人的他,毫不猶豫地將這些技術(shù)難題作為研究所的主攻方向,帶領(lǐng)團隊“啃最難啃的骨頭”。
當整個行業(yè)醉心于研究各類復(fù)雜精巧的算法時,鄭緯民敏銳地意識到數(shù)據(jù)存儲技術(shù)將面臨巨大挑戰(zhàn)。上個世紀90年代起,他在國內(nèi)率先開展網(wǎng)格存儲系統(tǒng)關(guān)鍵技術(shù)研究,并一再打破國際存儲公司的技術(shù)壟斷。“計算、互聯(lián)、存儲三大部件組成一個大信息系統(tǒng),存儲越來越成為其中的核心問題。當下,存儲已成為關(guān)系到國計民生和國家戰(zhàn)略安全的關(guān)鍵信息基礎(chǔ)設(shè)施之一。”鄭緯民說。怎樣才能迅速、完整且長久地保留數(shù)據(jù)?怎樣才能在即使部分硬盤被損壞的情況下確保數(shù)據(jù)安全完整?鄭緯民帶領(lǐng)整個團隊,逐一攻破存儲系統(tǒng)的可擴展性、可靠性等一道道難關(guān)。
但他們并沒有止步于此。在此基礎(chǔ)上,能否用更少的空間儲存更多的數(shù)據(jù)?有別于通過降低分辨率等直接“打包”壓縮的方法,鄭緯民及其團隊提出了新的思路。“通常而言,備份越多,數(shù)據(jù)越不容易滅失,但需占用大量存儲空間。比如一部電影,拷貝三份分別存儲,那就多花費了200%的空間。但如果把電影切割成若干段進行存儲,例如存儲32段電影內(nèi)容,并同時生成16段校驗碼,當任何一個部分出錯時,可以根據(jù)校驗碼進行糾正,則只需要多花費存儲校驗碼的空間,也就是多增加33%左右的空間。”鄭緯民說。
這一思路為節(jié)約硬盤存儲空間打開了新的大門,然而最困難的是要實現(xiàn)數(shù)據(jù)存儲和校驗的實時同步。數(shù)據(jù)受網(wǎng)絡(luò)環(huán)境的影響很可能產(chǎn)生錯誤,對原數(shù)據(jù)進行校驗非常重要,使得再次使用這部分數(shù)據(jù)時,可以重新計算校驗碼并與之前的進行對比驗證。鄭緯民說:“在將數(shù)據(jù)寫入硬盤時,要對原數(shù)據(jù)計算校驗碼并一同傳輸,在很長一段時間內(nèi),國際上認為這兩者是不可能實時完成的。”而鄭緯民完成了這一創(chuàng)舉。他研制的自維護存儲系統(tǒng),實現(xiàn)了數(shù)據(jù)存儲和校驗的實時同步,整體技術(shù)達到國際領(lǐng)先水平,目前已被成功應(yīng)用到審計、公安、油田、電信、教育等行業(yè)及部門。
鄭緯民還創(chuàng)造性地提出了另一思路——社區(qū)共享。如果能夠?qū)崿F(xiàn)社區(qū)共享,則不需要重復(fù)存儲,這就是現(xiàn)在流行的云盤技術(shù)的基本原理。這一技術(shù)的多種應(yīng)用現(xiàn)在已“飛入尋常百姓家”,而在21世紀初,仍處于“摸著石頭過河”的探索狀態(tài)。鄭緯民承擔的項目通過網(wǎng)格技術(shù)將各高校的資源串聯(lián),存儲一份,即可全網(wǎng)下載。依托基于社區(qū)概念的網(wǎng)絡(luò)數(shù)據(jù)共享和存儲技術(shù),鄭緯民主持研制了國內(nèi)首個云計算平臺“Tsinghua Cloud”,并對外提供服務(wù)。

2016年,鄭緯民獲何梁何利基金科學(xué)與技術(shù)進步獎
憑借這些積累和突破,鄭緯民拿下了國家科技進步一等獎1次、二等獎2次,國家發(fā)明二等獎1次,2016年獲何梁何利基金科學(xué)與技術(shù)進步獎,2016年、2017年他的團隊連續(xù)兩次獲得“戈登·貝爾獎”。2018年,鄭緯民成為首位中國存儲終身成就獎獲得者。
鋪就邁向世界一流之路
當?shù)貢r間2016年11月17日,在美國鹽湖城召開的全球超級計算大會(SC2016)上,“千萬核可擴展大氣動力學(xué)全隱式模擬”聯(lián)合成果獲得“戈登·貝爾”獎,實現(xiàn)了該獎創(chuàng)辦30年來我國在此大獎上零的突破。2017年清華團隊再次借助“神威·太湖之光”超級計算機,成功設(shè)計實現(xiàn)了高可擴展性的非線性地震模擬工具,實現(xiàn)了對唐山大地震發(fā)生過程的高分辨率精確模擬,再次斬獲“戈登·貝爾”獎。兩次“捧杯”,鄭緯民及其團隊作出了突出貢獻。
邁向世界一流并非一日之功。時間回到改革開放之初,一切從零起步。那時的鄭緯民如饑似渴地閱讀國外前沿論文,參加各類同行會議,到美國、英國訪學(xué),在各地合作開展科研項目,滿腦子想著怎樣才能跟上世界的步伐。開始培養(yǎng)學(xué)生后,他經(jīng)常創(chuàng)造各種機會讓學(xué)生外出交流、參會,想方設(shè)法讓學(xué)生能接觸到最前沿的技術(shù)、與一線“大咖”交流切磋。

鄭緯民在交流中
鄭緯民鼓勵學(xué)生“走出去”,也不斷邀請頂尖學(xué)者“走進來”。現(xiàn)任清華大學(xué)計算機系副系主任武永衛(wèi)教授初到鄭緯民的項目組時,便參與到“中國教育科研網(wǎng)格”的項目研發(fā)中。他清楚記得,項目完成后,鄭緯民特地邀請當時這一領(lǐng)域富有聲譽的美國團隊來校交流,逐一將成果演示給對方看。“鄭老師不僅把項目做出來,還要演示、證明給別人看,這種開放的心態(tài)實屬難得。”武永衛(wèi)說。
漸漸地,清華計算機系憑借不斷提升的綜合實力和積極開放的交流合作在國際上嶄露頭角,開始真正進入到世界網(wǎng)格存儲和高性能計算的核心圈子。
2007年,鄭緯民第一次在國際高性能計算領(lǐng)域頂級會議FAST(USENIX Conference on File and Storage Technologies)上發(fā)表文章,這是中國大陸學(xué)者獨立完成的首篇FAST論文。而今,F(xiàn)AST會議每年甄選的二十篇文章中幾乎都有中國學(xué)者的身影,鄭緯民團隊也已在FAST會議上發(fā)表多篇論文。

清華學(xué)生超算團隊獲國際大學(xué)生超級計算機競賽(SC19)總冠軍
而在不久前落幕的2019國際大學(xué)生超級計算機競賽(SC19)上,由清華大學(xué)計算機系組建的清華大學(xué)學(xué)生超算團隊再次奪得總決賽總冠軍,這是清華大學(xué)在三大國際大學(xué)生超算競賽中獲得的第12個冠軍。
在高性能計算和網(wǎng)格存儲領(lǐng)域,從“開眼看世界”到國際領(lǐng)先,一條邁向世界一流的道路在鄭緯民的努力下已漸次鋪成。
“做事,就要做有用的事”
“鄭老師常對我們說,在論文摘要里就得把你要研究的問題寫清楚,要點出這個問題的研究意義在哪里。”清華大學(xué)計算機系副教授翟季冬曾是鄭緯民的博士生,翟季冬至今記得,鄭老師在指導(dǎo)他做本科畢業(yè)設(shè)計時,就一直強調(diào)“問題意識”。
武永衛(wèi)回憶起博士后階段跟著鄭老師做項目的日子時說,他聽的最多的就是“要做有用的事,要想明白對誰有用,能解決什么問題”。

“做事,就要做有用的事”,鄭緯民團隊的每位成員始終遵循這一要求,寫論文、做項目都以問題為導(dǎo)向,做出來的產(chǎn)品也要切實服務(wù)于現(xiàn)實需求。近期,鄭緯民帶領(lǐng)團隊多次赴內(nèi)蒙古調(diào)研,發(fā)掘網(wǎng)格存儲和高性能計算在各類現(xiàn)實場景中的應(yīng)用。
“做對國民經(jīng)濟有用的事”,鄭緯民用實實在在的技術(shù)突破踐行著他的承諾。“現(xiàn)在很多人覺得多發(fā)論文最重要,不是說這些沒有價值,而是真正做研究,要能讓理論落地,不能在紙上空比劃。做事,還是得務(wù)實一些。”鄭緯民說。
“我最自豪的,是培養(yǎng)出了優(yōu)秀的年輕人”
每年的院士資格評定都設(shè)有材料展示環(huán)節(jié),每位候選人要在有限的時間里闡述自己在該領(lǐng)域的成就。“鄭老師在展示的幻燈片里列出了七八項成就,他專門把講授的國家精品課程《計算機系統(tǒng)結(jié)構(gòu)》列了上去,他一直覺得把課講好是非常重要的事。”武永衛(wèi)說。
《計算機系統(tǒng)結(jié)構(gòu)》這門課貫穿了鄭緯民的整個教學(xué)生涯,直到退休前,鄭緯民都在給學(xué)生上這門必修課。課程的課件和教案每年都在更新,講授的內(nèi)容始終走在領(lǐng)域前沿。截至目前,鄭緯民已編寫和出版計算機系統(tǒng)結(jié)構(gòu)領(lǐng)域的教材近10本。
“鄭老師上課非常有激情,也很幽默,他總能把復(fù)雜的知識點講得清楚明白,讓學(xué)生都聽得懂、感興趣。”從本科起就跟著鄭緯民做科研的計算機系教授陳文光,至今還記得近二十年前上課時老師打過的比方:“鄭老師將初期的大型向量計算機比作‘象群’,將集群計算機中的小芯片群比作‘蟻群’,非常形象。”當時慕名來上課的還有許多外系的學(xué)生,因為鄭緯民深入淺出的講述,他們對計算機系統(tǒng)產(chǎn)生了強烈的探索興趣。
如今,鄭緯民培養(yǎng)的很多學(xué)生也站在了大學(xué)的講臺上,或幽默或通俗地為同學(xué)們講授計算機的基礎(chǔ)理論和前沿知識。“不自覺中,我平時上課也會跟鄭老師一樣,多舉一些通俗易懂的例子,課堂氛圍也相對輕松活躍。”陳文光說。

鄭緯民在講解區(qū)塊鏈技術(shù)原理
“我們給學(xué)生講課,至少在課堂上要讓他明白70%,剩下30%有興趣的可以再去學(xué)習(xí)研究。學(xué)生連課都聽不懂,怎么可能對科研感興趣?”鄭緯民說。鄭緯民至今還在全國各地講課,從計算機系統(tǒng)結(jié)構(gòu)講到并行計算,再到區(qū)塊鏈技術(shù),一如既往地深入淺出。但凡開課,一座難求。
鄭緯民向來鼓勵學(xué)生做交叉研究。搜狗公司CEO王小川曾是鄭緯民的碩士生,在讀期間他突發(fā)奇想,提出想借助計算機做基因拼接計算。當時整個團隊仍以并行處理的研究為主,這一想法看起來有些格格不入,但鄭緯民卻非常鼓勵,他說:“基因很復(fù)雜,如果你要做這個題,你得先去把生物專業(yè)的基礎(chǔ)書讀透。”在鄭緯民的鼓勵和指導(dǎo)下,王小川立即做起了自己當時最感興趣的研究。
鄭緯民看人很準,且極為信任學(xué)生。高性能計算研究所現(xiàn)任所長薛巍副教授本是清華電機系的學(xué)生,常來計算機系實驗室做運算處理。“我看這個小伙子很勤奮,周末都沒日沒夜在做研究,就跟他說可以來我們組做科研,于是他就來了。”鄭緯民說。恰逢計算機系與地學(xué)系合作天氣預(yù)報研究項目,鄭緯民便督促他“把氣象學(xué)本科生教材全部學(xué)一遍”。一邊做一邊學(xué),而今的薛巍已然是天氣預(yù)報領(lǐng)域的專家了。
當記者問起迄今為止最自豪的成就時,鄭緯民沒有絲毫猶豫,他的答案既不是評上院士,也不是拿下什么獎項,而是,“我培養(yǎng)的學(xué)生們都很優(yōu)秀。”
為祖國健康工作五十年
鄭緯民在清華讀書時,時任校長蔣南翔先生提出的口號“為祖國健康工作五十年”響徹校園的各個角落,至今仍是清華人對國家的承諾。
鄭緯民始終記得這個承諾。退休后的他仍然鉚足干勁,為祖國的計算機事業(yè)奮力工作。在團隊師生的印象里,鄭緯民永遠精力充沛,早上八點就來到實驗室,中午吃完飯接著工作,項目組的進展他了如指掌,時不時還要各地出差、參加會議、主持講座。翟季冬看著鄭老師退休后工作還這么拼,直言道:“老師比我們還拼,做學(xué)生的哪敢不努力!”

鄭緯民總跟學(xué)生說:“做計算機系統(tǒng)結(jié)構(gòu)方面的研究,要做好吃苦的準備。”每天工作十幾小時是組里師生的常態(tài),短期內(nèi)論文產(chǎn)出也不高,急功近利者幾乎不敢踏入這個領(lǐng)域。鄭緯民一直鼓勵學(xué)生沉下心去做研究。“我們要做實事,才能成事業(yè)。”鄭緯民說。
鄭緯民還是個熱心腸,計算機系大大小小的事都放在心上。無論是給學(xué)生指點科研方向,還是幫年輕教師一起打磨論文,甚至是幫助系里師生處理家庭瑣事,但凡找他幫忙,他都竭盡所能。可以說,鄭緯民的大半生都與清華計算機系緊緊相連。中國網(wǎng)格存儲“從零到一,再到無窮大”,鄭緯民是見證者,更是領(lǐng)航者。正如武永衛(wèi)所言:“計算機系像是他的孩子。”他給予了這個“孩子”充足的養(yǎng)分,又慈愛地陪伴她每一步的成長。
2020年是鄭緯民為祖國健康工作的第五十個年頭,但他還有忙不完的工作。隨著人工智能、區(qū)塊鏈等新技術(shù)的興起,作為基礎(chǔ)支撐的高性能計算、并行處理、存儲系統(tǒng)等核心技術(shù)愈發(fā)重要,以計算機為運算工具的跨學(xué)科研究不斷涌現(xiàn)。與此同時,國際競爭進一步加劇,破除技術(shù)壁壘任重道遠。“我們要做的還有很多。”鄭緯民說。
每次學(xué)生提出新設(shè)想、開發(fā)新項目的時候,鄭緯民總說的一句話是“我看行”。關(guān)于中國高性能計算的未來,他也不假思索地說了句:“我看行!”
(清華新聞網(wǎng)1月6日電)
編輯:呂 婷
審核:周襄楠