3月3日,《中國科學(xué)報》從剛剛落幕的國際可重構(gòu)計算領(lǐng)域頂級會議“FPGA 2025”(以下簡作FPGA’25)獲悉,今年該會議的最佳論文獎頒發(fā)給了無問芯穹和上海交通大學(xué)、清華大學(xué)共同提出的視頻生成大模型推理IP工作——FlightVGM。據(jù)了解,這是FPGA會議首次將該獎項授予完全由中國大陸科研團隊主導(dǎo)的研究工作,同時也是亞洲國家團隊首次獲此殊榮。
據(jù)介紹,這項工作首次在可重構(gòu)邏輯集成電路(FPGA)上實現(xiàn)了視頻生成模型(VGMs)的高效推理,也是該團隊繼去年在FPGA上加速大語言模型FlightLLM(FPGA’24)后的最新系列工作。與英偉達3090 GPU相比,F(xiàn)lightVGM 在AMD V80 FPGA上實現(xiàn)了1.30倍的性能提升與4.49倍的能效提升(峰值算力差距超過21倍)。
《中國科學(xué)報》了解到,此前清華大學(xué)電子系已有相關(guān)工作分別于2016年和2017年被FPGA 國際會議收錄,其中2017年的論文還在當年被評為唯一最佳論文,只是當時該工作系與海外團隊共同完成。此次FPGA’25最佳論文的作者成員全部來自中國,這也是亞洲首次由單一國家團隊獲得該會議最佳論文獎。
作者團隊在論文中提到,在大模型部署成本爭議甚囂塵上的產(chǎn)業(yè)背景下,以FPGA、ASIC等靈活可編程硬件和專用任務(wù)集成電路來提升硬件運行效率,或?qū)⒊蔀榇竽P吐涞匦侍嵘c成本降低的關(guān)鍵一環(huán)。2024年,無問芯穹曾以大語言模型定制推理IP FlightLLM 被FPGA會議錄取,今年再次以VGM模型定制推理IP FlightVGM 拿下最佳論文獎,都是在通過創(chuàng)新硬件架構(gòu)提升效率。據(jù)悉,這一系列研究成果現(xiàn)已被集成到無問芯穹自研大模型推理IP LPU(Large-model Processing Unit)之中,并已與合作伙伴開展合作驗證。
論文第一作者劉軍是上海交通大學(xué)博士生,共同一作曾書霖目前在清華大學(xué)從事博士后工作,通訊作者是清華大學(xué)電子工程系系主任和無問芯穹發(fā)起人汪玉和上海交通大學(xué)副教授、無問芯穹聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國浩。
論文鏈接:https://dl.acm.org/doi/10.1145/3706628.3708864
編輯:李華山