今年11月,最高人民法院發(fā)布了“法信法律基座大模型”(以下簡稱大模型)。這是最高法積極探索使用人工智能技術(shù)為司法賦能,推動人工智能與司法工作深度融合的重要成果。
定位于國內(nèi)法治領(lǐng)域“行業(yè)基座”大模型,它是如何“學(xué)習(xí)”法學(xué)知識和司法審判業(yè)務(wù)的?在積極擁抱科技的同時,如何確保大模型可靠可控?未來大模型將給法律行業(yè)帶來怎樣的“智體驗(yàn)”?《法治日報》記者就此采訪了大模型合作研發(fā)團(tuán)隊負(fù)責(zé)人和有關(guān)專家。
先通后專通專結(jié)合
如何讓大模型“學(xué)習(xí)”法學(xué)知識,并遵循司法規(guī)律將司法審判業(yè)務(wù)需求與大模型技術(shù)相結(jié)合?大模型合作研發(fā)團(tuán)隊技術(shù)負(fù)責(zé)人之一、清華大學(xué)計算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)說,這需要讓模型實(shí)現(xiàn)從“通才”到“專才”的轉(zhuǎn)變,類比于人類的知識學(xué)習(xí)過程,即先接受廣泛的基礎(chǔ)教育,再接受法律專業(yè)培訓(xùn),最后獲取特定任務(wù)的實(shí)踐經(jīng)驗(yàn)。
“服務(wù)法律業(yè)務(wù)的大模型不僅需要理解社會常識、了解行業(yè)慣例、精通法律知識,更要具備人類的價值觀,并與中國特色社會主義核心價值觀保持一致,這樣的模型才能更好地服務(wù)于司法業(yè)務(wù)實(shí)踐。”劉知遠(yuǎn)說,“先通后專,通專結(jié)合”,實(shí)現(xiàn)對法律業(yè)務(wù)的可靠支撐。
劉知遠(yuǎn)介紹說,在大模型“學(xué)習(xí)”法學(xué)知識、司法審判業(yè)務(wù)的過程中,研發(fā)團(tuán)隊?wèi)?yīng)用了基于課程學(xué)習(xí)的模型訓(xùn)練技術(shù),分階段、遞進(jìn)式地使用不同類型的訓(xùn)練數(shù)據(jù),以最大化專業(yè)數(shù)據(jù)的價值;應(yīng)用了高效的數(shù)據(jù)治理與合成技術(shù),解決了特定場景下數(shù)據(jù)樣本量有限的問題;通過加入安全對齊語料培養(yǎng)模型價值觀,增強(qiáng)模型內(nèi)生安全,并且在系統(tǒng)設(shè)計上,通過全鏈路多級工程方案確保模型輸出內(nèi)容安全可靠;此外,還采用基于規(guī)模法則的模型風(fēng)洞技術(shù),保證了大模型訓(xùn)練結(jié)果的高效、穩(wěn)定、可控。
法律和計算機(jī)科學(xué)是如何跨學(xué)科合作研發(fā)大模型的?劉知遠(yuǎn)說,模型需要實(shí)現(xiàn)通用能力與專業(yè)知識的深度融合,不僅要求技術(shù)上的創(chuàng)新,還依賴于不同行業(yè)專家之間的緊密合作以及知識共享。
“為確保模型在法律領(lǐng)域的結(jié)果具有專業(yè)性,需要法學(xué)專家對計算機(jī)專家進(jìn)行指導(dǎo)。”劉知遠(yuǎn)說,在深圳智能審判輔助項目中,廣東省深圳市中級人民法院、人民法院出版社投入了大量業(yè)務(wù)專家對模型效果進(jìn)行指導(dǎo)與評測,構(gòu)建了優(yōu)質(zhì)的評測數(shù)據(jù)集和評測標(biāo)準(zhǔn)。模型的訓(xùn)練過程融入了大量專家知識,在法律法規(guī)理解、法律事實(shí)整理、案件爭議焦點(diǎn)發(fā)現(xiàn)、決策推理等多個任務(wù)的評測指標(biāo)上有了較大提升。
確保內(nèi)容安全可靠
法律行業(yè)積極迎接并擁抱科技革命和產(chǎn)業(yè)變革,在利用人工智能等科技成果賦能法律實(shí)踐的進(jìn)程中,也有諸多關(guān)鍵問題需要高度關(guān)注。
“在研發(fā)建設(shè)大模型過程中,要防范大模型技術(shù)的一般性應(yīng)用風(fēng)險,更需要在大模型應(yīng)用的專業(yè)性、內(nèi)容安全、數(shù)據(jù)合規(guī)、隱私保護(hù)、制度機(jī)制保障等方面作出長期不懈的努力。”人民法院出版社總編輯余茂玉說。
“法律行業(yè)應(yīng)用大模型,要在中國特色社會主義法治體系之下,既要同中國法治建設(shè)實(shí)際相結(jié)合,也要同中華優(yōu)秀傳統(tǒng)法律文化相結(jié)合,要堅持正確的政治導(dǎo)向,弘揚(yáng)社會主義核心價值觀和社會主義法治精神,要確保內(nèi)容安全。”人民法院出版社副總編輯、人民法院電子音像出版社社長林志農(nóng)說,法律思維本身特有的邏輯性、嚴(yán)謹(jǐn)性,要求大模型具備更為強(qiáng)大的邏輯推理能力和論證能力。法律文本及各種法律文書在應(yīng)用時有規(guī)范性和嚴(yán)肅性的要求,因此它對大模型生成內(nèi)容的專業(yè)合規(guī)、安全可信提出了更高的要求。
在林志農(nóng)看來,可靠可控是大模型名稱中“基座”兩字的應(yīng)有之意。大模型在法律行業(yè)廣泛應(yīng)用,其研發(fā)和預(yù)訓(xùn)練需要用大量合規(guī)的法律數(shù)據(jù)。其能力也主要是應(yīng)用到各種法律業(yè)務(wù)場景,所以大模型的安全可靠、自主可控特別重要。大模型在語料來源合法性、標(biāo)注規(guī)范性、輸出合規(guī)性、內(nèi)容安全性上嚴(yán)格遵照監(jiān)管要求。
“大模型研發(fā)團(tuán)隊的構(gòu)成包括組織領(lǐng)導(dǎo)團(tuán)隊、規(guī)劃管控團(tuán)隊、技術(shù)研發(fā)團(tuán)隊。”人民法院電子音像出版社副社長石鵬說,其中,規(guī)劃管控團(tuán)隊設(shè)計了大模型的六大支撐體系,即知識工程體系、評測體系、數(shù)據(jù)合規(guī)體系、內(nèi)容安全體系、傳統(tǒng)安全和創(chuàng)新安全體系、算力資源籌劃體系。
“研發(fā)團(tuán)隊構(gòu)建了大模型的評測方法和評價標(biāo)準(zhǔn)。評價指標(biāo)體系廣泛涵蓋了大模型的能力體系,尤其注重法律專業(yè)性測評和內(nèi)容安全測評。”石鵬說。
“在探索模型在法律行業(yè)的應(yīng)用邊界時,需要計算機(jī)專家對法學(xué)專家進(jìn)行指導(dǎo)。”劉知遠(yuǎn)說,在大模型落地于真實(shí)的法律應(yīng)用場景時,需要厘清大模型在不同場景下的適用度和能力邊界。實(shí)踐中,通過模型開發(fā)人員給出應(yīng)用建議,確保真實(shí)應(yīng)用場景中模型能力可控;同時,也明確了模型在實(shí)際業(yè)務(wù)中的輔助角色,嚴(yán)格保證人的決策權(quán)。
成為辦案智能助手
“我們將推進(jìn)大模型融入全國法院‘一張網(wǎng)’。”余茂玉說,經(jīng)過對大模型底層能力進(jìn)行更有針對性、場景性的開發(fā)應(yīng)用后,一批數(shù)字化、智能化的“辦案助理”“普法助手”“領(lǐng)域找法查案專家”“個人法律知識管家”等將上線應(yīng)用,成為法律從業(yè)者的AI智能助手。
余茂玉說,大模型技術(shù)提供嵌入業(yè)務(wù)場景的人工智能解決方案,能夠有效賦予法律業(yè)務(wù)的“新能力”和“智體驗(yàn)”,進(jìn)而促進(jìn)產(chǎn)業(yè)聚合和技術(shù)創(chuàng)新,將會成為法律行業(yè)的創(chuàng)新引擎。
對大模型,研發(fā)團(tuán)隊和法學(xué)專家都有很多期待。
“未來,大模型應(yīng)在極大提升法律工作者工作效率的同時,更好地實(shí)現(xiàn)工作的規(guī)范化以及統(tǒng)一法律適用。”劉知遠(yuǎn)說。
“隨著大模型智能體技術(shù)的發(fā)展,每一位法律工作者都可以擁有專屬的智能體助理,承擔(dān)機(jī)械的重復(fù)性勞動以及簡單的創(chuàng)造性工作。”劉知遠(yuǎn)說,在不久的將來,法律智能體還會呈現(xiàn)多角色分工與多智能體協(xié)同。當(dāng)事人、律師、法官、法律學(xué)者都能夠通過專屬自身角色的智能體助手,構(gòu)建出一個更高質(zhì)量、更高效的群體智能工作協(xié)同網(wǎng)絡(luò)。
“相信大模型能夠在統(tǒng)籌推進(jìn)國內(nèi)法治和涉外法治中發(fā)揮更大作用。”中國政法大學(xué)數(shù)據(jù)法治研究院教授張凌寒說。
“目前,我國的法律基座大模型主要面向國內(nèi)市場,國際化程度較低,對國際市場的需求和法律法規(guī)的理解還不夠深入。”張凌寒說,要更好地提升我國在這一領(lǐng)域的國際影響力,需要加強(qiáng)國際合作,與國際組織、外國政府和企業(yè)建立合作關(guān)系,積極參與技術(shù)標(biāo)準(zhǔn)制定,提高模型的國際認(rèn)可度。
“以法學(xué)為代表的實(shí)踐性學(xué)科,長期面臨數(shù)據(jù)壁壘和機(jī)制差異等問題,這在一定程度上造成了實(shí)務(wù)需求與人才培養(yǎng)脫節(jié)的現(xiàn)象。”清華大學(xué)科研院院長、互聯(lián)網(wǎng)司法研究院院長劉奕群說,傳統(tǒng)法學(xué)實(shí)證研究獲取樣本的成本高、難度大,且樣本數(shù)量有限,難以及時、準(zhǔn)確、全面地反映社會實(shí)際運(yùn)行狀態(tài),而以大模型為基礎(chǔ)的多智能體技術(shù),能夠模擬復(fù)雜系統(tǒng)中多個主體的交互行為,包括各主體之間的博弈與協(xié)作。
“未來,我們將進(jìn)一步探索司法多智能體技術(shù)在復(fù)雜系統(tǒng)模擬、協(xié)同決策以及動態(tài)調(diào)整中的能力,模擬法律適用過程中不同角色,如法官、律師、當(dāng)事人等之間以及不同群體之間的互動行為,為法學(xué)研究和法學(xué)教育提供仿真、高效、便捷的基礎(chǔ)實(shí)驗(yàn)設(shè)施平臺。”劉奕群說,以人工智能賦能傳統(tǒng)實(shí)證法學(xué)研究范式的變革,將為法學(xué)研究和人才培養(yǎng)貢獻(xiàn)一份力量。
編輯:李華山