大型強(qiáng)子對撞機(jī)實(shí)驗(yàn)數(shù)據(jù)首次向公眾開放
來源:科技日報(bào) 2014-11-25 李山
歐洲核子研究中心(CERN)11月20日啟用了其開放數(shù)據(jù)網(wǎng)站(http://opendata.cern.ch),首次將包括大型強(qiáng)子對撞機(jī)(LHC)真實(shí)碰撞實(shí)驗(yàn)數(shù)據(jù)在內(nèi)的一批高級別數(shù)據(jù)及相關(guān)軟件免費(fèi)開放給公眾。除了對研究界具有很高的價(jià)值以外,預(yù)計(jì)這些數(shù)據(jù)還將被廣泛用于教育目的。
CERN負(fù)責(zé)人羅爾夫•霍耶爾教授說:“啟動(dòng)CERN開放數(shù)據(jù)門戶是我們的重要步驟。我們開始與世界共享的大型強(qiáng)子對撞機(jī)數(shù)據(jù),是這個(gè)實(shí)驗(yàn)最寶貴的資產(chǎn)之一。我們希望這些開放數(shù)據(jù)能夠支持和鼓勵(lì)全球的研究團(tuán)體,甚至學(xué)生和公眾科學(xué)家。”
首批開放的高級別可分析碰撞數(shù)據(jù)來自LHC項(xiàng)目中的緊湊渺子線圈實(shí)驗(yàn)(CMS)。它們是2010年運(yùn)行LHC時(shí)收集的。能夠用來讀取和分析數(shù)據(jù)的開源軟件也與這組數(shù)據(jù)一起公布在CERN開放數(shù)據(jù)門戶中。此外,該門戶網(wǎng)站還可以訪問到LHC項(xiàng)目中專門為教育目的而準(zhǔn)備的數(shù)據(jù)集,范圍涵蓋了大型離子對撞機(jī)實(shí)驗(yàn)(ALICE)、超環(huán)面儀器實(shí)驗(yàn)(ATLAS)、緊湊渺子線圈實(shí)驗(yàn)和底夸克實(shí)驗(yàn)(LHCb)。
由LHC實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)一般被分為四個(gè)不同級別:一級數(shù)據(jù)包括直接相關(guān)的文檔和直接出版物;二級數(shù)據(jù)包括在宣傳和培訓(xùn)中分析使用的簡化數(shù)據(jù)格式;三級數(shù)據(jù)包括重建數(shù)據(jù),以及模擬和分析級軟件,可以進(jìn)行完整的科學(xué)分析;四級數(shù)據(jù)包括基礎(chǔ)的原始數(shù)據(jù)和軟件,以及訪問所有實(shí)驗(yàn)數(shù)據(jù)的許可等。原始數(shù)據(jù)需要通過篩選、模式識別及粒子鑒別等事例重建過程才能變成具有物理意義的數(shù)據(jù),即重建數(shù)據(jù)。目前為止,CERN在數(shù)據(jù)門戶網(wǎng)站上公開發(fā)布的主要是第二和第三級數(shù)據(jù)。
“這是全新的,而且我們也很好奇,想看看這些數(shù)據(jù)會(huì)被怎樣重新使用。”負(fù)責(zé)CMS數(shù)據(jù)保存協(xié)調(diào)的卡蒂•拉西拉-帕瑞尼說,“我們已經(jīng)準(zhǔn)備了工具和不同復(fù)雜程度的例子,從簡化分析到可以使用的在線應(yīng)用程序。我們希望綜合實(shí)例會(huì)刺激外部用戶的創(chuàng)造力。”
大型強(qiáng)子對撞機(jī)是CERN耗資約60億美元、于2008年9月建成的目前世界上最大的粒子加速器設(shè)施。CERN每年有超過20PB的關(guān)于大型強(qiáng)子對撞機(jī)的研究數(shù)據(jù)需要存儲(chǔ)和分析,開放數(shù)據(jù)的嘗試將有助于推動(dòng)數(shù)據(jù)保存從單一的存儲(chǔ)到系統(tǒng)的開放共享。