新華社記者 嚴(yán)賦憬
記者20日從國家數(shù)據(jù)局了解到,我國七個(gè)數(shù)據(jù)標(biāo)注基地?cái)?shù)據(jù)標(biāo)注規(guī)模再創(chuàng)新高,數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,相當(dāng)于中國國家圖書館數(shù)字資源總量的6倍左右。
數(shù)據(jù)標(biāo)注是對(duì)數(shù)據(jù)進(jìn)行添加標(biāo)記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國七個(gè)數(shù)據(jù)標(biāo)注基地分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè);賦能121個(gè)國產(chǎn)人工智能大模型研發(fā);引進(jìn)和培育標(biāo)注企業(yè)223家;標(biāo)注從業(yè)人員達(dá)5.8萬人;帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過83億元。
國家數(shù)據(jù)局有關(guān)負(fù)責(zé)人表示,未來將進(jìn)一步暢通數(shù)據(jù)采集、標(biāo)注、人工智能應(yīng)用產(chǎn)業(yè)鏈,重點(diǎn)推動(dòng)工業(yè)、金融、醫(yī)療、交通、教育等幾大領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展。