國家資料局:分三類建設高質量資料集賦能AI發展

來源:央視新聞
資料是訓練AI能力的“原料”之一。在第八屆數字中國建設峰會29日舉行的“高質量資料集和資料標註”主題交流活動上,由國家資料局指導的全國資料標準化技術委員會提出,將強化標準引領,分三類建設高質量資料集。
一類為“通識資料集”,包含面向社會公眾、無需專業背景即可理解的通用知識,主要用於支撐通用模型落地應用。
一類為“行業通識資料集”,包含面向行業從業人員、需要一定專業背景才能理解的行業領域通用知識,主要用於支撐行業模型落地應用。
一類為“行業專識資料集”,包含面向特定業務場景相關人員、需要較深的專業背景才能理解的行業領域專業知識,主要用於支撐業務場景模型落地應用。
簡單舉例,網際網路百科、問答等為“通識資料集”;行業研究機構報告等為“行業通識資料集”;醫院科室特定疾病病例等為“行業專識資料集”。
國家資料局相關負責人表示,從發展趨勢來看,人工智慧模型對資料集的需求正從“通用知識”向“專業知識”延伸拓展,經過專家精細化標註的資料集已成為AI價值實現過程中不可或缺的基石,下一步將積極引導做好高質量資料集和資料標註建設工作,為人工智慧技術創新和產業應用提供堅實的資料基礎。
(總檯央視記者 丁雅妮 劉柏煊)
歡迎加入影片號會員!

相關文章