專訪全國政協委員、工信部原副部長王江平:AI進入實體經濟的最大障礙是專業資料集不完善

3月5日,十四屆全國人大三次會議開幕會在北京人民大會堂舉行。國務院總理李強在政府工作報告中提出,要持續推進“人工智慧+”行動,將數字技術與製造優勢、市場優勢更好結合起來。
當前,在DeepSeek大模型熱潮帶動下,“人工智慧+”賦能實體經濟的探索不斷加速,而背後的資料、算力等瓶頸問題也成為今年全國兩會代表、委員們關注的焦點之一。
全國政協委員、工信部原副部長王江平在接受《每日經濟新聞》(以下簡稱“NBD”)記者採訪時表示,人工智慧是靠資料來馴化的,既需要公共資料來支撐,又需要專業資料來發揮關鍵作用,當前專業資料集不完善是制約人工智慧進入實體經濟的最大障礙。
“具體到一些行業資料更多掌握在頭部企業、工程設計院、大學科研院所等手裡,要透過一種商業模式把他們手裡的資料整合起來,讓大家共享資料集產生的價值。”他說。
1
專業資料集和算力瓶頸是突出短板
NBD:您認為,當前人工智慧賦能實體經濟面臨的最大障礙是什麼?
王江平:人工智慧有推動效率提升的作用,但進入到實體經濟,它面臨最大的障礙還是資料集的問題。因為人工智慧是靠資料來馴化的,專業的資料馴化出的模型就會比較專業。反之,如果資料不專業,就達不到這樣的效果。
所以,現在我們要推動人工智慧進入實體經濟,就迫切需要解決專業化資料集不足的問題,這個顆粒度越細越好。現在來看,我們通識性的資料已經有了,但是一些很專業的資料還需要去豐富,這是當前要迫切解決的問題。
接下來,就是商業模式的問題。人工智慧進入實體經濟需要什麼樣的商業模式,這是一個探索的過程。在我看來,至少有這樣幾個商業模式值得去探索——
第一個就是模型託管,模型做出來放在哪裡,涉及雲服務的問題;第二是模型服務,模型做出來以後要進入到每一個具體的行業。也就是說,做模型的人要懂實體經濟,推動模型進入實體經濟就是模型服務。
最後就是資料治理和交易問題。一個行業的資料治理完不完整非常關鍵,只有一個科學的、完整的資料治理體系才可能提供一個高水平的、專業化的資料集。有資料集就會涉及到交易的問題。
還有生產裝備的智慧化,現在我們的AI PC、AI手機,甚至AI家居等等,這些裝備製造的AI化也值得探索。當然,模型的評估測試等服務也自然會跟著起來。
NBD:作為支撐AI演算法執行的基礎,大模型的算力瓶頸問題也受到越來越多的關注。您如何看待這一問題?
王江平:算力確實是我們的一個短板,但我認為透過綜合施策是可以解決的。算力包括晶片、網路,以及供電這樣一些綜合型基礎設施,或者叫算力基礎設施。這些基礎設施中,晶片是我們的一個短板。
在人工智慧時代,特別是DeepSeek出來以後,我預測這種專用晶片(ASIC晶片)會在今明兩年有一個大爆發的機會。我們過去的CPU是通用型晶片,而大模型出來以後,可能會有越來越多大模型專用的算力晶片出現
2
加快搭建“顆粒度更細”的資料集
NBD:您認為,現在人工智慧在哪個領域的應用最為成熟?
王江平:不論哪個領域都應該主動地去擁抱人工智慧,而行業的資料集越好、越快,應用也就會越深入。我覺得現在醫療行業的人工智慧應用發展比較快,而工業行業里門類較多,反而可能是一些關注度不高、規模較小、企業不多的行業會率先突破,因為它的資料集更容易建設,資料的共享更容易做起來。
實際上,一方面人工智慧確實給我們的很多崗位帶來了替代效應,但另一方面它也會增加很多新的崗位。不論是對企業,還是個人而言,一定要抓住這個機會去主動地擁抱人工智慧。
NBD:行業AI應用落地程度,很大程度上取決於專業資料集的完善程度。您提到要建立一些“顆粒度更細”的資料集,目前還有哪些難點?應該如何去解決?
王江平:在過去,人工智慧模型還是一個高大上的東西,它的進入門檻是比較高的,但當DeepSeek模型開源以後,它的應用門檻大幅降低。這樣一來對人工智慧模型的需求就顯得非常迫切,但我們的資料集其實還沒有完全準備好,這是需要有個過程的。
另一方面,資料集本身涉及到企業生產、能耗等關鍵資料,對企業而言是非常重要的,一般不太願意去共享,所以我們要探索一種共享機制來推動這種資料集的建設。
我們的資料集既需要公共資料來支撐,更需要多個“顆粒度很細”的行業資料來發揮關鍵作用。而具體到一些行業資料更多又是掌握在頭部企業、工程設計院、大學科研院所等手裡,所以,下一步我們要透過一種商業模式把他們手裡的資料整合起來,能夠讓大家共享資料集產生的價值。這樣形成的資料就會很有價值,用它馴化的模型就可以更容易地進入具體的行業裡去應用。
NBD:專業資料集的建設能否解決AI幻覺的問題?
王江平:其實,AI幻覺與資料集的質量、豐富性有很大的關係。就推理模型來講,幻覺是比較高的。如果某些特定領域資料集不完整,就會產生幻覺。因為人工智慧有一個“補白機制”,它自己資料庫裡有這些資料就會按照一定的權重去算,等於是一個輸出的結果。
但當它沒有這樣豐富的資料集時,就會降低它的權重,最後補白出來,就可能會產生幻覺。我們一般人看不出來,但是專業人士就會看出來這是胡編亂造的。所以,歸根究底,幻覺問題也是一個數據集的質量問題。
記者|楊棄非 淡忠奎
編輯|陳柯名楊歡 杜波
視覺|蔡沛君
排版|楊歡

◆ 往期推薦 


相關文章