圖靈獎得主姚期智院士:資料、演算法、算力為何是數字經濟核心技術?

去年以“數字央企 智領中國”為主題的首屆中央企業數字化轉型峰會在深圳召開。會上,央企數字化研究院首席科學家姚期智作了《數字經濟領域的核心技術》的主題演講,闡述了數字經濟前沿技術的最新進展,以及央企數字化的建設路徑。
姚期智認為,數字化轉型的最大挑戰之一是“資料孤島”問題。圍繞央企數字化轉型,要打造“資料中臺”,在資料安全、資料隱私合規的前提下進行全面整合;同時建設央企間的合作聯盟,打造行業級的隱私計算平臺,形成企業間的資料要素流通市場。以下為姚期智演講全文,經鈦媒體App整理編輯:
適逢鵬城佳日,滿城花開,我們相聚在特色社會主義先行示範區深圳,圍繞習近平總書記“發展數字經濟,加快推動數字產業化”的講話指示,以央企數字化轉型工作為牽引,舉辦首屆中央企業數字化轉型峰會。我在此對大會的召開表示熱烈的祝賀!很遺憾因為特殊情況出京不便,不能到場參會,我希望以數字化的方式能與諸位到場嘉賓共襄盛舉,共享首屆央企數字化峰會的盛宴!
對於數字經濟,習近平總書記強調:“要站在統籌中華民族偉大復興戰略全域性和世界百年未有之大變局的高度,統籌國內國際兩個大局、發展安全兩件大事,充分發揮海量資料和豐富應用場景優勢,促進數字技術與實體經濟深度融合,賦能傳統產業轉型升級,催生新產業新業態新模式,不斷做強做優做大我國數字經濟。” “要加強關鍵核心技術攻關,牽住自主創新這個“牛鼻子”,發揮我國社會主義制度優勢、新型舉國體制優勢、超大規模市場優勢,提高數字技術基礎研發能力,打好關鍵核心技術攻堅戰,儘快實現高水平自立自強,把發展數字經濟自主權牢牢掌握在自己手中。”
正如總書記所說,數字經濟的建設需要核心技術的支撐,清華大學交叉資訊學院與交叉資訊核心院在這些前沿核心技術方面持續進行著理論研究與實踐探索,也在今年與央企數字化研究院,以及以華潤集團為代表的央企建立了緊密的合作。我也很高興擔任央企數字化研究院的首席科學家,與諸位同仁共同推動央企數字化轉型與我國數字經濟的建設工作。
數字經濟的核心技術涉及資料、演算法與算力三個方面。資料正在成為經濟關鍵生產要素,我們需要研究推進資料確權和分類分級管理,暢通資料交易流動,實現資料要素市場化配置,合理分配資料要素收益。首先,以隱私計算、區塊鏈技術與零知識證明為代表的交叉資訊科技將扮演基礎設施的角色。同時,我院金融科技團隊探索實踐的資料定價演算法,在資料流通、多方協作的過程中,可以解決資料要素的經濟收益共享與分配的問題,在此次峰會上也會發布與華潤集團的部分實踐成果,並將與央企數字化研究院一起搭建全球首個數據要素定價的計算平臺,並逐步推出公共服務。在算力方面,我們將基於智慧晶片的基礎研究與實踐落地,在央企數字化研究院平臺上實現轉化,為數字經濟的發展提供算力基礎。
接下來,請讓我為諸位介紹一下數字經濟前沿技術的最新進展,和我作為央企數字化研究院首席科學家的一些規劃的思路:
數字經濟的三大核心要素包含資料、模型演算法、算力三個方面,每一個方面都有相應的前沿核心技術,我們可以進行一一討論。
首先,我們討論資料技術。
數字化轉型的最大挑戰之一是“資料孤島”問題:對於不同主體,由於資料安全、資料隱私的法律法規要求不能將資料簡單整合;對於同一主體,資料可以透過管理行政命令有限程度整合,但是由於部門利益、許可權管理、安全管理等障礙也無法依靠簡單的管理要求進行完全整合。
由中共中央、國務院釋出的《關於構建更加完善的要素市場化配置體制機制的意見》 與《關於新時代加快完善社會主義市場經濟體制的意見》都強調要加快培育資料要素市場,健全要素市場執行機制。那麼,在個人資料隱私法與資料安全法的要求前提下,要使資料在隱私保護的環境下進行流通,就變成了必要的基礎。
多方安全計算(MPC)技術使得資料要素流通成為可能,“資料可用不可見”,利用這項技術,可以打破“資料孤島”,形成數字化轉型基礎。
在央企數字化轉型研究院平臺上,我們將規劃以下方面的工作:
1. 打造“資料中臺”,在資料安全、資料隱私合規,和部門職責許可權管理、安全管理等現實情況的可行邊界下,進行儘可能的有限整合
2. 利用隱私計算技術,“資料可用不可見”,在多企業集團內部先行形成資料流動平臺
3. 在監管框架內,建設央企間合作聯盟,打造行業級的隱私計算平臺,形成企業間的資料要素流通市場
另一方面,資料要素市場需要監管與治理,這就需要在資料安全的前提下建設“監管工具”與“監管演算法”,確保資料要素流通平臺上的業務活動、生產活動在監管的框架下進行,並且可以接受監督與治理。
零知識證明的技術可以有效實現這一目標:政府部門或行業聯盟可以共同利用零知識證明技術實現監管與隱私共存,驗證資料要素使用的合規性、公平性等原則,保障資料隱私與企業機密。從而可以實現“黨管資料,央企先行”的目標。
對於這項技術,建設路徑可以採取以下方案:
在企業間的資料要素流通市場先行先試,利用零知識證明技術實現監管與隱私共存,建立“監管沙盒”平臺,逐步實驗成熟投入生產。
這一點可以參考金融行業的成功經驗:“監管沙盒”在金融行業已經獲得成功,在深圳的監管沙盒已經有了“出盒”的成功案例。
進一步的,在資料要素市場的建立過程中,我們需要資料的確權、資料計算過程的記錄可供審計和監管,而高效能的區塊鏈技術可以實現這一點,它可以儲存計算輸入輸出,實現計算的過程管理與透明化。

央企數字化研究院也將透過以下步驟推動這項技術的應用:
1. 在企業集團內部與企業間資料要素流通平臺都可以建設這項應用技術,作為資料要素流通的配套基礎設施
2.在央企監管場景下也可以建設該這項應用技術,實現資料監管的要求
有了以上的資料流動的技術設施,我們就可以在上面打造資料要素的流通市場了,這些技術可以幫助我們實現資料確權和分類分級管理,暢通資料交易的流動。那麼,進一的,在解決了資料安全、隱私保護和資料監管等資料流通問題之後,最重要的就是形成合理的經濟分配機制,從而驅動企業內部的部門獨立核算、企業間的資料共享,以形成資料要素市場,實現資料要素市場化配置,合理分配資料要素收益。
要完成這個任務,我們就需要建立資料要素的定價理論與演算法,這是一項融合了資訊經濟學、博弈論、計算機科學的前沿交叉理論,我們在這項技術方面進行了前沿研究,並與華潤集團、華潤銀行一道進行了實踐性的探索與落地。我也感謝華潤集團作為央企的代表,提供了豐富的業務場景和資料場景,我相信這一試點也會不斷擴大範圍,覆蓋更多的場景與企業,為我國的數字經濟發展提供經濟動力。
在此我也簡要介紹一下這項技術:
資料是用來建模的,透過資料的分析經濟主體可以進行有效的決策,我們把這一過程抽象為決策模型。而經濟主體,不管是機構還是個人,都希望獲取最好的經濟價值,這種對經濟價值的目標我們可以抽象出來一個功效函式。基於經濟學理論與數學的推導,我們可以建立起經濟主體的功效函式與決策模型精度直接的聯絡。
進一步的,我們可以根據博弈論的合作博弈理論,來確立不同的資料對於決策模型的貢獻度,貢獻度大的資料要素更有價值。因此,透過經濟主體功效函式與決策模型貢獻度的耦合,我們就可以對不同資料要素起到的經濟價值做合理公平的定量評估,計算得到資料要素在經濟活動中產生的經濟價值。
在不同的經濟活動中,如何基於資料要素流通的方式賦能經濟活動,並在各資料來源間分配公平合理的經濟價值?
– 基於市場營銷的場景,可以在隱私計算的環境下,透過多源外部資料來源與內部CRM資料的聯合建模,生成智慧營銷的模型,提高營銷獲客的效率
– 基於供應鏈管理的場景,可以在隱私計算的環境下,透過多源外部資料來源與內部ERP資料的聯合建模,生成智慧排程的模型,提高物流、金融流管理的效率
– 基於生產製造的場景,可以在隱私計算的環境下,透過多外部資料來源與內部MES資料的聯合建模,生成智慧生產的模型,提高生產的效率
這些經濟效率的提升是基於模型精度的提升,比如精度高一倍的營銷模型就可以幫助機構獲得多一倍的業務量,這些業務的經濟價值是由於使用了多方的資料要素,並建立了更高精度的模型帶來的。那麼我們就可以透過多方資料合作博弈的框架,建立分配演算法,按照貢獻度公平合理地分配這些價值。誰的資料對模型精度以及相關聯的經濟價值貢獻度高,誰就應該獲得相應更多的經濟價值。
簡單的來說,這個價值可以用經濟主體的功效函式與資料的模型貢獻度相耦合來進行刻畫。
這是一個簡單的例子,我們可以用資料來預測貸款違約傾向,識別良好/不良信用的客戶,利用來自不同資料提供方的銀行貸款資訊和申請客戶貸款逾期情況資訊資料進行隱私計算的聯合建模。那麼,如何實現對各個資料提供方所提供的資料資源進行定價呢?
如果用傳統的分配方式,即按照每個參與方的資料樣本數進行分配,是不能反映出來資料的實際價值的。而用模型貢獻度進行度量,可以實現這一點,透過模型貢獻度的計算我們可得出一些有意思的結論:
• A比E樣本多,但貢獻值較低
• C、D樣本相同,但C的模型貢獻率明顯高於D。
• E比C樣本多,模型貢獻率略低於C。
就在上個月,劉鶴副總理專門提出了要實現資料要素的市場化配置,合理分配資料要素收益。深圳市作為先行示範區更是在全國首次提出了資料資產“入表”的條例草案,探索建立資料生產要素會計核算制度。
相應的,在公共資料層面,政府也應該匹配相應的資料財政制度,將來源於公共性資料層面的資料收益,透過支出,構建基礎設施等支撐體系。我們也已經欣然的看到,北京、上海以及深圳都在積極的開展建設資料交易中心的工作。
就央企數字化研究院的資料定價工作,我們提出建設路徑:
1. 在企業集團內部不同部門,不同法人主體之間可以建設資料要素流動與定價平臺,推動資料共享與收益核算分配,推動資料資產計價、核算與審計
2. 在跨企業之間建立資料要素流通市場與資料定價演算法平臺,推動資料流通與收益分配
3. 在央企建立“監管沙盒”先行先試,基於央企數字化研究院搭建全球首個數據要素定價計算平臺
在這方面,我們也已經與華潤集團和華潤銀行開始了基於產業金融場景的實踐。我在此簡單地提一下,我們院的林常樂老師會在明天的數字金融論壇上做更詳細的實踐介紹。
從路徑上講,華潤集團有豐富的場景資源,可以用產融結合為抓手,形成“以產助融,以融促產”的產融協同模式。並推動產業鏈全面數字化,將協同模式逐步向外部生態移植。
首先在華潤集團內部可以打造智慧化模型,利用華潤銀行與產業集團的資料,在隱私計算的環境下進行聯合建模,產生各類生產模型:如智慧營銷、智慧推薦、智慧信貸風險模型等。在聯合建模的同時,我們可以根據資料定價演算法在集團不同法人主體、不同部門之間根據資料的貢獻度進行經濟價值的分配、部門貢獻的獨立核算,這樣就以市場化的力量將整個集團協同起來,用經濟動力將基於資料要素的生產活動調動統一起來,形成強大的經濟效率提升力。
進一步的,基於集團內的成功實踐,我們可以進一步推廣到集團外部,形成產業鏈的互聯互通,成為資料要素聯動的數字經濟體,實現劉鶴副總理所強調的“產業鏈核心企業帶動上下游企業協同創新,提升創新鏈產業鏈水平”。
對於模型演算法方面的應用,央企數字化研究院也將引領向前。
如前所述,數字經濟時代的千千萬萬的生產活動會催生海量的智慧化模型。
近年來,人工智慧技術取得了巨大的進展,大資料與人工智慧的結合使得海量模型的建立成為可能。無論是在縱深的演算法研究,還是橫向的創新場景層面,人工智慧技術都為數字經濟拉開了波瀾壯闊的巨幕。
人工智慧模型有非常強大的優勢,不需要預設的邏輯、不需要專家觀點就可以實現建模,並且各類演算法工具平臺可以支援快速的建模。但也有其劣勢,主要集中在模型的可解釋性、校驗方法的可靠度,模型缺陷與侷限性等方面。
因此,我們認為人工智慧的下一篇章在於如何進行演算法模型的治理,即模型的可解釋性、模型的精度與風險、演算法公平性等方面。
模型治理既是技術,又是制度,成熟的數字化企業會形成完整的模型治理制度。我們央企數字化研究院的工作,在推廣建設人工智慧能力的同時,也要推廣成熟的模型治理制度建設。
目前,包括對抗攻擊、因果分析與可解釋性分析的研究工作已經給這方面的工作指出了發展的方向。
在這些方面,我們認為應該進行以下的工作內容:
1. 建立模型治理制度,形成模型價值評估、精度評估、風險與缺陷管理的成熟體系
2. 央企數字化研究院牽頭建立模型評測中心,結合各類場景牽頭建設資料模型標準,並實踐模型評測,賦能行業
同時的,模型治理的另一面是演算法的合規性。在數字經濟時代,越來越多的生產活動需要依靠演算法模型開展,演算法與業務的深度融合會是未來的趨勢,對於業務的合規性要求也會傳導到對演算法的合規性要求。在這方面,我們欣喜的看到深圳市已經開始了先行先試,在今年8月份宣佈擬建立人工智慧分級監管機制。
同時,行業監管也在逐漸建立之中,如今年8月份國家網信辦釋出了關於網際網路資訊服務演算法推薦的管理規定。
今年3月份,國家金融行業標準委員會發布了人工智慧演算法金融應用評價規範的標準。
在這裡,我們建議在央企行業也應建立相應的行業規範與標準,在資料安全法、資料隱私法的框架內,發展測評中心,對演算法使用的合規性、公平性進行測試。
最後,我們在建設數字經濟過程中離不開算力的支援。
清華交叉資訊學院與交叉核心院在提升計算效率的智慧晶片與進行隱私計算的智慧晶片方面,都進行了前沿研究,也已經成功孵化出了落地的技術成果。在這些方面我們會基於央企數字化研究院的平臺,為廣大央企的數字化轉型與數字經濟建設進行賦能,提供算力基礎。
好的,我今天的演講就到此結束。感謝諸位領導嘉賓的聆聽!站在首屆央企數字化轉型峰會的原點,我們必將一同開啟數字經濟的大時代,各位負責人與專家都將是時代的弄潮兒,我願與諸位一起攜手共進,為數字經濟的偉大時代,為新時代的十四五規劃與2035遠景目標而共同奮鬥!
(本文轉載自鈦媒體App,作者 | 馬瓊)


相關文章