

中國大模型發展的新突破
前面四位主講嘉賓來自於中國最大、最好的金融機構和科技大廠,他們的演講非常有示範意義和指導意義。這裡我就可信任的數字金融說一說自己粗淺的認知。
最近幾個月,大家特別關注的還是中國深度求索釋出的開源的DeepSeek-V3。全球大模型評比榜單、AI整合平臺等不同機構給予DeepSeek-V3很高的評價,認為與GPT-4o效能不分伯仲,很多方面的表現位列全球前幾名。中國其它的大模型也做得特別好,例如阿里巴巴的通義。
輿論更多關注的是財務因素。據財聯社訊息,DeepSeek-V3訓練成本不到600萬美元,而GPT-4o訓練成本高達1億美元。專業人士更加關注的是演算法的創新,DeepSeek的演算法最佳化包括MLA多頭潛在注意力機制、MoE混合專家架構等。演算法創新應該是我國未來人工智慧發展的非常重要的、具有中國特有競爭力的領域,對金融機構來說意義重大。
國內市場特別關注高階晶片的自主化,我觀察到的是去年11月華為批量出貨的昇騰910B,其半精度(FP16)的算力、整數精度(INT8)的算力都比英偉達的A100略高一點,重要的是910B採用的是自主架構,能效比高於A100 25%左右。
前一個月我參加了另外一場研討會,會上一位專家認為,DeepSeek是工程正規化的升級,為AI推理開闢了“小資料+精演算法”的高效路徑,顛覆了大模型必須依賴鉅額投入的傳統認知,對於我國AI發展具有戰略意義。另一位專家認為,DeepSeek並沒有否定尺度定律關於大模型規模與效能正相關的核心邏輯,透過效率革命拓展應用邊界。
我個人認為,中國主導的演算法創新和高階晶片突破應該是我國獨立自主、節約高效的人工智慧發展道路上的里程碑。國內的晶片企業、雲平臺、電信運營商、國家超算網際網路平臺都在迅速進行適配,形成了模型即服務、側端部署等應用模式,並用於最佳化垂直模型。

AI技術的陷阱與挑戰
雖然看到了這些進步,但我們還要特別關注,生成式AI和推理式AI的技術陷阱依然存在。歸納下來主要是幾個方面。
首先,存在比較突出的安全風險。例如,國家網路安全通報中心3月初通報了大模型工具Ollama在本地部署DeepSeek等大模型時的安全風險:(1)無鑑權機制,未授權使用者能隨意訪問模型,呼叫服務,獲取資訊;(2)資料竊取,攻擊者透過特定介面可獲取模型的license等敏感資料;(3)惡意攻擊,攻擊者可利用Ollama框架歷史漏洞實施資料投毒、引數竊取、惡意檔案上傳和關鍵元件刪除等操作,影響模型服務的核心資料、演算法完整性和執行穩定性。
其次,並沒有消除模型幻覺。測試發現,Grok-3、GPT-4、DeepSeek-V3都存在一定程度的幻覺率。
第三,到現在為止還未能證實可以擺脫模型歧視、演算法共振、隱私洩露等技術陷阱。
第四,引起更加複雜的解釋性難題。解釋性有助於增強AI信任,減少對資料黑箱的擔憂,有助於發現模型偏差,管控決策風險。金融機構對於這一問題會非常關注。AI模型的演算法創新,當然提高了模型的能力,同時也增加了模型的非線性、隨機性和不確定性,很難找到一種通用的特別是監管機構認可的解釋方法。
第五,最新發現的疑似AI智慧體的網路攻擊。前幾天哈爾濱公安部門公佈亞冬會賽事資訊系統遭到境外網路攻擊的事件,確認有美國國家安全域性的特工參加,技術上是第一次使用AI智慧體發起網路攻擊,從攻擊程式碼來看,這次攻擊採用智慧體技術進行漏洞探尋、流量監測,部分程式碼明顯是AI書寫,可在攻擊過程中自動、快速編寫動態程式碼進行即時攻擊。這意味著數字駭客已成為網路攻擊工具,對國家安全防禦體系構成新的挑戰。

數字金融創新的挑戰與目標
我在銀行工作了幾十年,金融是安全性和可信度要求近乎苛刻的行業,需要保證金融資產和金融資料的安全,保證金融交易和金融服務的可靠性,保證賬戶處理和賬務記錄的準確性。三十年前,我們開始的以大中心、集中化為特徵的科技金融,已經經過了實踐的檢驗;近十年興起的以分散式、智慧化為特徵的數字金融創新還在發展。在信創的過程中,我個人認為數字金融的創新必須統籌安全和效率,實現從可用到好用,從替代到領先的跨越。
基於現階段的實踐,我認為數字金融的創新,並不要求金融類的垂直模型自身具備解決數學、程式設計、創意等複雜問題的高超能力,智慧化數字金融創新的基本點是可信任,能夠主動防範並跨越AI陷阱,實現演算法創新中的模型可信,達到金融模型解釋性的基本要求,讓客戶信得過,讓市場信得過,也讓政府監管機構信得過。

可信任數字金融的構建路徑
第一,高可靠性。金融機構部署AI模型,必須配置防火牆規則,啟用先進的金鑰管理工具,採用零信任架構,停用危險操作介面,及時更新安全版本修復安全漏洞,既能抵抗惡意攻擊,又能避免偶發性安全隱患。
金融模型的效能應該達到安全可信的基本要求,這裡提出幾個“特別注意”:用於市場分析和預測,要特別注意剋制模型幻覺;用於客戶篩選和分層,要特別注意避免模型歧視;用於量化交易和投資顧問,要特別注意防止演算法共振;用於身份識別和驗證,要特別注意抵抗AI虛假;用於線上線下客戶服務,要特別注意消解機器冰冷;用於憑證識別和賬務處理,要特別注意達成零誤差,實現非結構化資料處理百分之一百的正確率。
第二,可解釋性。具備可解釋性,能夠展現完整的推理路徑和邏輯,實現從結果正確向過程可解釋的跨越,是金融領域AI模型應用的關鍵要求。應該將模型行為轉化為可理解的規則,應用視覺化工具以圖形方式展示模型的技術特徵和生成過程,同時應用注意力機制標識關鍵輸入和關注重點。
第三,合法性。金融智慧體(Financial-Agent)適用於市場分析、風險評估、投資顧問、財富管理、量化交易、產品定製、內部審計等專業領域,技術上透過提供行業最佳流程、最佳標準的資料支援,可以培育具有自主感知、學習、行動和決策能力的金融智慧體,確保在複雜場景中達到可信任的專業水準。制度上需要確立金融智慧體的法律地位,明確金融智慧體的行為邊界,明確金融機構管理者的決策責任,明確金融智慧體與金融客戶的法理關係。
第四,經濟性。金融業涵蓋商業銀行、保險、證券投資、財富管理等不同領域,同一領域的金融產品、金融服務、金融管理的需求大同小異。用海量資料預訓練行業級金融模型並持續調優,再根據不同需求調適差異化應用,定製企業級金融模型,可以有效降低金融模型開發的邊際成本,擴充套件金融模型的應用範圍。
應支援有實力的科技企業和金融機構深度合作,領軍開發行業級金融模型和應用軟體,為中小金融機構提供企業級金融模型服務和軟體服務,共建數字金融生態圈,實現高效率、低投入、個性化的數字金融創新。
