中信出版社 投稿量子位 | 公眾號 QbitAI
“10年後,機器人將可能比人都多,會陸續進入工廠、社會,最終形態是進入家庭。未來每個人、每個家庭都有機器人。”
這樣的預言,來自清華大學智慧產業研究院(AIR)院長張亞勤。
在其新書《智慧湧現》中,基於數十年對AI的思考與實踐,從他領導下AIR研究院正在推進的三大方向——多模態大模型、自動駕駛和生物智慧出發,張亞勤還給出了更多對AI技術演進方向的長期預判,包括:
-
我們經歷了“數字化1.0”和“2.0”,目前正經歷著向“數字化3.0”的升維躍遷——從“小模型”到“大模型”、從“單模態”到“多模態”、從“數字智慧”到“物理智慧”。
-
未來的發展方向將是智慧+X(AI+X),即把日漸強大的AI能力投射到千行百業。“X”既是無限可能的產業,也是無限產業的可能。
-
這場變革沒有旁觀者,全球80億人都已置身其中。
……

總結起來,對於AI技術的未來發展方向與突破路徑,張亞勤做了以下展望:
-
AI大模型的五大演進趨勢 -
AI技術進一步發展的五個觀點 -
自動駕駛未來發展的五大趨勢
AI大模型的五個發展方向
AI大模型作為數字化3.0的重要基石,其發展將決定未來技術攀升的高度與覆蓋的廣度。張亞勤眼中,未來AI大模型架構的關鍵發展方向如下:
-
多模態智慧:將帶來全面的、具有深度的智慧分析。結合語言、文字、圖片、影片、雷射雷達點雲、3D結構資訊、4D時空資訊及生物資訊,實現多尺度、跨模態的智慧感知、決策和生成。 -
自主智慧:將帶來個性化的智慧體。將大模型作為一種工具,開發出能夠自主規劃任務、編寫程式碼、呼叫外掛、最佳化路徑的智慧體,實現高度自主智慧,可自我迭代、升級和最佳化。 -
邊緣智慧:將帶來高效率、低功耗、低成本、低延時的邊緣計算網路。將大模型部署到邊緣裝置端,如新一代AI PC(人工智慧電腦)、新一代Intelligent Phone(智慧電話)、新一代Intelligent Home(智慧家庭,包括TV),大幅提升處理速度和相應的效能表現,從而實現邊緣智慧。 -
物理智慧:將帶來更加先進的自動駕駛車輛、機器人等。當下大模型正在被應用於無人車、無人機、機器人、工廠、交通、通訊、電網和電站以及其他物理基礎設施,以提升各類裝置、設施的自動化與智慧化水平。 -
生物智慧:將帶來生命健康、腦機互動、醫療機器人的突破,將大模型應用到人腦、生命體、生物體中,實現AI與生物體聯結的生物智慧,並最終迎來資訊智慧、物理智慧與生物智慧的融合。
關於AI技術進一步發展的五個觀點
1.大模型和生成式人工智慧是未來十年的主流技術與產業路線
大模型(GPT-4o、ChatGPT-o1、BERT等)和生成式人工智慧將成為今後10年內的創新主軸與連鎖變革的導火索。
2.基礎大模型+垂直大模型+邊緣模型、開源+商業
基礎大模型將是AI時代的技術底座,與垂直產業模型、邊緣模型共同孵化出新的產業生態。其生態規模將比個人計算機時代大100 倍,比移動網際網路時代大10倍以上。在這個生態中,開源模型將和商業模型並存,為開發者提供靈活的選擇。
3.統一標識(Tokenisation)+規模定律(Scaling Law)
大模型最核心的兩個要素是統一標識和規模定律。統一標識透過將文字和其他型別的資料統一編碼為單元,使模型能夠處理不同形式的輸入。規模定律則揭示了模型規模與效能之間的關係,表明隨著模型引數的增加和資料規模的擴大,模型的表現會顯著提升。
4.需要新的演算法體系
與人腦相比,現有演算法存在效率低、能耗高的問題,因此需要開發出新的演算法體系,包括世界模型、DNA記憶、智慧體、強化學習、機率系統和決定系統等,以實現100倍的效率提升。未來五年內可能會在AI技術架構上取得重大突破,當前主流的AI技術框架,如Transformer、Diffusion、AR,可能在未來5年內被新技術顛覆。
5.從大模型走向通用人工智慧
預計15 ~ 20年內可實現通用人工智慧,並透過新圖靈測試。更進一步的預測:5年內,在資訊智慧領域,AI對語言、影像、聲音和影片的理解、生成等方面透過新圖靈測試;10年內,在物理智慧(具身智慧)領域,實現大模型在物理環境中的理解與操作能力的大幅提升,透過新圖靈測試;20年內,在生物智慧領域,將AI應用於人體、腦機介面、生物體、製藥和生命科學,實現大模型與生物體聯結的生物智慧,透過新圖靈測試。
自動駕駛的未來發展
1.自動駕駛是未來五年最重要的物理智慧/具身智慧應用,有望成為第一個透過新圖靈測試的具身智慧系統
在安全性方面,實現完全無人操作的自動駕駛的安全性要比人類駕駛的至少高出10倍,達到人類“好司機”的水平;在人性化體驗方面,透過模仿學習和自主學習,自動駕駛系統將具備更自然的駕駛風格,結合乘客或車主的駕駛習慣,提供更人性化的體驗,達到人類“老司機”的水平。
2.大模型及生成式AI將在提升L4級別自動駕駛系統的泛化能力方面發揮關鍵作用
一是與資料智慧相關,過往自動駕駛系統的邊角案例資料不足,大模型及生成式AI可結合真實資料生成高質量的邊角案例資料。
二是與長尾問題相關,生成式AI可有效改善邊角案例中場景模擬、模擬度不足等問題,解決感知領域的長尾問題。
三是與常識推理相關,大模型的推理能力可助力自動駕駛系統理解並應對道路上的各種突發情況,從而提高自動駕駛系統的能力上限。
3.自動駕駛技術將整合多模態感測器資料,如計算機視覺、雷射雷達等,採用端到端的訓練方式,實現雲端大模型與車端即時精確模型的協同工作
一是多模態融合。相較人類而言,機器具備多模態感知優勢,可透過融合計算機視覺、雷射雷達和其他感測器資料,使自動駕駛系統更全面細緻地感知周圍環境。
二是端到端。以前自動駕駛演算法由許多專門針對特定任務的小模型組成,這些小模型各自負責不同的任務。現在,這些小模型可能會被一個統一的端到端的大模型取代。
三是雲端與車端協同。雲端大模型提供通用性泛化能力,車端模型提供即時精確響應與本地最佳化部署。雲端和車端協同能夠確保駕駛決策兼具泛化性、及時性與準確性。
4.未來的自動駕駛應用將以單車智慧為主,“車-路-雲”一體協同工作,從而確保安全冗餘,輔助智慧交通
一方面,每一輛自動駕駛車輛都必須具備獨立且強大的單車智慧駕駛能力。
另一方面,透過“車-路-雲”一體化,在為自動駕駛提供多重安全冗餘保障、提高駕駛安全性的同時,控制、最佳化交通流量,提升交通效率。
5.2025年,自動駕駛或將迎來“ChatGPT時刻”;2030年,自動駕駛漸成主流
2025年,在一個具備複雜交通環境的大城市,自動駕駛系統將表現出人類“老司機”的水平,這可能極大地激發產業與市場對於自動駕駛的熱情。2030年,自動駕駛車輛將逐漸躋身市場主流,預計屆時會有10%的新車具備L4級別的自動駕駛能力。
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
學術投稿請於工作日發郵件到:
標題註明【投稿】,告訴我們:
你是誰,從哪來,投稿內容
附上論文/專案主頁連結,以及聯絡方式哦
我們會(儘量)及時回覆你

🌟 點亮星標 🌟