應用驅動是AI發展的第一性原理

文:任澤平團隊
1、 AI應用驅動下一輪洗牌:跨越AI發展冷靜期,發展AI向實
人工智慧領域正在進入大模型浪潮以來第一段“冷靜期”。
一方面,OpenAI的下一代語言模型Orin遭遇重大瓶頸,效果不及內部預期。其2024年初主推的多模態模型Sora的釋出日期也持續推遲。
另一方面,AI行業的“Scaling Law”似乎正在失效,大模型的效能不再隨著引數量、資料量、計算資源的增加而產生指數提升。
AI需要新驅動力,應用驅動將成為第一性原理。進入“冷靜期”符合行業發展的規律,就像歷史上許多次技術浪潮一樣,在度過最初的高期望階段之後,泡沫不可避免產生。當技術沒有達到高期望時,行業會進入一段冷靜期,等待新技術和應用變革帶來大洗牌。
2、 海外和中國兩條路線發展,以AI應用殊途同歸
海外AI發展曾經以技術驅動,實現AGI(通用人工智慧)等同於實現AI企業的終極商業價值。ChatGPT讓產業界看到了以AGI為目標的技術驅動的潛力,但經過兩年發展,行業意識到AGI仍然遙遠,純技術驅動還不具備客觀條件。海外AI巨頭在2024年逐步調整方向,開始以應用開發、產業結合為當前階段重點。OpenAI轉向盈利性商業化運營,谷歌、微軟等都開始以To C、企業端、開發者社群合作為聚焦點。
中國AI發展特點是應用驅動。2023年ChatGPT浪潮掀起“百模大戰”,積累了早期中國AI市場基礎。根據《全球數字經濟白皮書》,截止2024年11月,中國的大模型數量高達478個,約佔全球總數量的36%。中國市場投入大量資源開發基礎大模型,在一定程度上導致AI深層技術發展整體滯後。但另一方面也提高了生成式AI的社會認知和接受度,進而促進個人和企業去關心AI產品與市場的契合度,打下了應用驅動AI發展的“彎道超車”基礎。
原生AI企業是推動行業技術進步和產業化的引擎。2024年11月,沙利文釋出《2024年全球AI生態全景概覽》,其中原生AI巨頭有谷歌、百度、OpenAI三家。透過原生AI企業的技術、產業創新實現“冷靜期”跨越有跡可循。比如,谷歌在2017提出了Transformer架構,成為推動預訓練模型進化為大模型落地的最關鍵技術。2023年OpenAI釋出ChatGPT,通用大模型首次進入公眾視野,喚醒沉寂多年的AI賽道。2024年百度世界大會召開,開創性主張“AI應用向實”,中國AI發展正式進入彎道超車階段。
3、 重視AI行業的“新三要素”:幻覺消除、開發加速、智慧體發展
3.1 大模型欠缺真實感,消除智慧幻覺是首要任務
大語言模型(Large Language Model)中的“幻覺”現象指的是模型生成的內容雖然看似合理,但實際存在事實錯誤;或者AI生成的文字、圖片、影片在直覺上不符合人類認知,欠缺真實感。“幻覺”主要有邏輯謬誤、捏造事實、資料偏見三類。通常是因為模型的推理能力欠缺,演算法框架存在漏洞,資料壓縮、資料不一致性等原因導致。
多模態大模型領域興起,影像、音訊、影片類模型也出現幻覺現象。比如,OpenAI的Sora大模型雖然在影片生成領域表現優異,但也存在生成的影片違揹物理規律,時空關係錯亂等情況。這也是正式版Sora無法上線的主要原因之一。
業內解決“幻覺”問題的方式是採用RAG技術,(Retrieval-Augmented Generation)即檢索增強生成,透過結合階段和增強生成,減少學習資料中的“負樣本”,以此來減少大模型的幻覺現象。但這也僅限於在LLM領域。在多模態領域,百度開發了基於影像的iRAG(Image based RAG)技術,將搜尋引擎的億級圖片資源與文心基礎模型能力進行結合,在強化學習生成下,輸出各種真實的圖片,整體效果遠超傳統的“文生圖”的原生系統,有效的消除了“AI味”。未來,以iRAG技術為代表多模態RAG將成為業內緩解AI“幻覺”現象的主要方向,為更成熟、更真實的多模態應用發展提供更準確的能力。
3.2 程式設計AI應用加速行業走向下個爆發奇點
AI程式設計應用將加速AI迭代程序,賦予企業和個人更強的開發能力。全球AI企業已經進入“效率時代”,由於軟體應用開發的成本高、週期長,演算法工程師昂貴且稀缺,透過開發輔助程式設計AI來提高開發者效率、縮短開發週期成為方向。
一種是企業內部用AI直接輔助開發任務。比如,亞馬遜將Amazon Q用於公司內部的軟體升級任務,為其節省了相當於“4500 名開發人員一年的工時”,並且還提高了準確性和安全性,降低了基礎設施成本。
或是與開發者社群聯合開發程式設計AI助手,提高個人寫程式碼效率。比如,GitHub Copilot由GitHub、OpenAI和微軟Azure團隊聯合推出,可以提供程式碼建議和自動補全功能,幫助開發者更快地編寫程式碼。
甚至是直接省去人工程式碼步驟,由AI完成開發全流程2024百度世界大會發布的“秒噠”是里程碑式的開發工具,不同於前兩種輔助程式設計工具,使用秒噠不需要任何程式碼能力,透過自然語言就能實現軟體開發,人人都將擁有程式設計師的能力。其實現是透過將任務拆解成核心需求、內容結構、工程開發、資料需求四個步驟,再採用多個智慧體協同來完成,這也是迄今為止,最複雜的多智慧體協作工具。以後隨著基礎模型能力提升,以及智慧體本身的技術能力迭代,秒噠將能完成更復雜的開發訴求,實現系統級開發能力。
百度在AI程式設計應用上邁出的這一步不僅消除了未來成為開發者的門檻,更是對AI時代商業模式的一次革新這意味者實現商業創意或不再需要組織人員架構,智慧體就能充當專案經理、設計師、開發工程師,憑藉AI工具和創意,個人就能開發產品和創造商業模型。
3.3 智慧體是LLM的進化,是可以反思、進化、使用的工具
智慧體會變成AI時代內容、資訊和服務的新載體,是下一個爆發點。大模型是AI應用的初期形態,具備一定的通用性,但在深度方面欠缺。大模型作為應用發展的下一步是智慧體(AI Agent),不但能基於LLM進行任務推理和解決,還具備記憶、規劃功能和更強的自我學習能力,並且能使用特定的行業知識完成更復雜、更高質量的任務。
第一類具身智慧體(Embodied AI),典型代表有智慧駕駛汽車、通用人形機器人。如英偉達CEO黃仁勳所言,具身智慧體是AI進入物理世界的超級智慧形態。L3以上的高階智慧駕駛是第一步,目前以國內的百度Apollo和美國的特斯拉RoboCab為代表。第二步是透過自動駕駛的大範圍應用鋪開,積累智駕演算法的資料和經驗,再構建虛擬環境去訓練人形機器人演算法,幫助其實現量產落地。比如人形機器人領域領先的特斯拉Optimus,採用的就是其FSD智慧駕駛演算法。
第二類是平臺智慧體(Platform AI),為工具、企業、角色、行業、產業等提供AI賦能升級和定製化解決方案。
工具智慧體,在個人的工作和興趣應用場景中擁有強大的創造力和價值,將成為AI界的新質生產力代表。如AI寫作、Canva設計助手、logo生成器等等,都是典型的代表。工具智慧體的核心在於AI的“自由性”——能透過連線公域(公開資料、搜尋引擎內容、社交平臺內容)和私域(個人資料、音訊、影像、文字)來生成符合使用者期望的內容,解鎖“創造性”和“獨特性”。比如,百度釋出的自由畫布就是由文心多模態大模型加持的創造力工具,具備輸入自由、編輯自由、創作自由三大屬性,覆蓋從創意繪畫、AI寫作到專業報告領域等使用場景,幫使用者完成從找資料、到編輯、再到生成和分享的全部任務。
企業類智慧體相當於人工智慧時代的公司官方AI,具備官網+服務一體的系統化能力。由於傳統的企業官網通常資訊龐雜、專業術語難懂、視覺觀感上易疲勞,檢索方式複雜、服務效率較低,已無法滿足使用者的需求變化。而AI企業智慧體則具備了定製化推薦、及時化響應、高效化服務的能力。在汽車零售領域,比亞迪官網是成熟的企業智慧體案例,對於不懂術語的使用者,智慧體能像人類客服一樣為使用者找出匹配的引數,一鍵式提供清晰明瞭的對比,省去手動篩選步驟,給出符合使用者期待的建議。
角色類智慧體,也就是AI數字人,擁有自己的背景、設定、知識庫。可以是基於現實真人、特定職業進行線上服務的AI角色,也可以是虛擬角色。以往的虛擬數字人,大部分存在聲音口型不匹配、肢體動作機械、神情呆板等問題。在LLM和多模態的技術加持下,角色智慧體能呈現出更高度擬人化的表情、神態、情感。可以充當輔導老師,健康諮詢師,網路娛樂主播等,透過與人互動提供知識和價值。實際上,當前的數字人直播在許多場景下已經超過真人直播的轉化率,具備可觀的商業價值。
行業類智慧體,為使用者打破資訊不對稱,提供對應領域的專業服務,在法律、醫療健康、金融、體育、旅行等領域潛力巨大。比如,法律行業的智慧體——法行寶就是普通人的專業法律助手,從案件分析、條文引用、賠償計算、訴訟起草,實現了全流程免費服務。上線半年多以來,百度推出的法行寶為940萬多人提供了高效、可信的法律服務。
產業類智慧體,為不同產業中、不同分工的公司,提供商業決策中各環節解決方案。比如,餐飲產業的選址和售後服務是兩大難題。國內的餐飲龍頭百勝集團選擇與百度合作,基於大模型能力進行選址評估,提高了上千家門店的選址效率與銷售效果。初期的賦能成功後,百勝又對全線業務進行了數字化升級,大模型每天呼叫量的峰值達到數百萬,AI客服的問題解決率提升到了90%。為傳統行業轉型提供AI升級,還只是產業類智慧體的應用探索第一步,未來隨著模型學習能力更具深度,資料訓練更龐大,產業類智慧體甚至有潛力成為公司戰略的核心決策者
4、 立足於AI浪潮之中:理想主義、聚焦人才是AI進步的引擎
科技進步的原力是理想主義,前沿的技術浪潮最早都是由少數個人的理想主義來推動的,這一點在AI領域尤其突出。2024年的諾貝爾物理學獎頒給了約翰·霍普菲爾德和傑弗裡·辛頓,一方面表彰兩位學界先驅對於AI理論研究和產業化的貢獻;另一方面,是對兩位在深度學習路線受到冷落的30餘年,仍然堅定該研究方向的理想主義精神致以敬意。
30年來,推動美國AI產業發展成型是學術界的辛頓團隊和產業界的微軟、谷歌團隊,將這一成果轉換為商業化浪潮的是OpenAI和英偉達。其背後根本是以辛頓、伊利亞、蘇萊曼等為代表的學者和以馬斯克、奧特曼、黃仁勳為代表的企業家以個人理想主義推動行業進步。
中國的AI產業發展和未來趨勢亦是如此,有AI理想主義的企業家是推動行業進步的關鍵。早在2012年,李彥宏就瞄準人工智慧領域,率先意識到AI發展的轉折點到來,發起計劃收購剛完成AlexNet的辛頓團隊。該團隊中還包括了後來的“ChatGPT之父”伊利亞·蘇茨克維。彼時參與拍賣的還有谷歌、微軟、DeepMind,而百度在競標中一直出價最高,直漲到4400萬。儘管因為辛頓的身體條件等原因,最終未能與百度合作,但這場改變人工智慧革命的舞臺上,中國企業的世界眼光和視角高度讓AI學術界感嘆。“AI教父”、深度學習發起人之一楊立昆感嘆:百度是最早部署商業化深度學習系統的大型公司之一,甚至領先於谷歌和微軟。
十年來,李彥宏作為企業家一方面將百度的十年佈局聚焦在AI領域,另一方面作為個人也在不斷傳播他的理想主義,無論是對國家領導、企業家、媒體,還是對朋友、學生、極客,他從不放過任何“佈道”AI的機會。在連續8年的“兩會”中,李彥宏提出了13份AI相關提案。在堅持十年的“佈道”和產業落地中,越來越多的企業也看到了AI技術的價值並開始重視對AI的投入,網際網路科技公司轉向發展人工智慧的信心也更加堅定。
AI理想主義從理念到落地,根基是聚焦人才培養。2013年,李彥宏組建了成立百度深度學習實驗室,擔任院長。這是世界上首個以“深度學習”命名的企業級實驗室。至此,中國AI領域開始招賢納士,打穩根基,踏上10年的探索之路。2014年,谷歌貓牽頭人吳恩達加入百度深度學習,擔任首席科學家,負責百度大腦專案,培養了眾多中國AI界的核心技術骨幹。2017年,王海峰接棒吳恩達,搭建AIG(AI技術平臺體系)後來發展為深度學習技術及應用國家工程研究中心。2023年,王海峰釋出百度人才培養星河計劃,宣佈為社會再培養500萬大模型人才的願景。
十年來,百度不但實現從0到1的AI技術人才骨架逐漸成型,打穩了中國AI發展的人才基本盤,也讓人工智慧的理想主義隊伍不斷壯大,為中國AI行業在下一次變革性浪潮中做好了準備。2021年,李彥宏在致股東信中提到:“百度有定力,有耐心。因為我們深知,最前沿的技術浪潮是等不來的,你必須提前10年、20年去佈局”。當下看,不僅提前10年佈局的百度做到了生態領先,中國AI行業也做到了立足於全球人工智慧的大浪潮中。

相關文章