2025,AI發展10大預判

作者:Mr.K


來源:技術領導力(ID:jishulingdaoli)
接下來這一年,AI將以更快的速度深刻改變各行各業,這個鉅變跟每個人息息相關,希望你認真看完。
01
智慧體,大爆發
在“百度世界2024”大會上,李彥宏強調“智慧體是AI應用的最主流形態,即將迎來它的爆發點。”並將做智慧體類比為PC時代做網站、或是移動時代做自媒體賬號。在新的一年中,智慧體技術從 “能力積累期” 邁向 “應用爆發期”的態勢將更加明顯。
目前來看,智慧體技術已經逐步進入全面商業化應用階段。比如在金融領域,已被應用於支付結算、風險控制;在科研教育中,能助力實驗設計和個性化教學;在軟體開發過程中,實現程式碼生成和程式測試等等。
這些多場景需求和應用,也反過來促使智慧體技術能力不斷進化,呈現出越來越明顯的專業化、自動化、協作化特徵,逐步實現從簡單任務執行到複雜環境精準決策、從單體執行到多智慧體協同到生態協作、從通用服務深入到垂直領域應對複雜場景的發展和過渡。
02
大模型最後一戰:多模態
2025年還將是多模態大模型爭奪戰的關鍵一年,各企業大廠會繼續投入大量資源比拼研發。比如去年年底谷歌推出的Gemini 2.0、OpenAI推出的Sora,以及更早時候智譜AI推出的CogVideoX等,都力求在這一領域取得優勢。
谷歌的 Gemini 2.0, 在技術架構上採用了最新的演算法,對神經網路結構進行了最佳化,不僅支援原生影像和多語言音訊輸出,還能夠原生呼叫工具,為使用者提供了更加便捷、高效的互動體驗。Sora同樣具備頂級的多模態語言理解能力,可從文字、影像或影片生成高質量影片,並能模擬真實世界的物理狀態。國內的 CogVideoX 也有自己的優勢,能將文字、時間、空間三維一體融合,透過高效的三維變分自編碼器結構,和端到端的影片理解模型,實現了快速生成高質量影片的能力。
這些模型的出現,在豐富使用者選擇的同時,也加劇了這一領域的白熱化競爭,最終誰能留在牌桌,既考驗市場容量,也考驗各自的本事。
03
文生影片,AI巨頭的必贏之戰
自AI浪潮以來,文生影片一直都屬於“熱點板塊”,隨著技術的不斷突破,2025年的文生影片大戰,必定會更加激烈。除了上面提到的頂級存在Sora外,還有谷歌新發布的Vo2,快手的可靈、minimax的海螺AI,都會是這場混戰的重要參與者。
谷歌的Veo 2不僅能夠根據文字或影像提示生成高質量影片,還能理解廣角、特寫等鏡頭控制指令,模擬現實世界的物理現象和人類表情,生成高達4K解析度的高畫質晰影片。快手的可靈AI和minimax的海螺AI也在影片生成領域取得了顯著進展,具備強大的物理模擬和概念組合能力,在影片續寫、運鏡控制等方面都有很大突破。
隨著技術競爭的加劇和應用範圍的不斷擴大,文生影片技術將極大地推動影片創作的變革,既降低了進入門檻,又提高了創作效率,為未來的內容產業帶來新的發展機遇。
04
AI具備長期記憶
在記憶分層管理上,AI 系統發展出了短期工作記憶、中期擴充套件記憶和長期知識庫儲存等不同層次的記憶結構。短期工作記憶用於臨時儲存當前任務相關的資訊,確保 AI 在處理任務時能夠快速獲取所需資料;中期擴充套件記憶則可以對一段時間內的資訊進行整合和儲存,為決策提供更全面的依據;長期知識庫儲存則是 AI 的知識寶庫,儲存著大量的歷史知識和經驗,使 AI 能夠不斷學習和積累知識,實現持續進化。在未來的AI發展中,具備長期記憶的能力將變得越來越重要。
當今的AI技術,可以透過檢索增強和外部儲存手段,有效擴充套件自身的記憶容量;同時,不斷發展的動態總結和分層管理能力,也讓AI長期記憶有了關鍵技術支撐。未來,AI 的長期記憶功能,將越來越貼近人類思維的特性,其記憶系統從 “單一儲存” 向 “分散式認知架構” 演變,記憶管理重點轉向“智慧篩選與整合”,並在 “記憶” 與 “遺忘”間找到合理的平衡,將成為AI發展的新趨勢。
05
量子計算,引爆算力革命
未來,量子計算的發展將為大模型帶來了前所未有的機遇,甚至會引發新的算力革命。去年年底,谷歌釋出的量子晶片willow就是這一程序中的里程碑,讓我們看到了算力革命的新曙光。
雖然谷歌尚未完全公開細節,但量子晶片的出現預示著算力將得到巨大提升,已是無可爭辯的事實。量子計算基於量子位元(qubit)進行運算,相較於傳統計算機的二進位制位元,量子位元能夠同時表示多個狀態,這使得量子計算機在處理複雜問題時具有指數級的計算優勢。這一優勢,將在大模型的訓練和推理過程中,起到至關重要的作用。
眾所周知,傳統的大模型訓練需要耗費大量的時間和計算資源,而量子計算卻能憑藉強大的算力優勢,大大縮短訓練時間,提高模型的迭代速度,因此也就有了非常廣泛的應用需求。比如,在藥物研發領域,大模型可以利用量子計算的算力快速分析分子結構和藥物活性之間的關係,加速新藥研發程序;在氣候模擬方面,能夠更加精準地模擬氣候變化趨勢,為應對氣候變化提供科學依據。
儘管量子計算仍面臨一些技術挑戰,但K哥相信,2025年這一領域會有持續性突破。
06
端側模型,快速崛起
隨著移動裝置和物聯網裝置的普及,能夠滿足智慧裝置需求、提供更快速高效AI服務的端側模型,將會在2025年進一步崛起。
當前,端側部署的技術路線發生了顯著變化,已經從過去“壓縮大模型” 逐漸向 “最佳化小模型”的趨勢轉變。這一轉變是基於對裝置資源的合理利用和效能需求的綜合考慮,以 Gemma 2 2B 為例,它把通用端側模型的引數規模上限提升到了2.6B,並透過一系列技術創新,讓該模型在效能上表現得非常高效。
這一變化將使端側模型在資源受限的裝置上,也能發揮出色的作用。比如在智慧手機領域,端側模型可以實現即時影像識別、語音助手等功能,而無需將資料傳輸到雲端進行處理,大大提高了響應速度和使用者隱私保護;在智慧家居感測器、可穿戴裝置等物聯網裝置中,端側模型能夠實現本地資料處理和智慧決策,降低裝置對網路的依賴,提高裝置的自主性和穩定性。
端側模型的崛起,將推動智慧裝置的智慧化水平提升到一個新的高度,也必然會為使用者帶來更便捷、更高效的智慧體驗。
07
具身智慧,大發展
具身智慧主打AI與物理世界的互動和融合,從而更好地理解和操控現實世界。這一需求也將在2025年進一步顯現。
從目前技術突破來看,具身智慧在本體控制、靈巧手、觸覺感測和表情模仿等多個維度,都取得了不同程度的進展。比如,本體控制技術的提升使機器人能夠更加穩定、精準地執行各種動作;靈巧手的發展讓機器人能夠完成更加精細的操作,如抓取、操作工具等;觸覺感測技術使機器人能夠感知外界物體的形狀、質地和力度,提高了其與環境互動的安全性和準確性等等。
具身智慧不僅是技術的提升,更是人機互動方式的革新。AI系統將不再侷限於螢幕前的靜態互動,而是能夠透過機器人或其他智慧裝置與人類進行更加自然、深入的互動。隨著具身智慧的不斷普及和推廣,將為教育、醫療、服務等行業帶來新的發展機遇。
08
人形機器人、空間智慧,開始商用
人形機器人和空間智慧作為大模型應用的重要領域,也將在2025年取得快速發展,二者相互關聯、相互促進。
人形機器人融合了形態結構與認知互動能力,旨在實現類人化的感知、決策與動作能力。在感知方面,人形機器人配備了多種感測器,如視覺感測器、聽覺感測器、觸覺感測器等,能夠即時感知周圍環境的資訊。依靠大模型,機器人可以對這些感知資訊進行快速處理和理解,從而做出準確的決策。在動作執行方面,隨著機械結構和驅動系統不斷最佳化,人形機器人可以做出行走、奔跑、抓取物體等更靈活更自然的動作。
空間智慧則致力於透過多維感知和理解構建三維世界模型,實現空間定位、場景理解與環境互動。3D資料獲取和演算法,是決定空間智慧水平的關鍵因素。這些問題也會在未來獲得更多的突破。比如,在3D 資料獲取方面,隨著雷射雷達、深度相機等裝置效能的提升,空間智慧將能夠獲取更準確、豐富的 3D 資料。在演算法創新方面,ReKep 框架和關係關鍵點約束等技術的應用,為空間智慧提供了強大的支援。
09
AI自迴圈:合成數據
AI系統透過自身生成的資料來訓練和改進自己,而不需要依賴外部資料來源,這一過程被稱為AI自迴圈。在這個過程中,最關鍵的就是資料的合成,這些合成數據可以彌補現實資料的不足,為大模型訓練提供更多樣化的資料來源。在新的一年,AI合成數據技術同樣將變得愈發重要。
目前已經有很多大廠和機構投入到這一領域的研究,比如英偉達、World Labs 等,都取得了不同程度的進展。但同時我們也要明白,資料量的增加只是基礎,資料質量和資料結構的最佳化才是關鍵。未來合成數據的側重點,還是要從擴充資料轉向創造知識,並透過系統化方法,提升資料訓練資料的質量。
10
大模型“第一性原理”,仍然適用
隨著大模型引數數量的增加,其效能也會相應提升。這個被稱為大模型“第一性原理”的Scaling Law仍然適用,甚至可以據此解決幻覺問題。比如,在內容生成領域,透過增加高質量資料,大模型能夠更好地理解語言的語義和邏輯關係,從而生成更加準確合理的文字,大大減少生成內容中不靠譜的幻覺現象。
當然,Scaling Law 的應用也面臨計算資源、資料質量等一些因素的制約。但這些問題並非不能克服,而是可以透過創新的演算法設計、高效的計算架構和嚴格的資料篩選與預處理,來加以解決。
以上是K哥拋磚引玉,大家有什麼高見,歡迎交流討論。
作者簡介:Mr.K,黃哲鏗,企業數字化轉型專家,「頓悟山丘」創始人,科技博主,曾擔任海爾、中通快遞、1藥網技術高管,著有《技術人修煉之道》《技術管理之巔》。分享:個體成長、科技趨勢、數字化轉型、商業洞察。
THE END
如果喜歡我們的文章
可以點選右下角的在看

相關文章