
作者 | 華衛
6 月 28 日,百度推出了文心大模型 4.0 Turbo,並公佈一系列技術、產品、生態最新成果,包括新一代的飛槳框架 3.0、文心快碼 2.5。
“文心一言累計使用者規模已達 3 億,日呼叫次數也達到了 5 億。”現場,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰還披露了文心一言的最新資料。
王海峰認為,通用人工智慧已經越來越近,而大模型技術為其帶來了曙光:一是人工智慧技術的通用性,大模型在面向不同任務、語言、模態、場景時的通用性越來越強;二是能力的全面性,人工智慧的理解、生成、邏輯、記憶等四項基礎能力越強,越接近通用人工智慧。
大會現場,王海峰釋出了文心大模型 4.0 Turbo,網頁版、APP、API 陸續面向使用者開放,開發者登入百度智慧雲千帆大模型平臺即可使用文心大模型 4.0 Turbo API 服務。
據介紹,透過資料、基礎模型、對齊技術、提示、知識增強、檢索增強和對話增強等核心技術的持續創新以及飛槳文心的聯合最佳化,文心大模型 4.0 Turbo 的速度更快、效果更好。
其在基礎大模型的基礎上,進一步創新智慧體技術,包括理解、規劃、反思和進化,能夠做到可靠執行、自我進化,並一定程度上將思考過程白盒化,讓機器像人一樣思考和行動,能夠呼叫工具自主完成複雜任務,在環境中持續學習實現自主進化。
王海峰表示,文心一言 4.0 Turbo 的上下文輸入長度從 4.0 版的 2K tokens 升級到了 128K tokens,能夠同時閱讀 100 個檔案或網址,AI 生圖解析度也從 512*512 提升至 1024*1024。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,過去半年文心大模型取得了顯著進展,使用者日均提問量增加 78%,提問平均長度提升 89%。文心大模型為使用者提供的幫助從簡單需求延伸到更多元、複雜的任務。
截至目前,文心大模型已累計生成 70 億行程式碼、創作 5.9 億篇文章、編撰百萬篇專業研報、解答了 1.7 億學習問題,輔助 1.3 億人次工作等。與此同時,文心大模型還支援了大量的應用創新。“在大模型應用落地過程中,選擇合適的模型對應用效果至關重要。“吳甜介紹到。
具體能力表現上,文心輕量級模型適合解決確定場景的問題,同時具有成本更低、速度更快的優勢;3.5 是一個強通用性模型,適用於日常資訊處理和文字生成任務;4.0 規模更大、能力更強,具備更強的理解能力、邏輯推理能力與更豐富的知識,可以提供專業深度的幫助;4.0 工具版基於智慧體技術,擅長綜合運用多種工具和資料,按要求完成非常複雜的任務。
大會現場,百度還發布了與中國工程院朱有勇院士及團隊共同打造的首個農業智慧體“農民院士智慧體”,以及和上海體育大學共同研發的國內首個面向體育行業的大模型上體體育大模型。
“文心一言的快速發展,包括整個文心大模型的快速發展,離不開飛槳平臺的支撐。”王海峰表示。據介紹,文心大模型的持續快速進化,得益於百度在晶片、框架、模型和應用上的佈局,尤其是飛槳深度學習平臺和文心的聯合最佳化,包括訓練吞吐、分散式擴充套件、多模型結構混合並行和硬體通訊層的聯合最佳化。
現場,百度 AI 技術生態總經理馬豔軍主要詳細解讀了飛槳新一代框架 3.0 的設計理念和技術特點。“在 3.0 版本的設計中,我們充分考慮了目前大模型技術發展和異構多芯的趨勢,並從三個方面做了綜合考量,一是保障大模型訓練和推理的效能,二是足夠簡化大模型本身的開發和調優過程,三是更好適配各種各樣的晶片。”
據介紹,飛槳框架 3.0 面向大模型、異構多芯進行專屬設計,向下適配異構多芯,向上一體化支撐大模型的訓練、推理,同時具有動靜統一自動並行、編譯器自動最佳化、大模型訓推一體、大模型多硬體適配四項能力。
其中,自動並行能力可以把程式碼開發做更好的封裝,訓推一體讓訓練與推理的能力相互複用,為大模型全流程提供統一的開發體驗和極致的訓練效率。而透過一系列的編譯器自動最佳化過程,不管是對於語言模型還是擴散模型,整個推理效能都能提升到 30%。
飛槳框架 3.0 還為大模型硬體適配提供了功能完善、低成本的方案,建設了面向硬體廠商的程式碼合入、持續整合、模型迴歸測試等研發基礎設施,為硬體適配提供了全套保障。馬豔軍表示,“在 3.0 版本中,硬體廠商只需要針對基礎運算元做適配,大幅減少了對應的開發工作量。”
此外,新一代框架也為文心大模型提供了壓縮、推理、服務等支撐。在 AI for Science 領域,飛槳框架 3.0 為科學計算提供了高階自動微分、編譯最佳化、分散式訓練能力支撐,還建設了面向通用數理問題求解的賽槳 PaddleScience 以及專注於生物計算的螺旋槳 PaddleHelix 工具包。飛槳框架 3.0 還原生支援複數技術體系,這對於如氣象預報、汽車 / 飛行器氣動分析等場景下的資料特徵分析具有重要意義。
現場,百度副總裁陳洋宣佈智慧程式碼助手 Comate 的中文名為“文心快碼”,併發布了最新升級的版本文心快碼 2.5。據介紹,文心快碼 2.5 在知識增強、企業研發全流程賦能、企業級安全等方面實現了能力提升。
在之前續寫、解釋程式碼、問答等能力的基礎上,新版本可深度解讀程式碼庫、關聯權威公域和私域知識生成新的程式碼,生成的程式碼更加安全,並且可以智慧檢測安全漏洞、一鍵修復漏洞,支援混合雲部署等。
陳洋表示,文心快碼的“快”主要體現在三大方面:開發速度快、業務迭代快、企業落地快,提供標準版、專業版、企業版、企業專有版 4 大版本。
目前,百度 80% 的工程師已經在深度使用文心快碼,其中程式碼採納率已達到 46%,新增程式碼生成佔比 29%,百度單位時間提交程式碼數量增加 35%、研發單週交付佔比達到了 57%,整體研發提效 14% 以上。
“原本需要 7 天才能完成的工程量,在 5 天就能夠開發完成;百度內部一半以上的研發需求,可以在一週之內完成交付。”陳洋介紹,喜馬拉雅一個季度落地文心快碼的採納率就可以達到了 44%。
與此同時,文心快碼還已應用到包括上海三菱電梯、軟通動力、吉利汽車、晶合積體電路和奈雪的茶等企業,覆蓋金融、汽車、機械製造、軟體服務等諸多領域。
現場,百度文心大模型同甲骨文資訊處理教育部重點實驗室打造的“來自甲骨文的回答”互動程式也正式上線,透過呼叫文心一言的對話能力及對甲骨文文字的釋義,古老的甲骨文“活起來”了。
同時,百度與國際愛護動物基金會聯合釋出“AI 守護官 2.0 版”,透過飛槳平臺開發工具 PaddleX 定製打造的模型,提高了鑑別野生動物製品的準確度,縮短了耗費時間,用技術讓野生動物保護更加高效。
如今,大模型為代表的人工智慧正加速各行各業轉型升級。正如王海峰所說,人工智慧基於深度學習及大模型工程平臺,包括演算法、資料、模型、工具等,已經具備了非常強的通用性以及標準化、模組化和自動化的特徵,進入到工業大生產階段,通用人工智慧將加速到來。
AICon 全球人工智慧開發與應用大會將於 8 月 18 日至 19 日在上海舉辦,匯聚頂尖企業專家,深入端側AI、大模型訓練、安全實踐、RAG應用、多模態創新等前沿話題。現在大會已開始正式報名,6 月 30 日前可以享受 8 折優惠,單張門票節省 960 元(原價 4800 元),詳情可聯絡票務經理 13269078023 諮詢。


關鍵詞
模型
大模型
飛槳
技術
能力