一年半走訪100家企業,阿里雲尋找AI落地的答案

“中國發展 AI 的優勢是,我們離行業最近。”
今年 3 月,一個名為 “ MBTI 小行家” 的賬號開始在微博上活躍,微博使用者只要 @ 它,它就會根據使用者的過往微博判斷其 MBTI 人格型別,並解答疑惑。上線兩週後,MBTI 小行家的微博粉絲就接近百萬。

這位新晉網紅並非真人,而是一個 AI 評論機器人,它是微博以通用大模型為基礎架構,結合微博的資料訓練和微調出來的模型。
微博 COO、新浪移動 CEO 王巍告訴我們,以 “ MBTI 小行家” 為代表的一批 AI 賬號上線後,已讓微博的互動率提升了約 10%,這是衡量網際網路社群產品的重要指標之一。
從去年到今年,市場焦點是大型科技公司和大模型獨角獸的技術、產品與價格競爭。微博等公司的實踐是大模型熱潮的另一面:一批公司已在嘗試用大模型改造和最佳化已有業務流程,或尋找新的商業機會。
在教育領域,新東方用大模型智慧定製學習計劃、即時回覆學生問題,學員滿意度提升了 3%。營銷推廣服務商易點天下基於大模型和自己積累的廣告營銷資料研發了 AI 數字人,還使用生成式 AI 技術把影片製作時間從 12 小時縮短到了 5 分鐘。中國一汽的大模型 GPT-BI 應用能在 5 秒內快速生成財務、質保等環節的多變數報表,該模型準確率達 92.5%。
類似的場景正在中國不同行業出現,這些變化被記錄在《雲上的中國 3:劇變中的 AI 時代》裡。這本由財經作者吳曉波和阿里雲聯合策劃撰寫的書已在 6 月 12 日正式出版。
中國 AI 產業紀錄片《雲上的中國 3:劇變中的 AI 時代》也於近期上線。
2020 年、2022 年間出版的《雲上的中國 1》和《雲上的中國 2》記錄了中國企業如何使用雲計算和大資料等技術從工業化轉型向數字化。去年 8 月起,阿里雲和吳曉波又陸續走訪了約 100 家提供 AI 技術或使用 AI 應用和服務的企業,試圖在這些公司的嘗試中找到可能的 AI 落地答案。

第一批用起大模型的公司
“應用場景是我們這次最大的優勢。” 吳曉波認為,中國人口多、市場大,過去多年的生產效率大幅提升,中國是世界工廠也是消費大國,有大量生產和消費場景,這都是 AI 可以改造和最佳化的物件。
在《雲上的中國 3》拍攝走訪的企業中,目前有兩類應用 AI 的主流方式:一是把 AI 放到已有業務裡,提升產品和服務效率或降低成本,這是一批成熟企業的選擇。
“今年是專業大模型的元年。” 吳曉波觀察到,這裡的專業大模型與通用大模型對應,指面向不同行業、不同業務方向的大模型。
新浪微博從今年初開始在社群裡新增大模型聊天機器人。王巍說,作為社交媒體平臺,微博想用大模型實現 3 個效果:增加互動、幫助生成平臺內容、提升平臺影響力。上文提到的 “MBTI 小行家” 就是用大模型增加互動的嘗試。
大模型目前仍有 “幻覺” 問題,即它會輸出一些看似合理但不真實、不準確的內容。但這在微博的評論和互動場景中反而是個特色。微博特意保留了模型的一些幻覺,讓它不時語出驚人。
微博也是電視劇、綜藝等文娛產品的宣發重地 ,微博也正嘗試用 AI 大模型生成影視角色賬號等衍生內容。如去年的熱播劇《長月燼明》中的男主角澹臺燼和女主角黎蘇蘇的微博角色賬號其實都是學過劇本的 AI 機器人,他們能代入劇中角色的人設與網友互動。
王巍說,微博未來還會邀請做 AIGC 的創業公司入駐,他設想的互動場景包括:使用者在某文生圖賬號下寫一句話,這個賬號就可以自動以這句話為提示詞生成圖片,發到評論區。這是現在小紅書等平臺上不少真人博主吸引關注的方式,AI 可以讓這件事自動化,增加社群活躍度。
智聯招聘則把大模型用於提升 HR 客戶的招聘效率和內部管理培訓效率。智聯招聘 CTO 王昊稱,智聯招聘從去年開始在通義千問大模型基礎上完善 “招聘助手” 功能,還推出了 AI 發職位助手、AI 篩簡歷工具和 AI 處理投遞助手等一批產品 ,這幫助智聯的 HR 客戶把釋出職位的時間縮減了 90%、匹配效率提升 100%、處理投遞的效率則提升了 300%。
為解決團隊裡數千名銷售的培訓問題,智聯招聘還訓練了大模型培訓助手。這個專業模型學習了智聯招聘的銷售標準流程和話術,一線銷售人員遇到問題可以直接求助於模型支援的聊天機器人,獲得解決方案和話術建議。王昊稱,這套嵌入了 AI 大模型的新流程已幫助智聯招聘把銷售人員的培訓週期從兩週縮短到了數天。
2023 年第三季度,技術諮詢機構 Gartner 調查了 1400 名企業領導者,其中 45% 表示,他們的公司正在嘗試使用生成式 AI 技術,10% 稱已上線相關的解決方案;而在半年前,僅有 4 % 的組織已將 AI 實際投入使用。
還有一些公司用大模型和 AI 尋找新落地場景,建立新業務流程。
被記錄在《雲上的中國 3》裡的童語故事是一個 AI 原生創業公司。去年 7 月,當時剛成立 3 個月的童語故事上線了 AIGC 兒童繪本產品,目前已有超 200 萬用戶。
當想給孩子製作個性化繪本的家長和一些幼教機構的老師在童語故事小程式裡輸入大致的故事方向和風格後,AI 即可生成完整故事,再根據故事生成有影像和聲音的定製兒童繪本。
《雲上的中國 3》紀錄片中展現使用者使用童語故事產品製作個性化兒童繪本。
在這套內容製作流程中,童語使用了多種模型,包括大語言模型通義千問、AI 繪畫創作模型通義萬相等。
“我們在等待國內出現像 Sora 一樣可用的影片生成模型。” 童語故事創始人張華期待影片生成技術給定製化繪本帶來更好的體驗。
接下來,童語故事會上線 App 版本,並對部分功能收費。同時,童語故事也將為教育機構、出版社等企業客戶提供定製化動畫服務。
吳曉波告訴我們,他目前最看好的方式是在相對成熟的商業流程和業務中加上 AI:“大模型應用和產品就好像電鑽,原來的應用則是錘子,大模型可以提升幾倍的效率;而原本就會用錘子,且已經找到了釘子即應用場景的公司,能最快發揮電鑽的價值。”
更快、更便宜使用大模型的方法
世界著名科技雜誌《連線》的創始主編凱文·凱利(Kevin Kelly)曾在去年出版的《5000 天后的世界》中預測:未來將會是一切都連線著 AI 的世界。
下一代智慧裝置會進入生活;生成式 AI 能快速、高效地產出創意內容;智慧化的諮詢能給個人和企業提供更精準、便捷的體驗,AI 也在支援人類更高效進行科學研究,比如更準確的預測天氣,和預測蛋白質結構,幫助提升藥物研發成功率。
這些涵蓋生活、生產和科研探索的新技術和應用都需要 AI 算力基礎設施支援,在一眾希望抓住這個機會的中國科技公司裡,阿里雲是投入最激進的一家。
去年 11 月,剛剛擔任阿里雲 CEO 不到 2 個月的吳泳銘在季度財報分析師電話會上提出了阿里雲新戰略:“AI 驅動,公共雲優先。” 這成為此後兩百多天裡阿里雲的指向標:快速的模型迭代、大手筆的對外投資,升級基礎設施、降低基礎雲服務和大模型 API 價格,阿里雲的這些動作都加速了行業對 AI 的嘗試和應用。
吳曉波在《雲上的中國 3》中採訪了阿里雲計算平臺事業部負責人汪軍華,他提到模型和應用出來後,上億使用者每天都會用,應用和推理的成本會比訓練高一到兩個數量級,提升大模型的訓練效率以及雲計算的效率是各大 AI 企業和雲計算提供方要面對的問題。
目前阿里雲的 AI 大模型佈局從上到下分為大模型本身,和使用模型的工具和基礎 AI 算力,阿里雲正試圖用這些不同層次的技術和產品幫企業更高效地用上 AI 和大模型。
在模型層,阿里雲自 2019 年就開始嘗試訓練大規模預訓練語言模型,釋出過語言大模型 Plug 和多模態大模型 M6。2022 年 9 月,阿里雲正式釋出阿里通義大模型系列,現已包含大語言模型、圖片生成模型、視覺理解模型、音訊理解模型和程式碼大模型等多個模型。
通義大模型也是最早開源的中國大模型之一。就在上週五(6 月 7 日),通義千問第二代開源模型 Qwen2 釋出,包括 5 個尺寸的模型,最大的是 720 億引數模型 Qwen2-72B。
在由開源社群 Hugging Face 組織的測評榜單 Open LLM Leaderboard 中, Qwen2-72B 目前排名全球第一,在自然語言理解、知識、程式碼、數學及多語言等多項能力上超過了同參數規模的 Llama3 和 Mistral8 等海外模型。
從一開始就決定不做大模型的微博,在調研後選擇接入通義模型。微博 COO、新浪移動 CEO 王巍說:“我們自己測試了所有的大模型,通義不僅效能好,而且最有誠意,在去年 12 月就開源了第一版 720 億引數的模型。”
開源高效能模型的同時,阿里雲也把閉源模型的價格降到了同規模模型中的行業最低——今年 5 月,對標 GPT-4 的 Qwen-Long API 輸入價格降至了 0.5 元 / 百萬 Tokens。
騰訊、百度、位元組也都紛紛降價或推出免費優惠,降價力度較大或免費的模型多為引數量更小的輕量模型。豆包最高效能模型 pro(128k)價格目前仍有 50 元 / 百萬 Tokens。
在算力和模型工具層,阿里雲自 2019 年以來一直是中國雲計算市場最大的 IaaS (基礎設施即服務)服務商。新的 AI 機會中,阿里雲也在提供各種基礎服務和工具。
阿里雲的 PAI- 靈駿、飛天雲平臺等工具能幫助企業提高使用 AI 的效率。PAI- 靈駿能提供無伺服器技術和高效能網路,調配阿里雲在全國各個資料中心的算力;飛天雲平臺則能透過一系列設計避免故障導致的訓練中斷和重新計算,從而減少算力浪費。
一個案例是,吉利汽車 1000 個智駕模型的訓練時長已從 3 個月縮短到雲上的 8 小時,支援他們訓練提速 200 倍、整體研發效能提升 20% 的,是在湖州的吉利星睿智算中心。吉利汽車研究院技術規劃中心兼資料智慧開發中心主任陳勇認為,組織和產品競爭力的提升,是技術價值的體現。
吉利汽車基於阿里雲的工具,更高效地訓練汽車行業模型。
去年,在飛天雲平臺基礎上,復旦大學、阿里雲和中國電信共同打造了為解決複雜科學問題而建立的科研智慧計算平臺 CFFF(Computing for the Future at Fudan)。復旦基於 CFFF 訓練出了擁有 45 億引數的伏羲氣象大模型,可在 3 秒內預測全球未來 15 日的天氣。
《雲上的中國 3》中,復旦伏羲氣象大模型的預測結果。
2023 年 10 月釋出的百鍊平臺能幫中小企業和非 AI 企業更方便地定製自己的專屬模型。
成立於 1996 年、提供電力終端使用者計費和客戶服務的朗新科技,透過百鍊平臺提供的定製化訓練、微調、部署、測評等工具,結合電力行業專業語料,開發了自己的 “電力賬單解讀智慧助手”,使人工處理工單量下降了 70%。
吳曉波在《雲上的中國 3》走訪期間曾提出一個問題:” 中國的百模大戰,出口在哪裡?“魔搭社群是他看到的可能答案。2022 年底,大模型熱潮尚未到來時,阿里發起的模型社群魔搭(ModelScope)就已經上線,並上架了阿里自研的 300 個模型。
魔搭去年又陸續吸引了智譜 AI、瀾舟科技、深勢科技等其它 AI 公司上架其開源模型。該社群現在已有 4500 多款 AI 模型,聚集了 500 萬開發者。
魔搭社群技術負責人陳穎達認為中國需要一個自己的開源模型社群:“我們相信模型的使用正規化會發生變化,未來要讓沒有任何程式碼基礎的使用者也可以把示例程式碼跑通。”
今年初以來,阿里也成為了中國 AI 和大模型領域最主要投資方:先是投資大模型公司月之暗面 8 億美元,此後又投了另一家大模型獨角獸 MiniMax 數億美元。國內大模型獨角獸中,零一萬物、百川智慧、智譜 AI 也曾被阿里投資。
對 AI 的激進投入已部分表現在阿里雲的業績中:據阿里 2024 財年第四季度(2024 年 1 至 3 月),阿里雲 AI 相關收入同比增長超 100%。
增長變稀缺,更多企業向技術要效率
《雲上的中國 3 》紀錄片提到,各行業企業之前就在用產業網際網路改造自己的業務,2023 年之後的明顯變化是 AI 逆勢崛起。
攀鋼投資 300 多億元建造了年產 450 萬噸的大型鋼廠西昌鋼釩,在 2018 年,阿里雲找到攀鋼想要為這座大型鋼廠提供數字化的全套解決方案。但攀鋼覺得 1000 萬的合作費太貴,於是阿里雲先免費試點。阿里雲的一位畢業於麻省理工的博士帶著十餘人在西昌鋼釩所在地大涼山駐紮了一年多,他們做出的數字化方案中,僅是鍊鋼爐的鐵水和合金新增和鋼板表面檢測兩個專案就讓攀鋼省下了數千萬元。
在成都到宜賓的成宜高速路段的一個檢查站裡,阿里雲的二十多名員工自 2020 年起駐站了兩年,搭建起了成宜高的車路數字孿生系統。
吳曉波發現,阿里雲在最初服務這類非網際網路和科技客戶時,總想一口氣提供全套解決方案,但在實施過程中逐漸認清,上雲需要 3-5 年的共建。這之後數年,阿里雲用一個個案例逐漸覆蓋了智慧製造、智慧城市和金融科技等垂直領域,瞭解了不同行業的需求,積累了解決方案,這些行業 knowhow 如今也能幫阿里雲推動大模型在具體行業的落地。
他認為,中、美、歐在發展 AI 上各有優勢:美國的優勢在演算法上,微軟、Google、Meta 等大廠,以及 OpenAI、Antropic 等創業公司都在不斷突破通用大模型技術;歐洲因工業基礎雄厚,SAP、西門子等數字化廠商也積累了大量生成流程資料,這與 AI 結合後能提升工業生產力。
中國的優勢則是:“我們離行業最近。” 吳曉波看到電商、金融、醫療和製造業等各種場景都可以結合 AI。在全球經濟增速放緩的當下,越來越多的企業向技術要效率,尋找新發展方式。
未來更深入的智慧化,還有基於新的 AI 技術發現新需求,乃至建立新商業模式。這可能是下一部走訪中國企業智慧實踐的紀錄片會觀察的主題了。
題圖來源:阿里雲
·  FIN  ·

相關文章