大模型在先,小模型在後,生成式AI試水工業,如何破局資料短缺/可靠性不足?

作者:彭昭(智次方創始人、雲和資本聯合創始合夥人)
物聯網智庫 原創
這是我的第352篇專欄文章。
在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中,曾經提到小模型SLM的進展,如今這一領域正在悄然發生突破。
小模型SLM,可以看作是大模型LLM的“迷你版”,它們雖然體型小巧,但卻擁有著不容小覷的能力。相比動輒數百萬、數十億引數的GPT-4等大模型,SLM的執行規模要簡單得多。經過最佳化的SLM能夠高效處理較為簡單的任務,而無需消耗大量計算資源。
如今,小模型正朝著產業落地的方向大步邁進,它們不再是實驗室裡的“玩具”,而是正在成為各行各業的“生力軍”。
科技巨頭們已經嗅到了小模型的無限潛力,紛紛加入這場爭奪未來的戰局。
微軟、谷歌和蘋果等公司均已入局小模型SLM,例如微軟的Phi-3、谷歌的Gemma和蘋果的Foundation Models。
最近,微軟更是推出了適用於工業領域的全新AI小模型。
透過與拜耳、羅克韋爾自動化、西門子等公司合作,這些小模型使用行業特定資料進行了預先訓練,可用於處理一些關鍵問題。這就像是為每個行業量身定製了一套“智慧裝備”,讓AI的力量深入到每個生產環節,提升效率、最佳化流程、創造價值。
今天這篇文章,我們將一起探索小模型在工業應用中的最新進展,瞭解它們所蘊藏的機遇與挑戰。

小模型與AI代理:下一個熱門?

首先,我們需要進一步理清大模型與小模型之間的區別,如上圖所示。

小模型之所以“小”,不僅僅在於其引數數量較少,更重要的是,小模型常常在小型資料集上進行微調,以最佳化其在特定任務上的效能,使其更加契合業務工作流的需求。
小模型的強項在於處理特定任務和工作流程。儘管引數數量有限,但當使用定製資料集針對特定領域任務進行微調時,小模型完全能夠勝過大型通用模型。針對特定任務的訓練可以減輕幻覺現象,增強問題解決能力。
資源效率是小型語言模型的另一大亮點,對於希望跨越各種平臺和裝置實施AI解決方案的企業來說,它們尤其具有吸引力。小模型使企業能夠以更簡單的基礎架構和更低的成本,充分享受AI帶來的優勢。據測算,小模型可以節省高達75%的模型訓練成本和超過50%的總部署成本。
在小模型的基礎上,我們還可以玩出許多新花樣。
一些公司將小模型用於AI代理工作流中,其中多個小模型透過通訊和協作來執行更加複雜的任務。
例如,在AI代理工作流中,第一個AI代理可能負責規劃如何解決任務,第二個AI代理進行必要的研究,第三個AI代理執行該計劃,第四個AI代理則驗證和評估結果。這種協作方式展示了這些模型如何協同工作,以提高生產力並實現更復雜的結果。
說到這裡,我來解釋一下什麼是AI智慧代理。
AI代理的官方定義是一種能夠感知環境、進行決策和執行動作的智慧體。
簡而言之,ChatGPT不屬於AI代理,但戰勝李世石的AlphaGo可以被視為AI代理。
目前,我們與AI的互動形式基本上都是先輸入指令,AI模型根據指令內容做出響應,這就導致我們每次都需要提供有效的提示詞,才能達到預期效果。
而AI代理則不同,它被設計為具有獨立思考和行動能力的AI程式。我們只需要提供一個目標,比如寫一個遊戲、開發一個網頁,AI代理就會自主生成一個任務序列,開始工作。
讓我們通過幾個例子來更深入地理解AI代理。
一個初級的AI代理,是家中的空調自動控制系統。它遵循簡單的“如果-那麼”原則執行:如果溫度低於設定點,則開啟空調暖風;如果溫度高於設定點,則關閉空調暖風。這種基礎的AI代理雖然簡單,但在日常生活中已經發揮了重要作用。
而高階的AI代理,如DeepMind的AlphaGo,則是專為複雜的圍棋而設計的人工智慧系統。AlphaGo展示了非凡的學習能力,最終擊敗了世界冠軍圍棋選手。這一里程碑式的事件,彰顯了AI代理在處理複雜任務方面的巨大潛力。
就像俄羅斯套娃一樣,多個初級和高階的AI代理可以建立起分層代理系統。
分層代理是一種將複雜任務分解為更簡單的子任務,並以分層結構組織起來的AI系統。這種方法允許代理管理不同級別的抽象,更有效地處理複雜問題。
分層代理的一個典型例子,就是亞馬遜Amazon Go商店的“Just Walk Out”技術。該系統在運作中表現出了清晰的層級結構:
  • 頂層:整體商店管理和庫存跟蹤
  • 中級:客戶跟蹤和行為分析
  • 低階:產品識別和互動檢測
  • 最低級別:感測器資料處理和融合
依靠這些AI代理的協同工作,Amazon Go以“不用排隊,拿了就走”的全新購物體驗,在零售行業和科技圈吸引了無數目光。
上述案例只是冰山一角,AI代理在實際應用中的想象力正在被激發。

小模型與Copilot覆蓋超100家公司12萬用戶

在瞭解了小模型與AI代理的概況後,讓我們一起探索微軟與工業企業的最新合作。

本次嘗試微軟小模型的企業包括拜耳、羅克韋爾自動化、西門子、Sight Machine等。
以羅克韋爾自動化為例,該公司從操作層面開始嘗試應用小模型。在人機介面視覺化平臺FactoryTalk Optix的食品和飲料版本中,他們運用小模型,將行業特定功能的優勢帶給製造業一線工人,支援食品和飲料領域的資產故障排除。AI模型為工廠車間工人和工程師提供關於特定製造流程、機器和輸入的即時建議、解釋和知識。
另一款產品FactoryTalk Design Studio是羅克韋爾自動化專注於系統設計的雲原生軟體,它使用Copilot增強了PLC程式碼建立和使用者管理。工程師能夠使用自然語言提示執行產品指導、程式碼生成、故障排除和程式碼解釋等任務,使系統設計更快、更直觀。
同樣,西門子正在為CAD解決方案NX X軟體引入全新的Copilot。該軟體利用經過調整的AI模型,使使用者能夠透過自然語言提問、獲取詳細的技術見解並簡化複雜的設計任務,實現更快、更智慧的產品開發。
目前,包括舍弗勒和蒂森克虜伯自動化工程在內的100多家公司正在使用西門子工業Copilot來簡化流程、解決勞動力短缺問題並推動創新。12萬名西門子工程軟體使用者,現在有機會透過生成式AI驅動的助手來提升工作效率。
作為敢於吃螃蟹的使用者,蒂森克虜伯自動化工程公司是首家使用Copilot的公司,並且計劃從2025年初開始,在該公司的全球體系內普及應用。
根據實踐,工程師現在可以在30秒內建立視覺化面板,並生成程式碼,根據經驗這些程式碼僅需20%左右的調整就可以直接應用。這簡化了工作流程,減少了人工工作量,解決了熟練勞動力短缺的問題。
就具體場景而言,蒂森克虜伯使用AI輔助開發用於生產汽車電池的自動化系統。例如在一臺電池質量的檢測裝置中,感測器、攝像頭和測量系統整合在一起,監控多個階段的電池單元質量,進行復雜的評估以檢測超出設定閾值的放電。Copilot透過自動執行多個任務,如資料管理、感測器配置、電池質量檢測等各個重複性步驟,輔助操作員增強了該裝置的執行效果。

Copilot:工業生成式AI的現實角色

在工業領域,“想到”和“做到”完全是兩碼事,生成式AI的工業價值尚需被驗證。

古人云“欲得其利、先知其弊”,要充分發揮小模型的優勢,就必須瞭解它的侷限性。
生成式AI的弊端在於可靠性較低,具有不可解釋性,只能應用於對可靠性要求不高的場合。
小模型的缺點則是精度有限,無法捕捉大規模和複雜資料集中的細緻特徵和關係,預測能力相對較弱;此外,它們難以應對複雜問題。這些弊端決定了小模型只能承擔輔助思考的角色,為我們提供更多可行性方案作為選擇,而最終決策仍需由人來做。
在實際應用過程中,也是挑戰重重。
工業領域廣泛使用AI的最大障礙是資料的缺失。由於工業涉及裝置、工藝、操作、環境等多重因素影響,獲取大量且多維的全面資料難度很大。大多數製造商雖然坐擁資料,但其中大部分是時間序列資料,沒有得到適當的標準化,甚至無法用於AI的模型訓練。
資料問題的本質,很多時候不單純是技術問題,而是人員和流程問題。不成熟的資料管理流程、始終存在的OT與IT鴻溝,以及缺乏對小模型的理解,都是導致生成式AI目前僅限於一次性試點或實驗的因素。
因此,目前生成式AI在工業領域更多以虛擬助手的功能存在,並將會持續較長時間。
這些AI虛擬助手為工廠車間操作員提供指導,或幫助控制工程師編寫PLC程式碼。鑑於當前吸引和留住工廠車間人才的挑戰,Copilot能夠輕鬆幫助合成即時資訊或提供編碼輔助。
過去,工程師需要熟悉雲平臺、感測器、物聯網、人工智慧和不同型別的時間序列和工程資料,而生成式AI則允許工程師輕鬆進行資料查詢、視覺化和工作流程,而無需擔心複雜性。操作員可以按需提出問題,而不需要了解軟體。
許多製造企業配備了複雜的系統和更多的自動化裝置,但那些擁有幾十年經驗與知識的資深員工卻逐漸離開了職場,製造商們很難找到年輕的技術人員來維護現有的系統。Copilot可以成為幫助縮小這一差距的工具。
例如,工業軟體企業Aveva的AI助手可以幫助操作員回答以下問題:上個月車間的最大產量是多少?或者為什麼這臺壓縮機本週效率較低?杜邦公司也已經開始使用生成式AI來幫助工程師更快地找到資訊,生成式AI可以節省數小時的手冊搜尋時間。
這些Copilot就像操作員的專家顧問,根據需要建議如何提高產量、降低能耗等。從某種意義上說,它們與原有的“專家系統”並沒有本質區別,是否採納這些建議取決於操作員。
面臨的挑戰也與過去的“專家系統”大同小異:如何建立對顧問的信任。工廠中的新配方經常出現,如果沒有適當的更新和維護,專家系統也會很快過時。另一個風險在於,如何檢查和驗證所有生成式AI的輸出。AI不會說“我不知道”;如果沒有資料,它可能會進行編造。

寫在最後

在這個萬物互聯、智慧無處不在的時代,小模型和生成式AI正在工業領域掀起一場革命。從製造車間到產品設計,從運營最佳化到故障診斷,AI正在重塑著每一個環節。
然而,我們也必須清醒地認識到,工業領域的AI應用之路並非坦途。資料缺失、可靠性不足、解釋性有限等挑戰,都在提醒我們要謹慎對待這項新興技術。儘管如此,我們仍然有理由對未來保持樂觀。
隨著技術的不斷進步和企業實踐的深入,人機協作將更加緊密,小模型和生成式AI也將在工業領域釋放出更大的潛力。

參考資料:

《忍不住談談工業大模型》,作者:郭朝暉,來源:蟈蟈創新隨筆

《Microsoft Introduces New Adapted AI Small Language Models for Industry》,作者:Colin Masson,來源:ARC Advisory Group

《What is Agentic AI? Is It the Next Big Thing?》,作者:Nora He,來源:arcee.ai


相關文章