大模型在先，小模型在後，生成式AI試水工業，如何破局資料短缺/可靠性不足？

作者：彭昭（智次方創始人、雲和資本聯合創始合夥人）

物聯網智庫原創

這是我的第352篇專欄文章。

在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中，曾經提到小模型SLM的進展，如今這一領域正在悄然發生突破。

小模型SLM，可以看作是大模型LLM的“迷你版”，它們雖然體型小巧，但卻擁有著不容小覷的能力。相比動輒數百萬、數十億引數的GPT-4等大模型，SLM的執行規模要簡單得多。經過最佳化的SLM能夠高效處理較為簡單的任務，而無需消耗大量計算資源。

如今，小模型正朝著產業落地的方向大步邁進，它們不再是實驗室裡的“玩具”，而是正在成為各行各業的“生力軍”。

科技巨頭們已經嗅到了小模型的無限潛力，紛紛加入這場爭奪未來的戰局。

微軟、谷歌和蘋果等公司均已入局小模型SLM，例如微軟的Phi-3、谷歌的Gemma和蘋果的Foundation Models。

最近，微軟更是推出了適用於工業領域的全新AI小模型。

透過與拜耳、羅克韋爾自動化、西門子等公司合作，這些小模型使用行業特定資料進行了預先訓練，可用於處理一些關鍵問題。這就像是為每個行業量身定製了一套“智慧裝備”，讓AI的力量深入到每個生產環節，提升效率、最佳化流程、創造價值。

今天這篇文章，我們將一起探索小模型在工業應用中的最新進展，瞭解它們所蘊藏的機遇與挑戰。

小模型與AI代理：下一個熱門？

首先，我們需要進一步理清大模型與小模型之間的區別，如上圖所示。

小模型之所以“小”，不僅僅在於其引數數量較少，更重要的是，小模型常常在小型資料集上進行微調，以最佳化其在特定任務上的效能，使其更加契合業務工作流的需求。

小模型的強項在於處理特定任務和工作流程。儘管引數數量有限，但當使用定製資料集針對特定領域任務進行微調時，小模型完全能夠勝過大型通用模型。針對特定任務的訓練可以減輕幻覺現象，增強問題解決能力。

資源效率是小型語言模型的另一大亮點，對於希望跨越各種平臺和裝置實施AI解決方案的企業來說，它們尤其具有吸引力。小模型使企業能夠以更簡單的基礎架構和更低的成本，充分享受AI帶來的優勢。據測算，小模型可以節省高達75%的模型訓練成本和超過50%的總部署成本。

在小模型的基礎上，我們還可以玩出許多新花樣。

一些公司將小模型用於AI代理工作流中，其中多個小模型透過通訊和協作來執行更加複雜的任務。

例如，在AI代理工作流中，第一個AI代理可能負責規劃如何解決任務，第二個AI代理進行必要的研究，第三個AI代理執行該計劃，第四個AI代理則驗證和評估結果。這種協作方式展示了這些模型如何協同工作，以提高生產力並實現更復雜的結果。

說到這裡，我來解釋一下什麼是AI智慧代理。

AI代理的官方定義是一種能夠感知環境、進行決策和執行動作的智慧體。

簡而言之，ChatGPT不屬於AI代理，但戰勝李世石的AlphaGo可以被視為AI代理。

目前，我們與AI的互動形式基本上都是先輸入指令，AI模型根據指令內容做出響應，這就導致我們每次都需要提供有效的提示詞，才能達到預期效果。

而AI代理則不同，它被設計為具有獨立思考和行動能力的AI程式。我們只需要提供一個目標，比如寫一個遊戲、開發一個網頁，AI代理就會自主生成一個任務序列，開始工作。

讓我們通過幾個例子來更深入地理解AI代理。

一個初級的AI代理，是家中的空調自動控制系統。它遵循簡單的“如果-那麼”原則執行：如果溫度低於設定點，則開啟空調暖風；如果溫度高於設定點，則關閉空調暖風。這種基礎的AI代理雖然簡單，但在日常生活中已經發揮了重要作用。

而高階的AI代理，如DeepMind的AlphaGo，則是專為複雜的圍棋而設計的人工智慧系統。AlphaGo展示了非凡的學習能力，最終擊敗了世界冠軍圍棋選手。這一里程碑式的事件，彰顯了AI代理在處理複雜任務方面的巨大潛力。

就像俄羅斯套娃一樣，多個初級和高階的AI代理可以建立起分層代理系統。

分層代理是一種將複雜任務分解為更簡單的子任務，並以分層結構組織起來的AI系統。這種方法允許代理管理不同級別的抽象，更有效地處理複雜問題。

分層代理的一個典型例子，就是亞馬遜Amazon Go商店的“Just Walk Out”技術。該系統在運作中表現出了清晰的層級結構：

頂層：整體商店管理和庫存跟蹤
中級：客戶跟蹤和行為分析
低階：產品識別和互動檢測
最低級別：感測器資料處理和融合

依靠這些AI代理的協同工作，Amazon Go以“不用排隊，拿了就走”的全新購物體驗，在零售行業和科技圈吸引了無數目光。

上述案例只是冰山一角，AI代理在實際應用中的想象力正在被激發。

小模型與Copilot覆蓋超100家公司12萬用戶

在瞭解了小模型與AI代理的概況後，讓我們一起探索微軟與工業企業的最新合作。

本次嘗試微軟小模型的企業包括拜耳、羅克韋爾自動化、西門子、Sight Machine等。

以羅克韋爾自動化為例，該公司從操作層面開始嘗試應用小模型。在人機介面視覺化平臺FactoryTalk Optix的食品和飲料版本中，他們運用小模型，將行業特定功能的優勢帶給製造業一線工人，支援食品和飲料領域的資產故障排除。AI模型為工廠車間工人和工程師提供關於特定製造流程、機器和輸入的即時建議、解釋和知識。

另一款產品FactoryTalk Design Studio是羅克韋爾自動化專注於系統設計的雲原生軟體，它使用Copilot增強了PLC程式碼建立和使用者管理。工程師能夠使用自然語言提示執行產品指導、程式碼生成、故障排除和程式碼解釋等任務，使系統設計更快、更直觀。

同樣，西門子正在為CAD解決方案NX X軟體引入全新的Copilot。該軟體利用經過調整的AI模型，使使用者能夠透過自然語言提問、獲取詳細的技術見解並簡化複雜的設計任務，實現更快、更智慧的產品開發。

目前，包括舍弗勒和蒂森克虜伯自動化工程在內的100多家公司正在使用西門子工業Copilot來簡化流程、解決勞動力短缺問題並推動創新。12萬名西門子工程軟體使用者，現在有機會透過生成式AI驅動的助手來提升工作效率。

作為敢於吃螃蟹的使用者，蒂森克虜伯自動化工程公司是首家使用Copilot的公司，並且計劃從2025年初開始，在該公司的全球體系內普及應用。

根據實踐，工程師現在可以在30秒內建立視覺化面板，並生成程式碼，根據經驗這些程式碼僅需20%左右的調整就可以直接應用。這簡化了工作流程，減少了人工工作量，解決了熟練勞動力短缺的問題。

就具體場景而言，蒂森克虜伯使用AI輔助開發用於生產汽車電池的自動化系統。例如在一臺電池質量的檢測裝置中，感測器、攝像頭和測量系統整合在一起，監控多個階段的電池單元質量，進行復雜的評估以檢測超出設定閾值的放電。Copilot透過自動執行多個任務，如資料管理、感測器配置、電池質量檢測等各個重複性步驟，輔助操作員增強了該裝置的執行效果。

Copilot：工業生成式AI的現實角色

在工業領域，“想到”和“做到”完全是兩碼事，生成式AI的工業價值尚需被驗證。

古人云“欲得其利、先知其弊”，要充分發揮小模型的優勢，就必須瞭解它的侷限性。

生成式AI的弊端在於可靠性較低，具有不可解釋性，只能應用於對可靠性要求不高的場合。

小模型的缺點則是精度有限，無法捕捉大規模和複雜資料集中的細緻特徵和關係，預測能力相對較弱；此外，它們難以應對複雜問題。這些弊端決定了小模型只能承擔輔助思考的角色，為我們提供更多可行性方案作為選擇，而最終決策仍需由人來做。

在實際應用過程中，也是挑戰重重。

工業領域廣泛使用AI的最大障礙是資料的缺失。由於工業涉及裝置、工藝、操作、環境等多重因素影響，獲取大量且多維的全面資料難度很大。大多數製造商雖然坐擁資料，但其中大部分是時間序列資料，沒有得到適當的標準化，甚至無法用於AI的模型訓練。

資料問題的本質，很多時候不單純是技術問題，而是人員和流程問題。不成熟的資料管理流程、始終存在的OT與IT鴻溝，以及缺乏對小模型的理解，都是導致生成式AI目前僅限於一次性試點或實驗的因素。

因此，目前生成式AI在工業領域更多以虛擬助手的功能存在，並將會持續較長時間。

這些AI虛擬助手為工廠車間操作員提供指導，或幫助控制工程師編寫PLC程式碼。鑑於當前吸引和留住工廠車間人才的挑戰，Copilot能夠輕鬆幫助合成即時資訊或提供編碼輔助。

過去，工程師需要熟悉雲平臺、感測器、物聯網、人工智慧和不同型別的時間序列和工程資料，而生成式AI則允許工程師輕鬆進行資料查詢、視覺化和工作流程，而無需擔心複雜性。操作員可以按需提出問題，而不需要了解軟體。

許多製造企業配備了複雜的系統和更多的自動化裝置，但那些擁有幾十年經驗與知識的資深員工卻逐漸離開了職場，製造商們很難找到年輕的技術人員來維護現有的系統。Copilot可以成為幫助縮小這一差距的工具。

例如，工業軟體企業Aveva的AI助手可以幫助操作員回答以下問題：上個月車間的最大產量是多少？或者為什麼這臺壓縮機本週效率較低？杜邦公司也已經開始使用生成式AI來幫助工程師更快地找到資訊，生成式AI可以節省數小時的手冊搜尋時間。

這些Copilot就像操作員的專家顧問，根據需要建議如何提高產量、降低能耗等。從某種意義上說，它們與原有的“專家系統”並沒有本質區別，是否採納這些建議取決於操作員。

面臨的挑戰也與過去的“專家系統”大同小異：如何建立對顧問的信任。工廠中的新配方經常出現，如果沒有適當的更新和維護，專家系統也會很快過時。另一個風險在於，如何檢查和驗證所有生成式AI的輸出。AI不會說“我不知道”；如果沒有資料，它可能會進行編造。

寫在最後

在這個萬物互聯、智慧無處不在的時代，小模型和生成式AI正在工業領域掀起一場革命。從製造車間到產品設計，從運營最佳化到故障診斷，AI正在重塑著每一個環節。

然而，我們也必須清醒地認識到，工業領域的AI應用之路並非坦途。資料缺失、可靠性不足、解釋性有限等挑戰，都在提醒我們要謹慎對待這項新興技術。儘管如此，我們仍然有理由對未來保持樂觀。

隨著技術的不斷進步和企業實踐的深入，人機協作將更加緊密，小模型和生成式AI也將在工業領域釋放出更大的潛力。

參考資料：

《忍不住談談工業大模型》，作者：郭朝暉，來源：蟈蟈創新隨筆

《Microsoft Introduces New Adapted AI Small Language Models for Industry》，作者：Colin Masson，來源：ARC Advisory Group

《What is Agentic AI? Is It the Next Big Thing?》，作者：Nora He，來源：arcee.ai

dignews.cc

大模型在先，小模型在後，生成式AI試水工業，如何破局資料短缺/可靠性不足？

小模型與AI代理：下一個熱門？

小模型與Copilot覆蓋超100家公司12萬用戶

Copilot：工業生成式AI的現實角色

寫在最後

相關文章

集齊了「鴻蒙」和「DeepSeek」兩顆「龍珠」，深思考給出端側AI「深度思考」

深思考釋出超小端側多模態大模型，已在醫療、智慧終端等領域落地

阿里雲鍛造全棧智慧加速AI勢能變動能

MistralAI：法國冬季的寒風，迎戰AI之巔

AI大模型如何影響基礎軟體行業中的開發工具與環境？

三位哈佛00後聯手創業，7個月拿下億元估值

AI衝擊！嵌入式開發如何轉型？嵌入式開發者必看

從手機PC到汽車AIoT，DeepSeek卷爆端側AI

DeepSeek，又殺瘋了！

斯坦福456頁AI報告劃重點：中美AI競爭格局變了！