站在風口的生成式AI，離真正起飛還有多遠？

本地視角記錄矽谷，全球視野關注創新

別忘了給我們加星標~

2023

新技術追蹤

BUSINESS

生成式AI的想象，不能只困在大模型裡。

文| Juny

生成式AI技術無疑是當前最大的時代想象力之一。

資本、創業者、普通人都在湧入生成式AI裡去一探究竟：“百模大戰”連夜打響，融資規模連創新高，各種消費類產品概念不斷湧現……根據Bloomberg Intelligence 的報告，2022年生成式AI 市場規模僅為400 億美元，預計到2032年這一數字將突破1.3 萬億美元，未來10 年的年均複合增速高達42%。

然而，表面上看著熱鬧非凡，但生成式AI技術的普及和轉化真的有我們想象的那麼高嗎？

在經歷了爆發式增長之後，6月以來，生成式AI聊天產品訪問量幾乎都出現了不同程度的下降。最新使用者調查顯示，有80%-90%以上的受訪者表示未來六個月都完全不會使用ChatGPT、Bard等聊天工具。從消費端看，大家目前似乎更多地把生成式AI產品當成了一種追趕時尚潮流的玩具，而非持續使用的工具。

而在企業端，這樣的現象就更為明顯。一旦人們切換到工作模式時，生成式AI工具便很少出現在大家的工作流程中，甚至還被很多大型公司等明令禁止或限制性使用。

圖片來自於摩根史坦利調查報告

對於一個比較成熟技術的商業轉化來說，6個多月的時間並不算短。但目前，關於生成式AI的狂想焦點似乎仍然還停留在大模型和產品概念上，人們預期所想看到的繁榮生態和對經濟社會所產生的變革性影響還尚未到來。

那麼，究竟是什麼桎梏著它的發展？

｜生成式AI的落地之困：如何打破基礎模型和開發者之間的“牆”？

所有人都不想錯過生成式AI浪潮。但當前生成式AI的超高進入門檻，把大部分玩家擋在了門外。

過去這些年來，透過“深度學習+大算力”進行模型訓練是實現人工智慧最主流的技術途徑。但大模型的商業化落地，必須得先回到成本核算上。

首先，大模型對算力的需求極大，是一個巨型“吞金獸”。GPT-3.5模型的訓練一次的成本約在300萬到460萬美元之間，一些更大的語言模型訓練成本甚至高達1200 萬美元。自研大模型是一個“無底洞”，不具備雄厚資金實力的創業公司根本無法承擔。

此外，通用模型並不能解決所有問題，能幫企業完成的事情非常有限。大模型的訓練都是基於網際網路上的公開資料完成，很多產品也相對孤立沒有形成一個連貫的、整體的工作流，不具備定製化能力。意味著開發人員需要結合私有資料做大量個性化除錯，開發訓練門檻極高。

而由於前期的鉅額投入，就算大模型開始商業化之後，要實現盈利也往往需要長時間的積累。因此，要想生成式AI技術真正落地到各行各業中發揮效力，當前急需一種可負擔、高效率、低門檻的解決方案，讓更多人參與到入生成式AI的開發中來。

那麼，如何才能彌合從基礎模型到終端應用之間的鴻溝？目前來看，提供一站式AI專業託管服務的雲平臺或許是當前的最佳解決路徑。

雲平臺擁有充足、靈活的算力資源，中小型企業不必自行購買和維護昂貴的硬體裝置，即可滿足個性化的開發需求。使用者可以透過 API和SDK，便捷地呼叫雲平臺上的第三方資源和大包服務，將他們的應用和服務與雲平臺無縫銜接，最大化簡化開發流程。

此外，雲平臺還能夠幫助解決資料的隱私安全問題。過去幾個月來，包括蘋果、三星、臺積電、美國銀行等很多大型企業都相繼出臺相關政策明令禁止員工使用ChatGP，紛紛開始自研大模型。而對於那些不具備自研實力的中小型企業來說，選擇能夠提供包括資料加密、身份驗證、合規性工具等安全措施的雲平臺則是一個很好的低成本選項。

大量公司禁止在工作中使用聊天機器人等產品，圖片截自於雅虎財經

針對當前的生成式AI浪潮，雲平臺是否已經具備大模型開發的相當能力，能夠提供生成式AI的全流程服務呢？

在剛剛落幕的亞馬遜雲科技紐約峰會上，我們看到了一份基於雲的生成式AI完整解決方案。

｜亞馬遜雲科技，建立生成式AI普惠新正規化

此次，亞馬遜雲科技延續了過去一貫的“務實”風格，瞄準當前生成式AI應用轉化所面臨的痛點問題，上新了一系列全新的功能和服務。從硬體到軟體，從開發端到應用端，試圖打造一個功能最全、能力最強的生成式AI服務平臺。

Amazon Bedrock服務：搭建生成式AI開發的“快速通道”

針對開發層面基礎模型訓練成本昂貴、環境部署複雜的問題，今年4月，亞馬遜雲科技首次宣佈推出Amazon Bedrock服務，允許使用者透過可擴充套件、可靠且安全的亞馬遜雲科技託管服務，用API來便捷地訪問來自不同供應商的基礎模型，並利用它們來構建生成式AI應用程式。

當時，除了自家的Titan大模型之外，首發第三方合作商及基礎模型還包括AI21 Labs的Jurassic-2，Anthropic的Claude，以及Stability AI的Stable Diffusion。在這次的紐約峰會上，亞馬遜宣佈再次增加前生成式AI領域的最大獨角獸之一的Cohere作為供應商，也新增了包括Anthropic最新的語言模型 Claude 2，和Stability AI最新版文生圖模型套件 Stable Diffusion XL 1.0等基礎模型。

亞馬遜雲科技認為，未來一定不會是一個模型統管一切，Amazon Bedrock透過不斷整合業界最領先的基礎模型，使用者將可以根據自身需求來便捷地呼叫最合適的模型。

Amazon Bedrock支援模型，圖片來自亞馬遜雲科技紐約峰會

但基礎模型有了之後，還有一個棘手的問題沒有解決——如何使用這些模型進行個性化的應用開發？雲平臺還要進一步解決私有資料學習、系統整合和除錯以及任務自動執行的問題。

舉一個我們在日常生活中經常會遇到的電商退換貨的例子。你在電商平臺買了雙鞋子不太滿意想要找客服換一個顏色，如果此時客服是ChatGPT等通用聊天機器人，他會怎麼回答你？——“抱歉，我的訓練資料截止日期是2021年9月，沒有這雙鞋的相關資訊。”

要想讓大模型真正發揮作用，首先要做的就是提前把公司內部跟這雙鞋所有有關的資訊都“喂”給模型，包括鞋的型號顏色、平臺的退換貨政策、庫存資訊等等，模型才能準確地給出反饋。在給出資訊的同時，還需要AI一邊聊天一邊能在後臺有序、安全地執行有關換貨的所有操作。

在過去這對於開發者來說是一個龐大的工程，但現在，亞馬遜新推出了一項名為Amazon Bedrock Agents服務，讓這一切變得觸手可及。

最新的Amazon Bedrock Agents服務能夠在基礎模型的基礎上，把對話的定義、模型外部資訊獲取和解析、API呼叫、任務執行等打包成為一個全託管式的服務，從而能夠及時、有針對性的輸出結果。

如此一來，開發者不必重巨資從頭開發自己的基礎模型，也不要花費大量的時間和人力去進行模型的個性化部署和除錯，從而能讓開發者把更多的精力放在AI應用的構建和運營上，讓不具備雄厚資金和技術實力的中小型開發者都可以加入到生成式AI浪潮中來。

“向量資料+硬體算力”雙護航，鑄造應用開發的最強大腦+最強底座

進行模型的定製開發，除了需要如Amazon Bedrock這樣的專業託管服務，也需要計算、儲存、安全等其他相關能力，來保證模型的持續可用、和迭代升級。

毋庸置疑，資料是人工智慧出現和發展的基底。生成式AI為了學習和理解人類語言的複雜性，需要大量的訓練資料，而這些訓練資料通常是以“向量”的形式存在，也就是把自然語言轉化為計算機可以理解和處理的數字。

那麼，什麼是向量資料，為什麼它對生成式AI的發展至關重要呢？

假設你正在使用一個音樂推薦軟體，我們可以把每首歌分別按照節奏、歌詞、旋律等三個特徵進行量化標記，比如第一首歌是（120，60，80），第二首歌是（100，80，70），當你告訴系統你喜歡第一首歌的節奏時，系統便會找到這首歌的節奏向量資料“120”，在資料庫中查詢與這個向量相似的其他向量，接著再把有相似特徵的歌曲推薦給你。

當然，不止是三維，一個數據還可以被標註成更多緯度。在自然語言處理中，使用詞嵌入技術表示的“詞向量”通常是幾百維的，而在影像處理中，使用畫素值表示的影像向量可能有數千到數百萬的維度。被“向量化”之後的資料將被儲存在向量資料庫之中，在高維空間中去高效地檢索和生成最相關或最相似的資料。

然而，要將資料進行向量化處理和儲存並不是一件容易的事，往往要耗費大量的人力和時間。針對這一問題，亞馬遜雲科技此次推出了適用於 Amazon OpenSearch Serverless 的向量引擎，該向量引擎能夠支援簡單的 API 呼叫，可用於儲存和查詢數十億個 Embeddings（將高維度的資料對映到低維度空間的過程）。亞馬遜雲科技還表示，未來所有亞馬遜雲科技的資料庫都將具有向量功能，在AI資料層面成為開發者的“最強大腦”。

圖片來自亞馬遜雲科技紐約峰會

除了向量引擎的支援，在算力層面，亞馬遜雲科技也一直致力於構建低成本、低延遲的雲上基礎設施。

亞馬遜雲科技和英偉達合作已超過12年，為人工智慧、機器學習、圖形、遊戲和高效能計算等各種應用提供了大規模、低成本的 GPU 解決方案，在交付基於 GPU 的例項方面擁有無比豐富的經驗。此次，亞馬遜雲科技展示了最新基於英偉達 H100 Tensor Core GPU 提供支援的P5例項，能夠實現更低的延遲和高效的橫向擴充套件效能。

P5 例項將是第一個利用亞馬遜雲科技第二代 Amazon Elastic Fabric Adapter（EFA）網路技術的 GPU 例項。與上一代相比，P5例項的訓練時間最多可縮短6倍，從幾天縮短到幾小時，這一效能提升將幫助客戶降低高達40%的訓練成本。藉助第二代 Amazon EFA，使用者能夠將其 P5 例項擴充套件到超過 2 萬個英偉達 H100 GPU，為包括初創公司、大企業在內的所有規模客戶提供所需的超級計算能力。

降低生成式AI門檻，用產品最大化賦能使用者

除了面向生成式AI開發的工具和平臺之外，在企業的日常運營之中需要一些能夠拿來即用的生成式AI產品，來幫助提升工作和管理效率。關於這一點，亞馬遜雲科技也陸續推出了一些在工作場景中直接可以使用的產品，這些產品既覆蓋底層開發人員也關注到了企業中大量的非技術人員。

比如在程式碼開發領域，自從亞馬遜雲科技在去年6月首次推出AI程式設計助手Amazon CodeWhisperer之後，現在該功能已經成為了很多開發者日常必備工具之一。

Amazon CodeWhisperer基於幾十億行開原始碼訓練，可以根據程式碼註釋和現有程式碼即時生成程式碼建議，另外還能進行安全漏洞掃描。目前支援包括 Python、Java 和 JavaScript 15 種程式語言和包括 VS Code、IntelliJ IDEA、JupyterLab 和 Amazon SageMaker Studio等整合開發環境。

為了進一步提高開發效率，在紐約峰會上，亞馬遜雲科技正式宣佈 Amazon Glue Studio Notebooks 也能支援 Amazon CodeWhisperer。透過 Amazon Glue Studio Notebooks，開發人員可以用自然語言編寫特定任務，接著Amazon CodeWhisperer 可以直接在 Notebooks 中推薦一個或多個可完成此任務的程式碼片段，供開發人員直接使用和編輯。

Amazon CodeWhisperer支援語言和環境，圖片來自亞馬遜雲科技官網

而對於非開發類工作場景，透過將 Amazon Bedrock的大語言模型能力與支援自然語言問答的 Amazon QuickSight Q 相結合，為使用者提供了基於生成式AI的商業智慧新服務。

比如你是一個財務分析師，你可以像跟ChatGPT聊天一樣用自然語言下達命令，在幾秒鐘內Amazon QuickSight Q就能完成搜尋關鍵財務資訊或建立公司財務視覺化圖表的操作，同時還能幫你總結出趨勢特點並提出建議。

類似拿來即用的產品還有幫助企業打破內部資訊孤島、加快資料驅動決策的Amazon Entity Resolution，以及能夠幫助醫療軟體供應商便捷地構建基於生成式AI的臨床應用程式的Amazon HealthScribe等等，在各行各業擴大著生成式AI產品的使用場景。

｜釋放AI時代的“雲力量”

生成式AI的發展需要雲，更需要大量基於雲的工具和服務。

大模型之後，下一階段生成式AI技術一定會朝著多樣性和個性化方向發展，我們既可以看到比較通用的生產力工具，也會看到各種瞄準特定場景的AI產品。而在這個過程中，雲平臺會起到越來越關鍵的作用。

一方面，雲平臺會大大降低AI應用開發的門檻。在平臺的算力和基礎模型支援下，開發者們基本無需關心硬體和基礎設施的問題，從而把更多的時間和精力放在業務和運營上。另一方面，雲平臺能夠持續加快AI應用的開發和運營效率。使用者可以透過直接呼叫API的方式進行應用的開發和管理，並安全、便捷地在團隊或組織之間共享。

在雲平臺的助力之下，未來的生成式AI將不再只是一場巨頭才能玩的“燒錢遊戲”，更多普通人也將可以坐上牌桌。

作為雲服務領域的行業領導者之一，亞馬遜雲科技提供了200多種服務，涵蓋了計算、儲存、資料庫、網路、開發者工具、安全、分析、物聯網、企業應用等廣泛領域，雲基礎設施覆蓋全球。同時，亞馬遜雲科技還是人工智慧和機器學習領域的領先者，多年來持續提供和更新著一系列端到端的AI相關服務，讓開發者可以靈活、便捷、低成本的開發和部署生成式AI應用。

此次，亞馬遜雲科技釋出生成式AI工具“全家桶”，其核心目的就是要進一步降低生成式AI開發的門檻，讓更多不懂大模型、不懂人工智慧的普通人也能快速加入生成式AI的開發和應用之中。

生成式AI的重要性不在於模型有多大能力有多強，更重要的還是如何能夠從基礎模型演變成各個領域中的具體應用，從而賦能整個經濟社會的發展。

現在，亞馬遜雲科技正在成為那個橋樑。

點選“閱讀原文”，檢視亞馬遜雲科技的生成式AI完整雲服務方案。

注：封面圖來自於Pexels，版權屬於原作者。如果不同意使用，請儘快聯絡我們，我們會立即刪除。

END

喜歡這篇文章？

1）點選右下角的“在看”

2）分享到你的朋友圈和微信群

3）趕快關注矽星人吧！