
有效地使用AI,需要一種AI本身尚無法產生的「新型結構化資料」。
“垃圾輸入,垃圾輸出”,即Garbage In, Garbage Out,簡稱GIGO。
正如卡尼曼在《噪聲》中所說,“在複雜系統中,噪聲和垃圾輸入的結合,會放大錯誤,導致系統行為的嚴重偏離。”
隨著模型能力的增強,資料質量、資料安全,如果沒有相匹配的進步,帶來的影響可能將超乎想象。
8月8日,GPT-4o最新發布的“系統卡”,也將資料安全擺在首位。特別強調了“關鍵資料集”元件,也著重說明了“幻覺”的問題。
GPT-4o或者未來GPT-5的各項能力,如果不能被驗證安全,就也不會公之於眾。
壞訊息是:我們看到GPT-5的時間大概不會太快。
好訊息是:創業者可以有更多時間,在產品、資料等方面積累自己的優勢。
在GPT下一輪模型能力釋放前,盡情發育成長。

在資料和輸入的話題上,紅杉美國有篇文章,Better Agents Need Better Documentation,從企業呼叫API的應用案例,介紹了資料的重要性。
Klarna是一家位於瑞典的金融科技公司,專注於提供“先買後付”服務,類似海外版“花唄”。
Klarna曾因 API 文件不清晰,而讓使用者在整合他們的系統時遭遇了困難,帶來使用者的負面體驗,還可能影響業務合作的信心。為了解決這些問題,Klarna 改進文件,增加可讀性、提供明確的示例程式碼,以及確保開發者能夠快速上手和使用 API。
透過改善 API 文件,Klarna 提高了其系統的整合效率,增強了開發者的使用體驗,並提升了整體客戶滿意度。
作為一個典型的基於OpenAI能力的應用專案,尤其是在國內也非常有需求的【客服場景】,是非常好的案例參考,介紹給大家。
Better Agents Need Better Documentation. 以下是內容原文👇

今年2月,Klarna 大膽宣佈,其基於OpenAI的新Agent,在第一個月就處理了這家瑞典金融科技公司三分之二的客戶服務聊天。
各種“客戶滿意度指標”都有所提高,但最引人注意的是,該公司透過用AI取代700 名全職的“合同代理人”,使盈利增加了4000萬美元。
從那時起,我們接觸的每家公司都想知道,“我們如何獲得Klarna的AI客戶支援服務?”
在華而不實的演示軟體、令人瞠目結舌的「營收前估值」的背景下,Klarna對 GPT-4實際應用的效果令人欣慰。
但正如 Klarna 創始人兼執行長 Sebastian Siemiatkowski 在本週的Training Data 播客中解釋的那樣,這一成就的現實比它最初看起來更平淡無奇,也更深刻。
為了解釋推動這一突破的洞察力,Siemiatkowski 援引了經典的計算機科學概念“垃圾輸入,垃圾輸出”(GIGO)。
早在巴貝奇時代,科學家們就明白“如果你給機器輸入錯誤的數字”,就不會得到正確的答案。
對於 Klarna 來說,這意味著團隊需要特別注意他們為模型提供的語言,作為特定客戶服務任務的背景——
換句話說,他們為代理自己製作的文件和培訓手冊。
“這樣思考對我們很有幫助,我們只需要確保文件和手冊足夠清晰、質量足夠高,然後它就可以真正執行,”Siemiatkowski 說。
除了使用 RAG(檢索增強生成)之外,Klarna 尚未透露他們構建助手的“秘訣”,因此尚不清楚其成功表現在多大程度上歸功於資料質量,還是歸功於適應特定任務的“定製認知架構” 。
無論如何,這是我們所說的“ Goldiocks 代理”的一個典型例子,它既受益於護欄(在這種情況下,即 Klarna 處理客戶服務請求的具體方式),也受益於 LLM 以連貫的方式流暢地合併資訊的能力。

《通向未來之路》 by Frank with Midjourney
大型語言模型的需求將一直是小眾問題放在了首位。
自2020 年正式確立以來,RAG 已成為行業標準,將 LLM 的表達彈性與可靠執行任務所需的關鍵事實相結合,尤其是在任務關鍵型業務環境中。
精心挑選要檢索的示例的質量是成功的關鍵。世界上確實有人喜歡寫文件,但數量不多。對於我們大多數人來說,我們只會抱怨糟糕的事情,而不會為改善它做出貢獻。
然而,像 Stripe 這樣的高績效公司開創了“寫作文化”,其中社會規範鼓勵參與。Gitlab 是首批僅遠端辦公的公司之一,它開發了一種以手冊為先的溝通方式,作為其卓越運營的支柱2。
更廣泛地說,就 Klarna 而言,該公司已經構建了一個精心設計的知識圖譜,不僅為面向外部的客戶服務代表(人工和代理)提供支援,還為其內部聊天機器人 Kiki 提供支援。
Siemiatkowski 解釋說,這種對文件質量的關注具有雙重好處:“因此,實際上我們的代理如今擁有更好的工具來成功地幫助客戶,就像人工智慧一樣。因此,這兩種體驗都在因此而得到改善。”
Siemiatkowski 認為,Klarna 透過試驗和內部構建 AI 獲得了很多價值。但在他討論的兩種情況下(LLM驅動的內部知識管理系統和麵向外部的客戶服務代理),購買而不是構建現在是一種非常可行的選擇,因為有Glean和Sierra這樣的解決方案。
但是,買家要小心,GIGO 仍然適用。
對高質量資料的關注,是當代人工智慧的一個大主題。
微軟去年釋出了一篇論文Textbooks Are All You Need,該論文展示了使用更優質資料訓練的小型模型,如何在編碼練習中勝過大型模型。
在大型模型方面,微軟首席技術官 Kevin Scott 告訴我們,“資料質量比資料數量更重要,這是件好事,因為它為你提供了一個經濟框架,讓你可以開展必要的合作,確保為你的人工智慧訓練演算法提供能夠產生更智慧模型的課程。而且,老實說,不要浪費大量的計算資源去輸入一堆根本不智慧的東西。”
當涉及到企業用例時,尤其是像 Klarna 這樣面向消費者的用例,質量標準很高,因為客戶是在與人工代理進行比較。
Klarna 的經驗表明,當人工智慧與人類努力相結合以理解其他人時,效果會最好(LLM似乎還遠遠無法實現這一點)。
這實際上是所有偉大企業的核心——以客戶為中心的方法。
https://www.sequoiacap.com/article/better-agents-need-better-documentation/ (原文連結)
新鮮真話,關注一下👆

參考閱讀:
新鮮真話,關注一下👆
朋友圈會發一些具體的案例和商業化日常~
AI交流,歡迎加我本人微信:FrankGPTs
