

AI的風向變了。


文|譚保羅
編輯|江江
來源|鹽財經(ID:nfc-yancaijing)
封面來源|Pixabay
整個6月,全球科技界最受關注的事件,非Meta宣佈收購Scale AI 49%的股權莫屬。
如果不是擔心美國越來越嚴格的反壟斷法,這個股權佔比或許更高。雖然沒有絕對控股,但Meta志在掌控,所以施以“雙重保險”——股權和人,都收入囊中。
Scale AI的華裔創始人兼CEO Alexandr Wang將進入Meta工作,領導Meta的AI業務。

Scale AI創始人亞歷山大·王/圖源:視覺中國
收購價格為143億美元(Scale AI估值為290億美元),約合人民幣1030億,看似屬於鉅額範疇,實則不然。在財大氣粗的科技界,這根本不算多。
比如,2023 年,微軟和動視暴雪收購案,交易金額達690 億美元。在Meta過去的收購案中,Scale AI也只能排到第二。2014年,Meta於以190億美元收購WhatsApp。考慮到兩樁案子之間長達11年的通脹因素,當年收購WhatsApp的交易規模,要大得多。
這樁案子最被關注的點,顯然不在於交易規模,也不在於28歲華裔創始人的白手起家傳奇故事,而是它意味著全球科技界AI突破方向,正在發生一次大轉變。
以前,超級巨星是Open AI和英偉達,在各自賽道,它們如入無人之境;而在這次轉變之後,所有人都註定不會輕鬆。

資料很重要,但最窮
關於Scale AI的報道汗牛充棟,外界都知道這家公司的主營業務是“資料標註”。
到底什麼是資料標註?以自動駕駛業務為例,用一個簡單場景來說明:自動駕駛AI模型需要用資料來訓練,但廠商採集車採集的資料主要是道路影像,而現有技術條件下,AI無法直接讀取影像,因此就需要對影像進行標註。

資料標註,是指為影像、文字、影片或音訊等原始資料新增結構化資訊,以便機器學習模型能夠理解和學習這些資料的過程/圖源:Shaip
原始影像經處理,變成三維的點雲資料,標註就可以開始了。關鍵一步是標註語義資訊,要讓AI能識別這些資訊,才能讀懂影像。標註會很細,比如有車道線標註、斑馬線標註、紅綠燈標註等。要知道,在很多技術條件平平的資料標註機構,標註是一幀一幀地完成的,背後是海量的人工。
“有多少智慧,就有多少人工”,這句AI行業著名的話,指的就是人工資料標註。於是,資料標註領域產生了蔚為壯觀的外包現象,無論中外。
總部位於北上廣深,服務於本土AI獨角獸的中國資料公司們,將工作層層轉包,最後交給了中西部三四線城市和縣城的勞動者手中。無論是暫時沒有好工作的黃毛青年,還是尋求副業的溫吞中年人,只要眼神好,精力旺,坐得住,懂得用鍵盤和滑鼠拉框輸入就行。生產工具是一臺電腦。
作為“國際大廠”的Scale AI,在外包環節自然會更加國際化。
說到資訊產業外包,人們會想到印度。但隨著印度經濟的發展,尤其是外資湧入推高資產價格之後,印度人錢包鼓了,接受外包的價格也越來越高了。而且,拉框標註這種活兒,技術含量比寫程式碼還低,時薪也更低,畢業於各種理工學院的印度年輕人現在還真不一定看得上。
因此,Scale AI的外包勞動力網路被拓展到了菲律賓、委內瑞拉,還有非洲的肯亞。

菲律賓政府估計全國共有200萬人從事資料標註行業,這些工人已成為菲律賓網咖的常客
肯亞在哪裡?這是一個東非國家,5244萬人,有75%的人口在35歲以下。重要的是,作為英國在非洲的殖民地,英語是官方語言之一,受過基礎教育的年輕人,英語都還馬馬虎虎。實際上,早在承接Scale AI的勞務外包之前,肯亞就已經在學術界如雷貫耳。它是全球聞名的“論文工廠”,這裡的年輕人經常利用網路,遠端幫助全球的莘莘學子搞論文。
由於標註工人的薪水太低和工時過長,勞工組織和一些政府部門準備找Scale AI的麻煩,但事情後來不了了之。

Scale AI的眾包平臺Romotasks上有超過24萬名註冊工人,Romotasks的宣傳語為“在家線上掙美元”,這吸引了不少第三世界國家的工人/圖源:DuckDuckGo
從非洲城鄉結合部的標註員,到矽谷的千億美元富豪;從讓95%的崗位消失,到給你一個人形機器人的女朋友,AI浪潮影響著所有階層的地球人,席捲著經濟社會的方方面面。它好像是一個包羅永珍,充滿混沌的“筐”。
實際上,AI作為一個產業,三條支柱基本上可以把所有我們聽說過的企業和產品都清晰地分類,並納入其中。
一是演算法,指向了應用端的公司和他們的產品,Open AI、DeepMind、deep seek之類;
二是算力,指向了硬體供應商,一家獨大的英偉達,以及正在崛起的博通等;
三是資料,Scale AI是資料服務商中最著名的一家,它的對手還有Turing、Labelbox 和Handshake 等。
賽道不同,人生的富貴程度便天差地別。在演算法領域,3月底,OpenAI宣佈新一輪融資時,估值已達到3000億美元,是Scale AI的10倍。未來,隨著頭部效應繼續放大,估值是否上不封頂,沒人知道。在算力環節,英偉達市值已經3.5萬億美元,是Scale AI的100百倍以上。即使是博通,市值也接近了1.2萬億美元,是Scale AI的40多倍。
當然,這些公司的體量本不是一個數量級,無論根據哪種估值方法,存在巨大市值差異實屬正常。但差異大到如此程度,也說明AI的資料環節相對於演算法和算力,可能存在一些天然缺陷。
Scale AI的股東們,在公司如日中天的時候,願意一下子賣掉49%的股權,不是沒有原因。

不是煉油廠,是發動機
AI概念浪潮中,三家公司陸續火了。演算法環節的OpenAI最先火了一把,然後是算力之王的英偉達,最後才是這家搞資料、體量小得多的Scale AI。
資料公司遠比前面兩類缺乏想象力。

AI概念浪潮中,三家公司陸續火了,而資料公司遠比前面兩類缺乏想象力
一是,它無法像網際網路公司(演算法公司更類似於網際網路)那樣,實現邊際成本幾乎為零的擴張,無法贏者通吃。目前,在演算法環節的獨角獸中,OpenAI出現斷崖式領先。第二名Anthropic擁有615億美元的估值,但只有OpenAI 3000億估值的五分之一。第一名和第二名的差距如此之大,說明了這個領域的終極競賽,最終可能有點像搜尋引擎。
二是,它不像硬體廠商那樣有技術壁壘。可以這樣說,只要不發生算力硬體革命,英偉達的技術壁壘還能持續很久。但Scale AI和競爭對手之間,很難說有什麼本質差異。無論是分佈在全球的24萬人工標註員,還是中臺的軟體平臺,可能也談不上什麼不可替代的核心競爭力。因此,資料標註市場必然是一個分割的市場,對手提供差不多的服務,大家都有飯吃,但大家都不輕鬆。因此,在合適的時機賣出好價格,是一種優選。
但Scale AI收購案的歷史性意義卻不容被低估。它不只是科技大廠之間的競爭,比如什麼Meta落後,奮起直追之類,而是宣告AI浪潮的突破方向出現了逆轉——正在從縱向分工細化,走向一體化融合的時代,算力、演算法和資料將更加密切地連為一體。
資料是AI時代的石油,資料服務商是“煉油廠”,經過“煉油廠”精煉的資料,才能被AI這臺發動機使用。但實際上,隨著AI應用不斷走向專業化,資料服務商很可能成為發動機的一部分。
這就好比:汽油不是直接流進發動機燃燒的,而是要先和空氣混合,形成燃氣混合物,噴射到燃燒室,發動機才進行燃燒,實現高效的能量轉化。處理和標註後的資料,AI才可以直接讀取,正類似於燃氣混合物之於汽車發動機。在這個意義上講,資料處理環節不再是外部“煉油廠”,而本就是發動機的一部分。
Meta宣佈收購Scale之後,谷歌、微軟和xAI等曾經的客戶,已經不再把Scale AI看作中立、獨立的“煉油廠”,有的將和Scale AI終止合作,有的表示將削減訂單。原因不言自明:即便有資料脫敏和客戶隱私防火牆,即便Meta所收購股份為非投票股份,但誰能100%保證商業機密的萬無一失?
Scale AI正在成為Meta 這臺發動機的一部分。其他AI巨頭是否會繼續信任其他資料商,並保證它們不在未來某一天同樣被競爭對手收購,也被打上了問號。可以預見,巨頭們將可能強化對資料供應的獨佔性,推動資料環節重構,將資料和演算法進行更深度的融合。
當資料、演算法和算力三大支柱融合度不斷躍升,很多成見就會被解構。Deep seek透過對演算法架構的創新,提升了給定算力的效率,用2000塊晶片就完成了被認為必須是萬卡叢集才能幹成的運算。於是,“算力即權力”開始被部分地懷疑。那時候,英偉達市值跌幅17%,蒸發近6000億美元。

DeepSeek新版 V3 模型的百科知識(MMLU-Pro, GPQA)、數學(MATH-500, AIME 2024)和程式碼任務(LiveCodeBench)表現均有提升
商業世界有兩種邏輯。
資本的邏輯是分拆,把一家公司或一個產業,拆成越來越多的板塊或環節,在每個板塊和環節都打造獨角獸,讓每個地方都有一個英偉達或Open AI,分別賣出去,才能實現最可觀的資本利得。
產業的邏輯是整合,提升產業鏈的縱向協同,你中有我,我中有你,更能節省資源,提升效率,就像Deep seek用演算法節省算力,Meta希望用資料獨角獸的技能,重構自己的廣告分發演算法叢集一樣。
Meta被稱為是科技界的“收購大王”。2022年底,Meta股價跌到谷底,一度只有90多美元,現在已突破690美元。在美股七姐妹中,Meta超過7倍的漲幅,僅次於英偉達。市場一直都很相信扎克伯格的洞察力,現在他才41歲。

Meta創始人馬克·扎克伯格/圖源:視覺中國
Alexandr Wang也才28歲。兩人都是熱衷打造個人品牌,愛出風頭的性格,一個公司同時有兩顆星星在發光,並不是容易的事情。
他們能在一起共事多久,已不是重點。重點是,AI的風向變了。




