頭號玩家的綠洲這回真的實現了,開發者下一步還要挑戰英偉達

截至目前,全世界最暢銷的遊戲是哪款?

自從 2010 年誕生以來,《我的世界》在全球賣出了超過 3 億份,打破了《俄羅斯方塊》的紀錄,成為世界上最暢銷的遊戲。
《我的世界》
密集的真人玩家互動、高度開放性和自由度,讓《我的世界》如今成為了 AI 公司們各種耍寶的一方熱土。

你也許還記得之前 OpenAI 訓練出了機器人玩家。
OpenAI 用大量人類遊戲影片,預訓練了一個神經網路,讓其成功學會製作“金剛石”遊戲工具。要製作這個工具包含 24000 個遊戲操作,即使是熟練的《我的世界》玩家也需要超過 20 分鐘才能完成。
更誇張的事情在上個月發生,一款名為 Oasis 的“遊戲”使用了 OpenAI 的開源資料集,幾乎一比一地復刻了《我的世界》的介面——然而,Oasis 並不依賴遊戲引擎或者手工編寫的程式碼,它的每一幀畫面都由 AI 模型生成。
Oasis遊戲介面丨Etched
Oasis 這個名字來自於歐內斯特·克萊恩 (Ernest Cline)的科幻小說《頭號玩家》。被更多人熟知,是在2018 年,斯皮爾伯格將其改編成了電影。小說中,Oasis 是個虛擬的遊戲世界,人們為了逃避混亂的現實,大部分時間都投入在這個足以亂真的世界中。
Oasis 已經成為試圖打造虛實難辨的體驗的代名詞。取名倒是足以見得它開發者的野心。聲稱“世界上第一款可玩的 AI 生成遊戲”,真實體驗到底如何?

不像綠洲,倒更像是《盜夢空間》
先說結論,眼下,你就可以透過瀏覽器就可以免費玩到 Oasis;但相信我,你玩不下去,或者說,沒法玩……
與《我的世界》遊戲操作類似,玩家可以在遊戲裡行走、跳躍、打破方塊、開啟庫存和使用物品。Oasis 也理解複雜的遊戲機制,如建築、照明物理、庫存管理、物件理解等。
放置非立方體塊
模型理解照明物理
與動物互動
吃飯恢復健康
但不同的是,Oasis 的每一幀畫面都是AI即時生成的
儘管“AI 生成遊戲”聽起來很唬人,但從本質上來說,Oasis 和 Sora、Runway 使用技術類似,依賴於基於 Transformer 架構的擴散模型
基於DiT的潛在擴散主幹架構、基於ViT的變分自編碼器、加速的軸向、因果、時空注意力機制、以及克服長序列模型發散問題的新策略丨Etched
不過那些文生影片產品的提示詞是“文字”,像 Sora 根據文字一次性生成 60 秒的影片。Oasis 根據的“提示詞”是玩家的鍵盤、滑鼠操作和之前幀,生成下一幀。

也就是說,Oasis 生成畫面也是逐幀的,因為在模型架構和推理技術方面的進步,使得 Oasis 延遲儘可能小,小到畫面連貫起來(這與早期動畫的原理類似,靜止的影像以一定頻率變化之後,因為視覺暫留的緣故,人會覺得畫面動了起來),就能讓 Oasis 產生“可互動、可操作”的效果
《運動中的馬》, Eadweard Muybridge,1879
釋出3天左右,Oasis 的使用者數量就突破了 100 萬。洶湧而來的玩家使得伺服器一度崩潰,即使到現在也不太穩定,甚至經常出現伺服器斷連的情況。
79小時內Oasis玩家數量增長情況|Decart
拋開不穩定的伺服器和 10 分鐘的限制不談。從遊戲體驗而言,Oasis 基本還處於“不可玩”的狀態
玩家很快會發現,隨著時間的推移,遊玩 Oasis 會呈現一種劣質版《盜夢空間》的體驗——敲碎一個磚塊或者轉動滑鼠換個視野,地圖就可能完全變成另外一個樣子
以自迴歸方式生成的每一幀都會累積細小的錯誤,隨著時間的推移,這些錯誤就會像雪球一樣越滾越大,使得畫面很快就會和原始影像南轅北轍。
如何用 AI 生成一個連續的世界,克服幻覺,這其實是一個整個 AI 業界都在面臨的難題
為了改善這點,開發人員使用了一種稱為“動態噪聲”的技術。簡單來說,他們在生成每個幀的早期階段有意為影像資料新增一些隨機噪聲,以防止錯誤積累。隨著 AI 模型對影像進行細化,這種人工噪聲會逐漸被去除,使得畫面保持與前一幀的一致性。
開發者也承認,第一個版本只是用於研究和概念驗證,表明 AI 模型有潛力做到——跟那些影片生成工具一樣,他們還無法解決生成連續畫面的問題
下一步,造晶片,贏過英偉達
Oasis 的開發者,是以色列初創公司 Decart 和矽谷晶片設計公司 Etched
Etched 開發了一款名為 Sohu(搜狐?)的專用 AI 晶片,將 Transformer 架構刻錄在晶片中。目前,Oasis 以 480p 的解析度執行在英偉達的 H100 GPU 上。Etched 聲稱,相比英偉達,Sohu 會將效能提升 20 倍,可以以 4k 的解析度處理 1000 億引數的大模型
Etched認為,Sohu晶片的效能會是H100的20倍丨Etched
當然,Sohu 的開發也還處於早期階段,Etched 的說法目前無法得到證實。紐約大學電氣和計算機工程教授 Siddharth Garg 就表示了質疑。他說,鑑於市場上頂級 GPU 的 AI 專業化程度,“對僅透過更智慧或更專業的設計就能實現 10 倍的改進持懷疑態度。”
Dean Leitersdorf 畢業於以色列理工學院,在 2022 年結識了哈佛畢業生 Robert Wachen。受到OpenAI的啟發,Wachen 在 2022 年聯合創立了Etched,Leitersdorf 在2023年聯合創立了 Decart。
在他們的設想中,Etched 會像英偉達一樣構建下一代硬體,Decart 則像 OpenAI 一樣開發執行在硬體上的模型。
Leitersdorf 表示,他們的目標是創造一個生成式體驗的新時代。“你的螢幕可以變成一個門戶——進入某個不需要編碼、可以即時更改的虛構世界。”
“你的螢幕可以變成一個門戶——進入某個不需要編碼、可以即時更改的虛構世界。”丨Oasis
就像 LLMs 跨越了複雜的人類語言體系,讓機器學會用人話和我們溝通。Oasis 大抵是想克服視覺障礙,學會像人類一樣看世界,以及世界的執行機制,並以我們的視覺和互動習慣展示環境
Leitersdorf 稱,像 Oasis 這樣的模型可以用於需要互動式影片的各種環境,例如娛樂、教育工具,甚至是 AI 驅動的創意媒體。
目前,風險投資公司紅杉資本已經領投了 Decart   2100 萬美元的種子輪融資,用真金白銀表示了他們對於 Decart 願景的認可。
作者:TTT
編輯:沈知涵
封面圖來源:Oasis
果殼AI組 出品
本文來自果殼,未經授權不得轉載.
如有需要請聯絡[email protected]

相關文章