機器之心編輯部
從程式設計開始,今年智慧體要卷飛了!!!
昨天,OpenAI CEO 奧特曼預告了一項新研究,吊足了所有人的胃口。

就在剛剛,謎底揭曉!OpenAI 宣佈,在 ChatGPT 中引入了 Codex 的研究預覽版。
Codex 是一個雲端軟體工程智慧體,可以並行處理多項任務,包括編寫功能、解答程式碼庫相關問題、修復 bug 以及提交拉取請求以供稽核等。並且,每個任務都在其專屬的雲沙盒環境中執行,並預載入程式碼庫。

Codex 背後的模型是 codex-1,它是 OpenAI o3 的一個版本,專門針對軟體工程進行了最佳化。它使用強化學習在各種環境中針對真實程式設計任務進行訓練,生成的程式碼能夠高度反映人類的風格和 PR 偏好,精確遵循指令,並可以迭代執行測試,直到獲得合格結果。
自今天開始,ChatGPT Pro、Team 和 Enterprise 使用者即可使用 Codex,Plus 和 Edu 使用者也很快可以上線使用。

對於 OpenAI 的新智慧體產品,大家的反應似乎非常興奮。有人表示自己被震撼到了,迫不及待想要體驗一番。十年前學習程式設計時,絕對想不到這會成為可能。

也有人認為,Codex 這個雲原生的智慧體實際上可以自行構建、修復並交付功能,感覺就像軟體開始了大規模自我編寫。

還有人現身說法,在經過對 Codex 大量測試後發現,當它正常運作時,幾乎更擅長「模擬」程式碼正在做什麼以及看起來是什麼樣子。

接下來,我們先看一下官方示例,Codex 可以並行處理多項任務:

比如要求 Codex「找出儘可能多的 topos 和語法錯誤並進行修復」,它會檢查程式碼庫的可維護性和 bugs:

修復檔名中含有特殊字元的 /diff 錯誤:

建立並使用 DEFAULT_ALCATRAZ_TIMEOUT 常量:

Codex 工作原理
從今天開始,使用者可以透過 ChatGPT 側邊欄訪問 Codex,輸入 prompt 並點選 "編寫程式碼" 按鈕即可執行新的程式設計任務。
若需針對程式碼庫提問,可點選 "Ask"。每項任務均在獨立隔離的環境中處理,該環境已預載入使用者的程式碼庫。Codex 具備讀寫檔案的能力,並可執行包括測試框架、程式碼檢查器和型別檢查器在內的各類命令。任務完成時間通常為 1 至 30 分鐘(視複雜度而定),使用者可即時檢視 Codex 的處理進度。
任務完成後,Codex 會將其修改提交至專屬環境。透過終端日誌引用和測試輸出記錄,Codex 為所有操作提供可驗證的證據鏈,便於使用者追溯任務執行全過程。使用者還可審閱結果、要求進一步修改、建立 GitHub 拉取請求或直接將變更整合至本地環境。在產品中,使用者可將 Codex 環境配置為無限接近實際開發環境。

Codex 可遵循程式碼庫中的 AGENTS.md 檔案執行操作。這類文字檔案(類似 README.md)用於指導 Codex 如何瀏覽程式碼庫、執行哪些測試命令,以及如何遵循專案標準規範。與人類開發者類似,當獲得配置好的開發環境、可靠的測試方案和清晰的文件時,Codex 智慧體能發揮最佳效能。
在編碼評估和內部基準測試中,即便沒有 AGENTS.md 檔案或定製腳手架,codex-1 也展現出強勁效能。

構建安全可靠的智慧體
在設計 Codex 時,OpenAI 優先考慮安全性和透明度,以便使用者能夠驗證其輸出。使用者可以透過引用、終端日誌和測試結果來檢查 Codex 的工作。


與 o3 相比,codex-1 始終能夠生成更清晰的 patch,以便立即進行人工稽核並整合到標準工作流程中。

Codex 與 o3 對比:


OpenAI 表示,Codex 智慧體完全運行於雲端的安全隔離容器中。任務執行期間將停用網際網路訪問,確保智慧體僅能互動以下內容:透過 GitHub 倉庫明確提供的程式碼、使用者透過設定指令碼配置的預安裝依賴項以及該智慧體無法訪問任何外部網站、API 或其他服務。
Codex 定價如何?
Codex 用起來貴不貴?
OpenAI 表,從今天開始,將向全球範圍內的 ChatGPT Pro、Enterprise 和 Team 使用者開放 Codex。在接下來的幾周內,使用者可以免費暢享 Codex,探索它的各項功能。此後,他們將推出限速訪問和靈活的按需付費選項,供使用者購買額外使用量。
對於使用 codex-mini-latest 進行開發的使用者,該模型可透過 Responses API 呼叫,定價為:
-
輸入 tokens:每 100 萬 $1.50
-
輸出 tokens:每 100 萬 $6
此外,OpenAI 表示,Codex 仍處於早期開發階段。作為研究預覽版,它目前尚不具備某些功能,例如:前端工作所需的影像輸入支援,在 Codex 執行過程中即時調整智慧體的能力。
此外,遠端智慧體的執行速度比互動式編輯慢,這可能需要一定的適應時間。不過,隨著時間推移,與 Codex 智慧體的協作將越來越像與同事的非同步協作。
最後 OpenAI 表示,未來計劃推出更具互動性和靈活性的智慧體工作流。
未來,程式設計也許真會變的越來越簡單。
參考連結:https://openai.com/index/introducing-codex/

© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]