OpenAI 宣佈即日起 ChatGPT 開始切換為 GPT-4o 多模態版,多模態版支援在對話中直接生成影像,用來替換此前的 OpenAI DALL-E 3 影像生成模型。
GPT-4o 預設為所有個人使用者開啟,包括訂閱版和免費版使用者都可以使用,按照慣例這些也都是有配額的,當超出訂閱層級的配額後會被限制無法繼續使用。

OpenAI 表示:
GPT-4o 影像生成擅長準確呈現文字、精確遵循提示以及利用 4o 固有的知識庫和聊天上下文 — 包括轉換上傳的影像或將其作為視覺靈感,這些功能可以更輕鬆地建立您設想的影像,幫助您透過視覺效果更有效地進行交流,並將影像生成推進為一種精確而強大的實用工具。
在 GPT-4o 中可以準確建立多達 20 個不同的物體,OpenAI 稱其他 AI 系統很難建立大約 5~8 個物體,不過 OpenAI 也承認目前該模型還存在侷限性,例如低語境提示導致的幻覺,資訊密集、文字較小的影像中的文字渲染問題,OpenAI 計劃在後續釋出的更新中陸續解決問題。
目前支援使用該模型生成影像的包括:
-
ChatGPT Free
-
ChatGPT Plus
-
ChatGPT Pro
-
ChatGPT Team
在未來幾周 OpenAI 將向 ChatGPT Edu 和 ChatGPT Enterprise 訂閱版使用者提供該功能,另外後續 OpenAI 會提供 GPT-4o 多模態版 API,讓開發者可以藉助 API 快速生成影像。