ChatGPT開始整合多模態支援的GPT-4o支援透過聊天直接生成影像

#人工智慧 OpenAI 今天起更新 ChatGPT 切換為 GPT-4o 多模態模型,支援在聊天對話中生成更準確的影像。GPT-4o 較 DALL-E 3 模型有更大的提升,目前 ChatGPT 免費版和訂閱版都可以使用但有配額限制,後續 OpenAI 將推出 API 供開發者呼叫。檢視全文:https://ourl.co/108534
OpenAI 宣佈即日起 ChatGPT 開始切換為 GPT-4o 多模態版,多模態版支援在對話中直接生成影像,用來替換此前的 OpenAI DALL-E 3 影像生成模型。
GPT-4o 預設為所有個人使用者開啟,包括訂閱版和免費版使用者都可以使用,按照慣例這些也都是有配額的,當超出訂閱層級的配額後會被限制無法繼續使用。

OpenAI 表示:
GPT-4o 影像生成擅長準確呈現文字、精確遵循提示以及利用 4o 固有的知識庫和聊天上下文 — 包括轉換上傳的影像或將其作為視覺靈感,這些功能可以更輕鬆地建立您設想的影像,幫助您透過視覺效果更有效地進行交流,並將影像生成推進為一種精確而強大的實用工具。
在 GPT-4o 中可以準確建立多達 20 個不同的物體,OpenAI 稱其他 AI 系統很難建立大約 5~8 個物體,不過 OpenAI 也承認目前該模型還存在侷限性,例如低語境提示導致的幻覺,資訊密集、文字較小的影像中的文字渲染問題,OpenAI 計劃在後續釋出的更新中陸續解決問題。
目前支援使用該模型生成影像的包括:
  • ChatGPT Free
  • ChatGPT Plus
  • ChatGPT Pro
  • ChatGPT Team
在未來幾周 OpenAI 將向 ChatGPT Edu 和 ChatGPT Enterprise 訂閱版使用者提供該功能,另外後續 OpenAI 會提供 GPT-4o 多模態版 API,讓開發者可以藉助 API 快速生成影像。

相關文章