總結一下:在歸納推理方面,o3 透過識別視覺元素、總結圖片特點,並且呼叫外部工具,進行比對識圖,這些能力都覆蓋了。準確率和響應都有待提升,尤其是推理時間久、思維鏈條長,最後還是錯誤答案的話,換哪個使用者都要不開心的。 基本演繹法,但 AI 版除了歸納型推理,還有演繹推理。這需要 AI 綜合上述所有的能力,並且有一點「發散思維」。這是相當讓人興奮的部分,我們設計了一套「看工位,猜 MBTI」的挑戰活動,交給 o3。結果相當有意思,雖然到底是 I 人還是 P 人,工位未必能完全體現出來——但這不就是 o3 要挑戰的嗎?接下來奉上內容部門同事們的桌面,以及 o3 對他們的「判定」。 【P人主編】
主編的 P 屬性非常明顯,還非常 P 得非常穩定,桌面兩年沒有變化,這點 o3 都發現了:不太花時間收拾。 【J人社媒編輯】
社媒編輯的桌面由於過於系統、技術含量過高,觸發了 o3 呼叫程式碼工具——好可怕的 J 人。
【P人實習生】實習生的桌面東西不多但資訊量不少,尤其是顯示屏上貼了一串小紙條,原以為是便利貼,結果全是奶茶標…… 這觸發了 o3 的「逐 part 分解」,每一個細節都放大來看。不過,這樣的觸發並不是每次都能出現,暫時還沒有看到明確的觸發方式。
【P人硬體及影像編輯】工位主人表示 o3 判錯了,他明明是 P 人——只是沒有反映在工位佈置上。只能說 GPT 有時比人更瞭解人自己。