OpenAI釋出會技術全面分析

提醒：請之前購買過全店打包“架構師技術全店資料打包彙總(全)”的讀者，請憑藉購買記錄在微店留言免費獲取更新（傳送更新打包連結），後續所有更新均免費發放（目前44本資料）。

獲取清單：

人工智慧晶片技術深度分析

InfiniBand架構和技術實戰總結(第二版)

Infiniband技術規範和協議解析

人工智慧晶片技術深度分析

儲存系統基礎知識全解（PDF）

儲存系統基礎知識全解（PPT版）

伺服器基礎知識全解(PPT版)

伺服器基礎知識全解(PDF版)

SSD快閃記憶體技術基礎知識全解（PPT版）

SSD快閃記憶體技術基礎知識全解（PDF版）

（持續更新中…）

資料中心網路知識全解（PPT）

人工智慧基礎知識全解（含實踐）

CPU基礎知識全解（PPT）

GPU基礎知識全解（PPT）

內容來源：全面分析：OpenAI釋出會（12個應用&功能）。

OpenAI從12月5日連續12個工作日每天公佈一個新應用或功能。包括 1）釋出完整版o1；2）釋出強化微調技術；3）釋出影片大模型Sora；4）釋出協作平臺Canvas；5）釋出ChatGPT Apple Intelligence；6）釋出高階語音模式；7）釋出Projects in ChatGPT；8）釋出ChatGPT搜尋；9）釋出o1 API；10）釋出通話訪問模式；11）釋出全新桌面應用；12）釋出新一代推理模型o3 & o3 mini。

Openai釋出會 —— 基礎模型

12天的釋出會中，OpenAI推出了三款基礎模型，分別是增強的ChatGPT o1模型、Sora影片生成模型、o3模型,新的模型在數學和科學領域均有著卓越表現，同時也意味著openai在推理能力方面邁出了重要一步。
o3模型的釋出，更是標誌著AI在程式設計、科學推理等領域的巨大進步。o3模型接近通用人工智慧（AGI）的標準，為複雜決策和高階問題解決提供了新的技術基礎。
Sora的釋出將極大降低內容創作的成本和時間。為營銷、培訓、市場等各領域提供AI生成的高質量影片，有望成為企業未來內容創作的新標準。

Openai釋出會 —— 微調

使用者可以根據極少量的資料，訓練特定領域的專家模型。這意味著企業構建定製化的AI模型，不再需要大量的特定資料集標註。
定製化能力：相較於通用AI，強化微調技術為企業提供了更靈活的定製化路徑。企業可以透過這一技術打造專屬的AI助手，在提高生產效率的同時，提供更具個性化的服務，從而有效地提升使用者體驗。
例如，個性化推薦、AI診療系統、AI審查工具等特定場景均都可以透過這一技術快速部署。

Openai釋出會 —— AI Agent

釋出了集智慧寫作&程式碼協作於一身的ai工作臺、新的桌面應用、高階語音模式、通話訪問模式等多款ai agent產品，標誌著ChatGPT從簡單的會話助手向更強大的代理工具的轉變，從而可以代表客戶執行更多工，為使用者帶來全新的便捷體驗。

DAY1：完整版o1釋出

正式釋出完整版o1，效能大幅提升

在今年9月份，OpenAI釋出o1-preview，對模型的技術思路進行了改進：將更多算力運用於推理側，o1是使用大規模強化學習訓練並使用思維鏈進行推理的系列模型。
今年12月，OpenAI正式釋出了o1完整版，o1完整版在數學、程式設計、博士階段科學問題（困難問題）領域的效能遠超GPT4o，在科學問題領域
超越人類專家，並在數學、程式設計領域的效能較o1-preview有了大幅提升。
相較於o1-preview，OpenAI對o1進行了使用體驗方面的改進：o1目前對於簡單問題能夠回答更加迅速，OpenAI測試目前o1較o1-preview重
大錯誤率降低了34%，速度提升50%。
目前o1已面向所有Plus訂閱使用者推出，用於替代o1-preview，並將上線後續推出的Pro訂閱。

DAY2：強化微調技術

什麼是強化微調？

強化微調可讓開發者使用強化學習針對具體任務對模型進行進一步微調，並根據提供的參考答案對模型的響應進行評分具體來說，強化微調不僅會教模型模仿其輸入，更是會讓其學會在特定領域以新的方式進行推理。當模型發現問題時，要為它提供思考問題的空間，然後再對模型給出的響應進行打分。之後，利用強化學習的力量，可以強化模型得到正確答案的思維方式並抑制導向錯誤答案的思維方式。

強化微調的優勢？

快速高效：相比於傳統技術，強化微調技術更高效，不需要大規模的資料集支援
使用靈活：使用者可根據需求即時調整模型，使模型更加符合特定場景需求。
應用廣泛：強化微調技術可以推動客服、教育、創意、研究等各個領域的應用。

強化微調後在特定領域效能明顯提升

在官方演示裡，OpenAI設定了一個實驗：在給定症狀列表的情況下，用模型預測可能導致罕見遺傳疾病的基因，並讓模型解釋為什麼選這些基因。實驗人員使用三種模型進行對比：o1 mini、o1完整版、o1 mini強化微調版。
對於o1 mini強化微調版，實驗人員彙集了大約1100個病例報告作為訓練和驗證的資料集，在使用訓練資料集對模型進行訓練後，上傳驗證資料集對模型推理能力進行反覆測試和調整，同時保證驗證資料集和訓練資料集之間的正確基因沒有重疊，以防模型作弊。評估結果時，實驗人員設置了三項指標：1）模型一次答對的機率；2）模型前五次預測中有正確答案的機率；3）模型預測中有正確答案的機率。
結果顯示，經過強化微調的o1 mini在一次答對的準確率上躍升180%達到了31%，各方面全面超越了o1。強化微調技術將使開發者能夠透過更快、成本更低的o1 mini模型獲得超越o1的專業效能，將極大促進AI在各領域的應用。

DAY3：影片大模型Sora釋出

正式釋出影片大模型Sora

文字/影像生成影片：Sora使用者可以使用文字、影像來提示Sora生成相關影片
時間線編輯：全新推出的故事板工具讓使用者可以精準地指定每個幀的輸入和生成影片的內容，並輕鬆進行影片剪輯，使用者指令越少，Sora會嘗試填充更多細節，使用者指令越詳細，Sora會嘗試遵循要求方向生成影片。使用者可在Sora中儲存自己喜歡的風格，並在後續影片生成任務中重複調用。
高解析度、多種格式支援：Sora可以生成480p-1080p解析度、5-20秒、寬屏、豎屏或方形的影片。並且使用者可以利用資源進行擴充套件、remix（使用者只需描述對影片的更改，Sora將自行完成）和融合。對於同一指示，Sora可生成多個不同影片方向的變體，供使用者選擇。

多種工具支援Sora

1）Remix:使用Remix替換、刪除或重新構想影片中的元素；
2）Re-cut：找到並提取最佳幀或影片段落，然後向任一方向延伸它們以完成特定場景，例如可對之前生成的影片進行裁剪，要求Sora生成全新開頭或結尾；
3）Loop：使用Loop剪輯並建立無限重複的影片，例如：使用者喜歡燈塔影片，可使用Loop工具，Sora將自動生成內容將重複影片的開頭和結尾連線，生成可重複影片；
4）Blend：將兩個影片合併為一個影片，給Sora兩個影片場景，Sora會將其中元素合併生成全新影片，使用者可用指令提示Sora兩個影片的合併方向；
5）Style presets：使用Presets建立和分享自己的影片風格。

DAY4：Canvas協作平臺釋出

正式釋出Canvas協作平臺

Canvas全面開放，已被整合進ChatGPT中；
提升了程式碼功能，使用者可以直接在Canvas上執行Python程式碼，並可直觀看到程式碼結果輸出；
Canvas目前可被CustomGPT呼叫

Canvas主要功能

使用者編輯文字：在使用Canvas工具後，互動頁面將被分為兩部分，左側為與模型的對話，右側為使用者可直接編輯的文件，使用者可直接在Canvas工具中刪除、新增、修改ChatGPT回覆的內容，以及進行加粗等格式調整。不論是寫信、寫公文還是論文，這種新生成模式都可以大幅提升效率。
同時OpenAI在Canvas工具右下角集成了部分快捷工具，使用者只需點選即可實現包括詢問模型反饋（Suggest edits）、文件長度調整（Adjustthe length）、語言風格轉化（Reading level）、文件潤色（Add final polish）、新增表情（Add emojis）這些使用者在處理文件時的常用功能。
審稿：很多人使用ChatGPT幫助寫作，但以前一問一答的形式非常繁瑣，現在使用者只需要把文章複製貼上到ChatGPT的文字框中，透過文字入讓其給出修改建議，大模型給出的建議會以逐條批註的形式出現。使用者可在頁面中對應位置看到ChatGPT給出的修改建議，並決定是否根據批注進行潤色，之後關閉建議，或者直接選擇Apply，讓ChatGPT自行對內容進行修改。這使使用者可以更直觀的使用模型幫助自己審閱文章，並給出建議。

DAY5：Chatgpt進一步整合到Apple生態系統

ØDay5,蘋果公司釋出了其iPhone、iPad和Mac軟體的更新（iOS和iPadOS 18.2），將ChatGPT進一步嵌入蘋果系統當中，此次更新包括在Siri、寫作工具和視覺智慧中與ChatGPT的整合。

Ø 據彭博社訊息，ChatGPT在回答問題時的準確率比Siri高出25%，且能回答30%更多的問題，蘋果選擇與OpenAI合作，將ChatGPT整合進iOS、iPadOS和macOS系統將極大提升其智慧體驗。

Ø 目前，在iPhone、Mac、iPad等裝置中，新版的蘋果智慧已經包含ChatGPT拓展功能，使用者可在設定中自行選擇是否呼叫ChatGPT。

DAY6：增強版高階語音模式釋出

增強版高階語音模式

增強版高階語言模式具備螢幕共享和視覺功能，ChatGPT可以協助理解手機攝像頭以及螢幕上所檢視的內容。這些功能在高階語音模式已有的基礎上進一步增強，目前ChatGPT支援像人類的自然對話對話，同時對話可以被中斷，具有多輪互動，並理解非線性的思維過程。
即時視訊通話：使用者現在可以使用影片與ChatGPT進行交流，這使得溝通更加直觀和生動。在官方展示案例中，OpenAI的工作人員透過ChatGPT的影片功能現場獲取瞭如何製作一杯咖啡的指引。當演示者按照步驟操作時，ChatGPT會同時口頭提供見解和指導。
即時螢幕共享：使用者可以將自己的螢幕內容分享給ChatGPT，以獲取ChatGPT提供的技術支援或協助處理螢幕內容。在官方演示中，OpenAI的工作人員透過與ChatGPT共享螢幕，獲得了關於如何回覆其訊息的建議。

DAY7：Projects對話管理工具上

Projects in ChatGPT：可以將ChatGPT的各種功能整合至一處，便於使用者建立並管理各類專案，不僅支援Canvas介面，還能透過ChatGPT Search輕鬆接入網際網路資源。
分專案管理ChatGPT：Projects賦予使用者將聊天與資料分組的能力，從而使使用者能夠依據自身需求更加便捷地定製ChatGPT。在建立Projects的過程中，使用者可以在介面內設定標題、自定義資料夾的顏色、上傳與專案相關的檔案，並編寫說明來指導ChatGPT如何最高效地協助使用者完成項目。在專案內部，使用者可以即刻開啟聊天，並透過側邊欄輕鬆地將過往的聊天記錄新增到專案中，同樣支援利用上下文資訊來回答問題。聊天內容能夠儲存在專案中，便於支援使用者稍後繼續對話，並清楚地知道在哪裡查詢所需內容。

DAY8：ChatGPT搜尋功能更新

搜尋功能全新升級

全方位體驗升級：使用者現在可以直接訪問嵌入式YouTube影片、圖片、電影資源，還能便捷地使用商業地圖和餐廳導航。在官方演示中，演示者只需與ChatGPT自然對話，ChatGPT便可自行判斷是否需要呼叫ChatGPT search，同時，使用者也可以選擇開啟ChatGPT search功能。
移動裝置的最佳化體驗：針對移動裝置，OpenAI根據使用者反饋優化了聊天搜尋的體驗。在官方演示中，演示者搜尋了Mission附近的墨西哥餐廳，ChatGPT search可自行進行篩選，並展示了路線、網站、電話和營業時間等詳細資訊。使用者可進一步提問哪些餐廳支援室外用餐，ChatGPTsearch可自行進行下一步篩選，並列示符合要求的選項，使用者可點選商家地址，即可呼叫蘋果地圖規劃路線。
在Advance Voice模式中整合：可以在高階語音模式中使用搜索，透過語音命令訪問最新的網路資訊，增強了ChatGPT的互動性和便利性。在官方演示中，演示者透過語音向ChatGPT提問在12月23日蘇黎世有什麼活動，ChatGPT可在搜尋後語音進行回覆，並支援使用者對感興趣的活動進一步提問，如舉辦時間、地點、活動舉辦當天的天氣等。

DAY9：o1正式版API全面上線

o1 API全面開放

Function calling：允許開發者將外部API和資料庫連線到o1模型；
Structured Outputs：確保模型輸出遵循開發者定義的JSON模式，使解析和使用模型輸出更加容易；
Developer messages：為模型指定指令，例如定義語氣、風格及其他行為；
Vision capabilities：支援對影像進行推理，解鎖科學、製造或編碼等領域中更多依賴視覺輸入的應用；
Lower latency：o1在每個請求中平均使用比o1-preview少用60%的推理tokens；
Reasoning_effort：一個全新引數，允許開發者控制模型在回答前思考的時間長度。

o1 在各領域效能顯著提升

現場展示了對o1 API呼叫的測試結果，o1在函式呼叫、內部結構化輸出、數學、程式設計等領域均達到了目前所有模型的最高準確度。
在數學領域，OpenAI測試了經過自定義輸出結果的o1模型（o1 with Structured Outputs），結果顯示其仍能保持極高的準確度，因此開發者對模型進行自定義調整後，模型仍能夠保持其效能。

DAY10：ChatGPT通話訪問模式

通話訪問模式

ChatGPT通話開放：目前美國使用者可透過電話與ChatGPT溝通，具體號碼為：1-800-242-8478，使用者可將其新增為手機聯絡人，通話會被審查以確保安全。在官方演示中，演示者透過直接撥入電話的方式接入ChatGPT，並提問在舊金山的280號洲際公路上看到的圓頂房子是什麼，ChatGPT準確回覆房子的名字，並進行了簡短介紹，同時支援使用者對問題進行進一步溝通。使用者可以透過任何裝置撥號連線ChatGPT，包括非智慧手機、固定電話等，這意味著老年人也可以透過其老年機接入ChatGPT，並獲得相應回覆。
WhatsApp聊天：全球範圍內，使用者可在WhatsApp上與ChatGPT聊天，使用者可以像與聯絡人中的任何人一樣，透過文字輸入問題，即可獲得基於4o-mini模型生成的回覆。在官方演示中，演示者透過WhatsApp詢問ChatGPT意麵香蒜醬的製作方法，ChatGPT可生成詳細的製作方法，包括原材料、製作步驟等。同時，ChatGPT能根據使用者的不同要求（如素食、特定飲食偏好等）更新食譜，並回復相應配菜建議。

DAY11：桌面應用新功能

MacOS桌面應用更新：輕量級且資源佔用少，擁有單獨視窗，應用時無需在不同的應用程式、視窗之間切換。用戶可透過快捷鍵快速呼叫ChatGPT，同時在對話視窗下方，使用者可點選使用應用程式的選項，ChatGPT可自動提取已完成的工作進度，使用者無需上傳任何資訊即可與ChatGPT進行互動。

DAY12：全新o3模型亮相

強大的數學和程式設計能力

程式設計能力：o3在程式設計方面相較o1大幅提升。在SWE-bench Verified基準測試中，o3的準確率達到了71.7%，比前輩o1高出20%以上。這意味著，o3在編寫高質量程式碼方面，已經超過了大多數軟體工程師。
數學能力：在AIEM 2024，o3幾乎拿到了滿分，這是AI在AIEM數學競賽中取得的最好成績。此外，在GPQA Diamond博士級科學考試中，o3的準確率達到了87.7%，比o1高出近10%。這表明，o3在處理複雜數學問題時，已經達到了頂尖水平。

推理能力里程碑式突破

o3在ARC-AGI基準測試中的表現尤為突出，達到了87.5%的準確率，遠超人類的85%閾值。ARC-AGI基準測試旨在評估AI系統的抽象和推理能力，要求AI識別模式並解決新問題。o3實現了AI領域第一次超越人類的成績，完成了里程碑式的突破。

o3 mini模型

o3 Mini 是 o3 系列中的高效推理模型，適用於任何需要數學和編碼能力的人。由於成本低，o3 Mini 可能會在全球範圍內開放使用。o3 Mini支援低中高三種不同的推理時間選項，可以根據自己的使用情況自由調整模型的推理時間。
程式設計能力：支援自適應推理時間，低中位數推理時間下程式碼效能優於 o1 Mini，在速度和成本方面出色。
數學能力：在 AIME 2024測試中，低推理選項與 o1 Mini 和 o3 Mini 效能相當，中位數推理時間效能更好，高推理可進一步提升；延遲大幅減少，支援函式呼叫等功能，效能優於多數模型。