1.【OpenAI上線Flex處理模式：API費用減半，犧牲響應速度及穩定性】為了更積極地與谷歌等AI競爭對手展開競爭，OpenAI宣佈推出“Flex處理模式”新的API服務——使用者以接受響應速度變慢和“資源偶爾無法分配”為代價，換取更優惠的模型使用價格。OpenAI表示，Flex處理目前已對新近釋出的o3和o4-mini推理模型開放測試，主要面向模型評估、資料擴充、非同步處理等優先順序較低的“非生產”任務。採用Flex處理，API費用將直接減半。以o3為例，Flex模式下的費用為每百萬輸入tokens收取5美元，每百萬輸出tokens收取20美元。作為參考，標準價格分別為10美元和40美元。對於o4-mini，Flex模式的費用則從每百萬輸入tokens收取1.10美元、每百萬輸出tokens收取4.40美元，降至每百萬輸入tokens收取0.55美元和每百萬輸出tokens收取2.20美元。（IT之家）

2.【微軟釋出可在CPU上執行的超高效AI模型BitNet】微軟推出全球最大規模的1-bit AI模型BitNet b1.58 2B4T，擁有20億引數，能在普通CPU如蘋果M2上高效執行。模型以僅-1、0、1的極簡權重實現高記憶體和計算效率，在多個推理任務中超越Meta、谷歌等同類模型，速度更快、資源佔用更低。惟一限制是需依賴微軟自研框架bitnet.cpp，相容性仍受限。（財聯社）

3.【阿里開源通義萬相首尾幀生影片14B模型】阿里開源通義萬相首尾幀生影片14B模型，這是業界首個開源的百億級引數規模首尾幀生影片模型。可根據使用者指定的開始和結束圖片，生成一段能銜接首尾畫面的720p高畫質影片。滿足延時攝影、變身等影片生成需求。（每日經濟新聞）

4.【字節跳動開源雲原生排程框架Godel-Rescheduler】4月18日，字節跳動技術團隊宣佈開源Godel-Rescheduler，一個適用於雲原生系統的全域性最優重排程框架。據介紹，Godel-Rescheduler由兩個核心模組組成：Policy Manager和Movement Manager。其中，Policy Manager負責輸出重排程決策，而Movement Manager則負責拆解並執行這些決策。整個框架的目標是透過重排程，使叢集朝向全域性最優狀態發展。（IT之家）

更多AIGC資訊……