1.【OpenAI上線Flex處理模式:API費用減半,犧牲響應速度及穩定性】為了更積極地與谷歌等AI競爭對手展開競爭,OpenAI宣佈推出“Flex處理模式”新的API服務——使用者以接受響應速度變慢和“資源偶爾無法分配”為代價,換取更優惠的模型使用價格。OpenAI表示,Flex處理目前已對新近釋出的o3和o4-mini推理模型開放測試,主要面向模型評估、資料擴充、非同步處理等優先順序較低的“非生產”任務。採用Flex處理,API費用將直接減半。以o3為例,Flex模式下的費用為每百萬輸入tokens收取5美元,每百萬輸出tokens收取20美元。作為參考,標準價格分別為10美元和40美元。對於o4-mini,Flex模式的費用則從每百萬輸入tokens收取1.10美元、每百萬輸出tokens收取4.40美元,降至每百萬輸入tokens收取0.55美元和每百萬輸出tokens收取2.20美元。(IT之家)
2.【微軟釋出可在CPU上執行的超高效AI模型BitNet】微軟推出全球最大規模的1-bit AI模型BitNet b1.58 2B4T,擁有20億引數,能在普通CPU如蘋果M2上高效執行。模型以僅-1、0、1的極簡權重實現高記憶體和計算效率,在多個推理任務中超越Meta、谷歌等同類模型,速度更快、資源佔用更低。惟一限制是需依賴微軟自研框架bitnet.cpp,相容性仍受限。(財聯社)
3.【阿里開源通義萬相首尾幀生影片14B模型】阿里開源通義萬相首尾幀生影片14B模型,這是業界首個開源的百億級引數規模首尾幀生影片模型。可根據使用者指定的開始和結束圖片,生成一段能銜接首尾畫面的720p高畫質影片。滿足延時攝影、變身等影片生成需求。(每日經濟新聞)
4.【字節跳動開源雲原生排程框架Godel-Rescheduler】4月18日,字節跳動技術團隊宣佈開源Godel-Rescheduler,一個適用於雲原生系統的全域性最優重排程框架。據介紹,Godel-Rescheduler由兩個核心模組組成:Policy Manager和Movement Manager。其中,Policy Manager負責輸出重排程決策,而Movement Manager則負責拆解並執行這些決策。整個框架的目標是透過重排程,使叢集朝向全域性最優狀態發展。(IT之家)
更多AIGC資訊……
掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

