1.【DeepSeek開源第四彈教最佳化,梁文鋒參與研發】2月27日,DeepSeek開源周(OpenSourceWeek)第四彈來了,DeepSeek在X上宣佈這次開源的是三項最佳化並行策略,並在Github上詳細展開了DeepSeek-V3和R1模型背後的平行計算最佳化技術,透過這些闡述可以清晰瞭解團隊是如何精細地最佳化計算和通訊,最大限度利用GPU能力的。這三項最佳化並行策略其中包括DualPipe,這是一種用於V3/R1模型訓練中計算與通訊重疊的雙向流水線並行演算法,這種演算法能夠完全重疊前向和後向計算通訊階段,與傳統方法相比減少了“流水線氣泡”(裝置在某些時刻的空閒等待)。在DualPipe的開發團隊署名中,包括創始人梁文鋒。(介面新聞)
2.【亞馬遜Alexa+語音助手將採用Anthropic的Claude模型】當地時間2月26日,亞馬遜宣佈使用生成式AI重建Alexa語音助手,命名為Alexa+。Alexa+服務將收費19.99美元/月,亞馬遜Prime會員可免費使用。人工智慧初創公司Anthropic的Claude模型將為Alexa+提供支援。(騰訊網)
3.【Anthropic全面開放Claude AI的GitHub整合】Anthropic的Claude關係負責人Alex Albert於2月25日在X平臺釋出推文,宣佈面向免費、Pro和Teams使用者,開放GitHub整合Claude。GitHub整合此前僅限Claude企業版(Claude for Enterprise),為企業使用者提供更強大的程式碼理解和輔助能力。整合方式主要為將GitHub程式碼庫直接同步到Claude,讓Claude能夠理解程式碼庫的上下文,幫助使用者測試和除錯程式碼、理解程式碼庫並提供更有效的程式碼輔助功能等。(IT之家)
4.【微軟Phi-4多模態及迷你模型上線,語音視覺文字全能】微軟進一步擴充套件Phi-4家族,推出了兩款全新模型:Phi-4多模態(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)。Phi-4多模態模型是微軟首款整合語音、視覺和文字處理的統一架構多模態語言模型,引數量達56億。在多項基準測試中,Phi-4多模態的表現優於其他現有的先進全模態模型,例如谷歌的Gemini 2.0 Flash和Gemini 2.0 Flash Lite。Phi-4迷你模型則專注於文字任務,引數量為38億。(IT之家)
更多AIGC資訊……
掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

