8人團隊6個月,打造開源版“GPT-4o”,截胡OpenAI

最近,一個效果堪比GPT-4o的開源即時語音多模態模型火了,模型名為 Moshi。現場演示幾乎0延遲,AI大佬紛紛轉發。
這個開源模型由法國非營利性AI研究機構Kyutai的一個8人團隊,在6個月內開發完成。
詳情請戳影片👇
根據睿獸分析資料顯示,Kyutai成立於2023年11月,專注於開發包含文字、聲音、影像等的大型多模態模型。剛剛成立就完成了來自法國億萬富翁、法國電信集團Iliad執行長Xavier Niel、法國物流巨頭達飛集團CEO Rodolphe Saadé 和前谷歌CEO Eric Schmidt 共3億歐元的種子輪融資。
Kyutai創始成員共有6人,他們都曾在蘋果、微軟、Meta(Fackbook)、谷歌DeepMind等科技巨頭的實驗室從事研發工作。團隊中的執行長Patrick Pérez、首席擴充套件官Edouard Grave、首席科學官Hervé Jégou都是谷歌Scholar被引量高達4W+的學術大牛。
以上就是本期全部內容,如果您想了解更多AI創新創業專案資訊等,歡迎登入睿獸分析檢視,解鎖賽道圖譜以及行業報告。   


相關文章