
圖片來源:Unsplash
根據金融時報報道,微軟AI負責人穆斯塔法·蘇萊曼(Mustafa Suleyman)挖走了其前同事——在Google DeepMind工作、並打造了其受歡迎的播客生成功能的團隊成員。
蘇萊曼2010年共同創辦了DeepMind,他僱傭了Marco Tagliasacchi和Zalán Borsos,兩位在Google AI研究工具NotebookLM中的“音訊概覽”(Audio Overviews)功能背後的資深科學家。該功能可以讓使用者將文字轉換為具有吸引力對話播客風格的音訊。
兩人還參與了DeepMind即將釋出的AI代理Astra的研發,該代理可以即時回答關於影片、音訊和文字的問題。
第三位從DeepMind加入微軟的成員是Matthias Minderer,他將專注於開發視覺能力,即AI模型分析影像的能力。這些研究人員將加入微軟位於蘇黎世的新AI實驗室。
這三人於週二宣佈了他們的跳槽訊息。一位熟悉此事的人士表示,這些研究人員對蘇萊曼推動下一代Copilot的工作至關重要,微軟正在努力建立互動AI Agent,可以執行從預定航班到管理日程等任務。
蘇萊曼在LinkedIn上寫道:“這是一個出色的團隊,將成為[微軟AI]的一個重要中心,和我們位於倫敦的辦公室一起,那裡也在快速增長!”
Tagliasacchi在LinkedIn上寫道:“AI仍然是一個變革性的力量,音訊在塑造更自然、更直觀、更沉浸式的互動中扮演著至關重要的角色。”
蘇萊曼於2022年離開Google,轉向風險投資,並隨後創辦了AI初創公司Inflection。他於2024年3月加入微軟,並將Inflection的幾名員工帶到了這家美國科技巨頭。蘇萊曼還招聘了Google DeepMind健康AI部門的成員,以及DeepMind的知名AI研究員Nando de Freitas。Google也將頂尖AI人才輸送給了競爭對手Apple。
微軟和Google是致力於透過“多模態”AI模型建立代理的公司之一,這些AI模型能夠分析和理解音訊、影片或影像中的內容。
去年,OpenAI推出了ChatGPT的高階語音模式,例如,允許使用者以更自然的方式與AI互動。Google的語音驅動AI代理Astra計劃於2025年推出,而亞馬遜則在尋求將AI模型引入其語音驅動的數字助手Alexa中。
參考資料
[1] Microsoft poaches DeepMind staff behind AI podcasting feature, https://www.ft.com/content/51bb0496-59ab-4a75-a410-14c097104594
歡迎掃碼加群參與討論

———END——–
我們相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
