
2025 年 3 月 1 日上午,DeepSeek 釋出《DeepSeek-V3 / R1 推理系統概覽》一文。文章首次披露了 DeepSeek 的理論成本和利潤率等關鍵資訊。據介紹,DeepSeek 使用了大規模跨節點專家並行(EP)的方法,並透過一系列技術策略,最大程度地優化了大模型推理系統,實現了驚人的效能和效率。假定 GPU 租賃成本為 2 美元 / 小時,總成本為 87072 美元 / 天;如果所有 tokens 全部按照 DeepSeek R1 的定價計算,理論上一天的總收入為 562027 美元 / 天,成本利潤率為 545%。
隨著 DeepSeek 對成本利潤的回應,潞晨科技尤洋、矽基流動袁進輝兩家創始人隔空發文,並且進行在朋友圈和知乎上互懟。
首先,袁進輝對於 DeepSeek 表達感激,並評論稱:“DeepSeek 官方披露大規模部署成本和收益,又一次顛覆了很多人認知。現在很多供應商還做不到這個水平。”隨後,尤洋發表“關於 DeepSeek MaaS 成本”和“坑人的矽基流動”兩篇文章。
此前,潞晨科技 CEO 尤洋表示,滿血版 DeepSeek-R1 每百萬 token(輸出)定價 16 元,如果每日輸出 1000 億 token,需要約 4000 臺搭載 H800 的機器,以目前 H800 的市價或者折舊來計算,每月僅機器成本就達 4.5 億元,因此企業方可能面臨每月 4 億元的虧損。DeepSeek 發文後,尤洋昨日發文回應,“我對 DeepSeek 沒有任何貶低。我最開始就是抨擊那些倒賣 DeepSeek API 去賠本賺吆喝的中小云廠商,然後吹噓自己推理快 10 倍。”他表示,DeepSeek 資料對計算 MaaS 成本沒有任何參考價值,文章中把 DeepSeek 網頁,APP 和 MaaS API 的 token 數加在一起計算。但尤洋表示他說的 MaaS 是 ToB 的工具,不是 ChatGPT 類的 APP。DeepSeek 的 MaaS 要想有一個這麼高滿負荷的狀態,必須要讓自己的 APP 和網頁始終超負荷運轉。他還指出,春節期間 DeepSeek 使用體驗意識到“根本就不是一個合格的 MaaS 產品。
隨後,他直指矽基流動創始人袁進輝“頻繁在朋友圈陰陽他”,並稱“矽基流動疑似組織水軍長期黑我”。尤洋在文中分析了矽基流動網站訪問量大增的原因,認為主要得益於春節期間綁上國產晶片的宣傳效果和邀請碼送代金券的拉人頭傳播。他質疑矽基流動的代金券承諾與實際現金流之間存在巨大缺口,並對其 API 效能表示懷疑。
袁進輝迅速在朋友圈回應,為自家團隊春節期間的努力辯護,強調“提供穩定服務”無可厚非,並反擊稱矽基流動曾被潞晨科技抄襲。針對抄襲指控,尤洋回應稱,實施抄襲的是潞晨科技前 CTO,該人士已離職並加入了袁進輝的公司。隨後袁進輝轉發了去年橘皮優團隊對潞晨科技的指控文章,稱潞晨科技“不是一次抄襲,而是多次發生”。
爭論進一步擴大,被指為抄襲總負責人的潞晨科技前 CTO 方佳瑞也加入論戰,稱自己是被尤洋“甩鍋”,抄襲的程式碼與他無關,並透露自己是因質疑“詐騙式期權協議”而被趕走。並且,袁進輝回應稱,“(潞晨)CTO 沒加入我們公司,之前加入的是光年之外,後來加入其他大公司了。而且都是他自己犯錯甩鍋給別人,不是別人的問題。”
今天凌晨,尤洋發文致歉稱:本人昨天情緒太沖動,說了一些讓人誤解 deepseek infrastructure 團隊的話。deepseek infrastructure 團隊技術一流並給開源社群做出巨大貢獻。本人誠摯道歉,已經刪除不當表述,感謝大家提醒。
3 月 1 日下午,潞晨科技宣佈將暫停 DeepSeek API 服務。
2 月 27 日,網上曝出 Kimi 最新模型 k1.6。全球動態基準測試平臺 LiveCodeBench 資料顯示,其在程式碼生成測試中力壓 GPT o3mini、o1 等模型,成功登頂。與此同時,月之暗面在面對 DeepSeek 爆火衝擊後,對產品策略進行了深刻覆盤與調整。
月之暗面研究員 Flood 在社交平臺透露,“k1.6 是基於 k1.5 做的訓練,效能還在提升中”。月之暗面聯合創始人張予彤也表示,“k1.6 還沒有釋出,但看到 LiveCodeBench 的成績感到開心,期待智慧模型的持續進化。”

知情人士稱,DeepSeek 的爆火給月之暗面內部帶來巨大刺激。經過覆盤,團隊認為要堅持基礎模型 SOTA。接下來,團隊或重新訓練基礎模型,同時抓住應用層機會,其中 DeepResearch 成為內部選中的產品方向,這是 OpenAI 在 2 月釋出的一款面向深度研究領域的智慧體產品。
北大校友王虹和哥倫比亞大學副教授 Joshua Zahl 合作,在三維空間中證明了困擾數學家上百年的經典難題 —— 掛谷猜想(Kakeya 猜想)。這一成就使得王虹成為 2026 年菲爾茲獎的熱門人選,有望成為首位獲得該獎項的中國籍女性數學家。據悉,王虹 1991 年出生於廣西桂林,16 歲考入北大,後轉入數學系,2019 年博士畢業於麻省理工大學。
掛谷猜想由日本數學家掛谷宗一於 1917 年提出,涉及調和分析、數論等多個數學分支。王虹和 Joshua Zahl 透過 127 頁的論文證明了這一猜想,其研究方法涉及非聚集條件、Wolff 公理、多尺度分析等技術。
英偉達股價近日大跌 8.48%,市值跌破 3 萬億美元。自 2025 年以來,英偉達已兩次經歷市場下滑,最近的一次是由於 AI 應用 DeepSeek 的走紅,引發市場對英偉達晶片和開發支出必要性的質疑。儘管 2025 財年英偉達營收和利潤大幅增長,但毛利率下降,且下季度毛利率預期低於市場預期,引發市場擔憂。英偉達 CEO 黃仁勳表示新產品 Blackwell 已全面投產,市場需求巨大,但分析師指出擴大出貨量產生的額外費用進一步壓縮了利潤空間。
近期,有關 “雷軍身家超鍾睒睒成為中國首富” 的訊息被廣泛傳播,但胡潤排行榜創始人胡潤澄清稱該訊息不實。
胡潤分析,雷軍個人財富近期確實有所增長,可能達到前五名或前三名,但並未達到首富位置,估算其財富約為 3200 億至 3300 億人民幣。網傳雷軍本人在武漢大學校友群中的回應簡潔明瞭:這是一則假新聞。
此前,小米集團股價大漲,總市值超 1.4 萬億港元,雷軍財富增至近 4400 億元人民幣,成為中國新首富。雷軍財富主要來源於小米集團、金山系公司和順為資本投資的多家獨角獸企業。
2 月 27 日,小米 SU7 Ultra 釋出,旨在成為全球最快的四門量產車。該車型配備小米超級三電機系統,標配賽道版散熱、制動系統和紐北調校底盤系統,標準版即可直接上賽道。小米 SU7 Ultra 售價 52.99 萬元,紐北限量版是 81.49 萬元,已在小米汽車 App 開售。開售 2 小時後,SU7 Ultra 大定突破 10000 臺。小米汽車宣佈,3 月 2 日上午在小米汽車工廠交付首批小米 SU7 Ultra。
據悉,拼多多內部已經組建了電商推薦大模型團隊,負責人之前為百度鳳巢的核心成員。據訊息人士透露,此人之前在百度時就已經是千萬級年薪,而這次拼多多給的誠意也很足,其年包是在百度時的數倍。
另一訊息人士稱,拼多多去年就從百度招了一批人來做大模型相關的專案。目前,拼多多大模型產品分為幾個應用:比價系統、推薦、廣告、搜尋、客服領域等,這些應用領域一直都有持續投入在做。每個小組的大模型團隊會互相進行賽馬,收益以幾個小組直接 PK 的結果為準。不過,據媒體報道,對於該動向,當時拼多多內部人士解釋稱,“公司在 AI 大模型上暫時沒啥佈局,內部確實在做 AI 智慧客服,但算不上大模型量級。”
2 月 28 日訊息,螞蟻集團釋出內部通知,宣佈對兩項薪酬政策進行調整,以提升員工薪酬收入的流動性和激勵即時性。
根據通知:17 級及以下員工取消年底 13 薪,改為併入到每月基本工資中發放;18 級以上的高 P 員工,13 薪併入年度獎金,與績效激勵掛鉤,和年終獎一起發放。銷售崗位不適合此薪資政策。同時,自 2025 年 4 月 1 日起,新授予的績效股將從年度歸屬調整為季度歸屬,即每滿一個季度,員工將獲得 1/16 的股權歸屬。
2 月 24 日訊息,據報道,國內企業級 AI Agent 公司上海瀾碼科技有限公司近期對數十名員工直接解除勞動合同。同時,“瀾碼科技”公眾號自去年 10 月 28 日至今處於停更狀態。多位瀾碼科技員工在社交平臺上稱,去年 10 月開始,公司陸續就停了員工的工資、社保、公積金,今年 1 月 6 日左右,約 50 名員工被公司直接裁員,並且給予解除通知書。今年 2 月初,多名瀾碼科技員工集體到位於上海徐匯的西岸智塔樓下“拉橫幅”討要薪資。員工稱,他們已經進入立案、調解等階段。
對此,2 月 23 日晚,瀾碼科技創始人、CEO 周健回應稱,公司因融資問題進行了裁員,但並非全部裁員,目前仍保留約 20 名員工。周健表示,公司已支付了三分之二的欠薪,並正在積極尋求被併購的可能性,同時他個人也已透過借錢和賣房來償還員工薪資。
瀾碼科技成立於 2023 年,是一家基於大語言模型的企業級 AI Agent 平臺公司,曾於 2023 年 8 月完成數千萬元人民幣的 A 輪融資,投資方包括 IDG 資本、聯新資本等。公司創始人周健是 ACM 國際大學生程式設計競賽世界冠軍、李開復的“關門弟子”,曾任職於谷歌、阿里雲、依圖和弘璣等公司,是依圖科技的 10 號員工和弘璣 RPA 公司的 CTO。
被特朗普帶火旗下充電寶產品後,消費電子品牌安克創新最近又吸引了一波關注。近日,網上流傳著一組安克創新內部會議的照片,照片顯示安克創新去年獎金分紅 8 億元,年收入破百萬人數達 494 人。安克創新相關負責人對多家媒體回應稱,該組會議圖片屬實。
據安克創新內部人士透露,目前安克創新員工人數約 5000 人,此次獎金分紅到手較為可觀,中等績效人士分到的錢差不多等同於年薪。部分業務好的團隊,獎金會在 20 個月收入以上。據企業披露資料計算,2023 年安克創新的年人均薪酬為 47.15 萬元。
也有網友留言稱,安克創新目前員工大比例為外包員工,分紅覆蓋範圍並不廣。並有網友質疑分紅宣傳有營銷之嫌。針對網友質疑聲,前述安克創新相關負責人表示,公司外包員工並未推行很久、僅佔很小比例,遠不到誇張的大比例,上述外界言論不實。
雷峰網報道,安克創新創始人陽萌曾在會議中表示,公司的願景:“五年後做到人均百萬年薪的大公司”。不過,安克和很多創新型公司一樣,面臨的問題是極致內卷導致大批體能跟不上的中高層離職。由於制度、管理、人效相對較高,如何吸引 95、00 後人才是不得不面臨的挑戰。
據知情人士透露,安克內部所有員工,都要經歷環評。半年一評,一年一大評。這也是安克一直強調的價值觀。環評的初衷是希望公司提高人效,不過也帶來一些內耗問題。部分中高層領導發現,因為環評制度不敢錯過任何同事資訊,導致一天要回復 2 小時起的資訊。而公司開會較多,報告字數較長,又要寫 2 小時報告。分給真正業務的時間,往往不足 40%。
然而,安克創新的捲到極致的管理方式和營收形成了正比。有傳言稱,安克未來要做“1000 億營收”。對此公司上下士氣非常足。不過安克目前的工作時間較長,996 現象嚴重,創始人陽萌也希望透過制度改革,慢慢將公司回到 2021 年之前的花團錦簇。
據悉,安克創新在研發層面也在持續投入。近日,安克創新宣佈,募資的 11 億人民幣有 2.48 億元計劃用於儲能。據知情人士透露,2024 年安克儲能營收高達 30 億元人民幣。相當於 80% 華寶新能,40% 正浩。據悉,安克的營收和利潤增長,主要來自全球市場開拓及核心業務持續創新,而儲能是關鍵因素之一。
2 月 25 日,何小鵬釋出全員信,他宣佈 2025 年倡導“簡單高效”無處不在,效果效率雙線提升,不開長會、大會、沒結論的會。線上雲文件上的協同取代非必要線下會議,比例高達 30%+,觀點碰撞即時化。還要告別華麗 PPT,因為 PPT 使用率極低,僅在新車釋出會中保留。在這篇 1 千字左右的全員信中,他提了 22 次效率、提效或高效,要求在每一分鐘的會議、每一份文件、每一次差旅中提高效率。
會議上,發言者直接公佈了一組資料:一個月,小鵬汽車開了 1.2 萬場會,總時長 1.4 萬小時。如果壓縮給同一批人,每天工作 10 小時,要不間斷開 3 年多。其中,20 人以上、超過 90 分鐘的大型會議有 344 場。
調研物件特別篩選過,就是公司裡 “高頻組織開會的人”。何小鵬說,這是 “重災區”——按每小時平均工資 150 元計算,一場大型會的成本是 2.7 萬元,“10 場會議就夠買一輛小鵬 G6 頂配版”。何小鵬也在那場會議裡。一年多後,他表示當時 “第一次看到資料統計,我都吐了口血”。
業務方面,據報道,從小鵬汽車自研晶片將在今年 5 月份實現首次上車。據悉,今年 5 月底或 6 月初,小鵬汽車將釋出一款全新車型,該車將是搭載自研晶片的首款車型,內部代號或為“F57”。
去年 8 月 27 日,小鵬汽車召開發佈會,正式釋出了其自研晶片,並將晶片名命名為“圖靈晶片”。據悉,小鵬圖靈晶片專為 AI 大模型定製,可同時應用於 AI 汽車、飛行汽車等諸多 AI 硬體上。圖靈晶片算力為同行的三倍。知情人士稱,“(圖靈晶片算力)對於小鵬來說是足夠了,而且價效比比 Thor 高太多了。”該知情人士還透露,小鵬汽車現在“完全不鳥英偉達了”,只是在涉及此前 Orin 晶片專案時才有聯絡。據透露,小鵬汽車接下來所有全新車型都將會搭載自研晶片,不再計劃搭載 Thor 晶片。
當地時間 2 月 24 日,波士頓動力(Boston Dynamics)創始人 Marc Raibert 在美國休斯頓參加活動時透露,他的智慧機器人研究所 AI Institute 已經購買了中國機器人創業公司宇樹科技的機器人,以測試它的能力。“我們的實驗室買了宇樹的人形機器人,還買了幾個小型的機器人,它們相對便宜。”Raibert 稱,“即便我們是競爭對手,我們也可以買來看看它究竟能做些什麼。”
Raibert 表示,他對宇樹的機器人的能力印象深刻。去年夏天,Raibert 參加了上海舉行的世界人工智慧大會(WAIC)。“當時我得知他們釋出了 27 個人形機器人,非常了不起!”他表示,“那是我第一次來中國,我與宇樹的 CEO 聊過,我認為他們做得非常出色。”
波士頓動力開發了四足機器人 Spot 以及人形機器人 Atlas。在談到波士頓動力的機器人與宇樹機器人的區別時,Raibert 沒有具體展開細節,但表示:“它們之間有很多不同之處,我認為競爭是不可避免的。看看它們會如何發展將是非常有趣的事情。”
Raibert 特別提及這一輪由 DeepSeek 引發的中國人工智慧創新熱潮。他說道:“我很高興看到 DeepSeek 這樣的創新來自中國,但這只是個開始,整個人工智慧領域還在不斷湧現,我們並沒有走到最後,未來還會有更多改變技術發展的新想法出現。”
2 月 24 日,三星電子與全國三星電子工會(NSEU)宣佈達成初步協議,結束了長達數月的勞資糾紛。去年 7 月,全國三星電子工會發起史上首次總罷工,抗議長期僵持的談判,同年 11 月臨時協議被否決,但工會執行部透過信任投票得以留任,最終推動此次 3 年期協議落地。
根據協議,2023 年至 2025 年員工的平均工資上調率分別為 4.1%、5.1% 和 5.1%,其中 2025 年的漲幅由基本工資上調 3.0% 和績效工資上調 2.1% 構成。公司還將向每位員工發放價值約 170 萬韓元(約合人民幣 8636 元)的 30 股公司股票,以及 200 萬韓元(約合人民幣 10160 元)的家庭網店積分,可購買公司產品。
除此之外協議內容還包括多項福利改進,如每月工作滿 20 天的員工可獲得 25 萬韓元的輪班津貼,固定加班時長從 16.5 小時減少至 14 小時,以及為有 3 個以上子女的員工制定退休後再就業保障制度等。全國三星電子工會計劃於 3 月 5 日前舉行全員投票。
近日,特斯拉宣佈在國內推出“中國版”FSD,但汽車博主陳震在測試過程中,卻出現了多次違章。2 月 27 日一早,陳震在其個人微博釋出了一則影片,曬出了多張違章通知單。他表示,“剛剛處理完此前測試特斯拉 FSD 的違章,調監控看了下,這次測試 FSD 總共有 7 個違章。”並表示,“在目前的 L2 階段,車主開啟輔助駕駛的過程中,仍然是車輛的第一責任人,因此發生的所有事故、違章都要車主承擔。”
還有網友表示,特斯拉 FSD 入華的訊息一公佈,就立即充值 64000 元,給自己的愛車開通了這一功能。本想體驗一下所謂的全球頂尖智駕實力,沒想到現場翻車,30 秒內連闖兩個紅綠燈,扣光了駕照上的 12 分。有網友解釋說,特斯拉 FSD 剛剛進入國內,還沒有掌握國內交通通行習慣,過一段時間,資料餵養成熟後,這些問題就會解決。
本週二,特斯拉股價暴跌超過 8%,市值跌破 1 萬億美元,跌至 11 月 7 日(特朗普贏得大選兩天後)以來的最低水平。今年迄今,該股已暴跌 25%,較 12 月 16 日的創紀錄收盤價下跌了 35% 以上,而納斯達克指數今年迄今僅下跌 1.5%。特斯拉 CEO 埃隆·馬斯克的淨資產今年以來縮水了超過 520 億美元,儘管他仍然是世界上最富有的人,目前財富價值約為 3800 億美元。
2 月 27 日,阿里巴巴正式啟動春季 2026 屆實習生招聘,開放超過 3000 個崗位。當天,阿里巴巴控股集團、阿里雲、高德、通義實驗室、餓了麼、靈犀互娛首批啟動春招。接下來,淘天、阿里國際、菜鳥、阿里大文娛、智慧資訊、盒馬等將陸續開啟春季 2026 屆實習生招聘。據瞭解,本屆阿里春招與 AI 相關的崗位佔比近 5 成,部分 AI 業務部門佔比更高,高德 AI 類崗位佔比約 65%,阿里雲超過 80%。
當地時間 2 月 25 日,蘋果公司召開年度股東大會。會議審議了高管薪酬、董事會改選等多項提案。在此次股東大會上,蘋果在委託宣告書中披露了董事會提名的八位董事候選人名單,庫克位列其中,將繼任新一屆董事會席位,但並非董事長職位。
除了董事會相關事宜,股東還批准了公司高管的 2024 年薪酬方案。庫克在 2024 年的總薪酬為 7461 萬美元(含薪資、股票與獎金),較 2023 年增長 16%。庫克的收入包括 300 萬美元的基本工資、5809 萬美元的股票獎勵、1200 萬美元的基於績效的獎勵和 152 萬美元的其他薪酬,而其他薪酬包括人壽保險費、安全費用和個人航空旅行費用等等。
近日,一位來自湖南長沙的雷先生以 31.9 萬元的價格訂購了宇樹科技旗下的人形機器人 G1,後因出租爆火於網路。雷先生表示,不少人對租賃這臺機器人表示興趣,其中既有學校希望用於教學科普,也有商家希望它為店鋪引流。目前,這臺機器人的起租價格是每天 8000 元,會根據地址以及具體時間,有所調整,“有些時候可以租到 1 萬多一天。”這臺機器人已經被預訂到今年 4 月,若以此計算,近 32 萬元的購買費用,雷先生只需要 40 天就“回本”了。
目前,在宇樹科技京東官方店鋪,其人形機器人 G1 共有 4 個版本,包括 G1 標準版、G1 Edu 標準版、G1 Edu 進階版和 G1 Edu 旗艦版,售價從 129999 元起,最貴的版本售價 349000 元,雷先生購買的則是售價 319000 元的 G1 Edu 進階版。但是,目前京東平臺下訂之後需要等待至少 90 天才能交付,並且還需要使用者全款預訂。
亞馬遜雲科技(AWS)正式宣佈推出其首款量子計算晶片“Ocelot”,標誌著其在量子計算領域的重大進展。與當前主流方法相比,Ocelot 晶片能夠將量子糾錯的成本降低高達 90%。這一創新成果由位於加州理工學院的 AWS 量子計算中心團隊研發,並已在權威學術期刊《自然》(Nature) 上發表相關研究論文。
在次前一天,微軟釋出了其最新的量子計算成果——Majorana 1 晶片。據悉,該晶片採用了獨特的拓撲量子位元架構,利用馬約拉納零模式(MZM)構建量子位元,相較於谷歌 Willow 處理器和中國的 Zuchongzhi 3.0 等競爭對手的傳統量子位元方法,展現出更高的穩定性和可擴充套件性潛力。
但有專家指出,微軟論文只展示了部分內容,具體路線圖存在許多障礙。牛津大學的史蒂文・西蒙提到,類似研究方法的文章曾在 2021 年被撤回。倫敦大學學院的喬納森・奧本海姆認為,微軟團隊尚未證明擁有真正的拓撲量子位元。科學界正關注微軟的技術進展及其與其他量子計算平臺的效能對比。
2 月 24 日訊息,上海市公安局閔行分局今日公佈了一起利用 AI 生成美女談戀愛的詐騙案,成功搗毀了一個 10 人詐騙團伙,涉案資金高達 200 餘萬元。2025 年 1 月,在當地警方的協助下,上海閔行警方在廣東、福建、山東等地展開了集中收網行動。查獲手機 60 餘部、手機卡 250 餘張,同時還發現了一套“戀愛話術”和近千名潛在被害人的通訊錄。
經調查,該詐騙團伙利用 AI 生成的影片或網路素材進行“廣撒網”式交友短影片釋出,以此引流,誘導被害人新增微信。隨後,聊天業務員使用“戀愛話術”與被害人聊天,確立“戀愛關係”,並以“購買禮物”“開業花籃”等理由進一步篩選潛在被害人。最後,嫌疑人會謊稱家屬住院需要高額手術費等理由進行收割,期間還會展示身份證,其實也是虛假的。被害人數月以來卻連美女的面都沒見過,有人頓感被騙,遂向警方報案。
從計算到通訊再到儲存,DeepSeek“五連炸”幾乎覆蓋了 AI 開發的全鏈條,在完全沒有升級現有硬體的情況下最大程度地“榨乾”算力,進而實現訓練效率的飛躍。
第一天:FlashMLA 架構,直接“爆改”英偉達 GPU,突破 H800 計算上限;
第二天:DeepEP,第一個用於 MoE(混合專家)模型訓練和推理的開源 EP(專家並行)通訊庫,提供高吞吐量和低延遲的 all-to-all GPU 核心;
第三天:DeepGEMM,僅 300 行程式碼的通用矩陣乘法庫;
第四天:連開三源,創新的雙向流水線並行演算法 DualPipe、用於 MoE 的負載均衡演算法 EPLB,以及訓練和推理框架的效能分析資料;
第五天:3FS 和 Smallpond,高效的分散式檔案系統和以之為基礎的資料處理框架壓榨固態硬碟效能。
另外,2 月 26 日,DeepSeek 宣佈即日起在北京時間每日 00:30 至 08:30 的夜間空閒時段,大幅下調 API 呼叫價格,其中 DeepSeek-V3 降至原價的 50%,DeepSeek-R1 更是低至 25%,降幅最高達 75%。該公司稱,這一舉措旨在鼓勵使用者充分利用夜間時段,享受更經濟、更流暢的服務體驗。
當地時間 2 月 27 日,OpenAI 推出 GPT-4.5 研究預覽版,“這是迄今為止我們最大、最優秀的對話模型”。早期測試顯示,與 GPT-4.5 的互動更加自然;其更廣泛的知識儲備、更強的使用者意圖理解能力以及更高的“情商”,使其在最佳化寫作、程式設計和解決實際問題等任務中表現優異。OpenAI 預期該模型的“幻覺”現象也會顯著減少,並表示以研究預覽形式釋出 GPT-4.5,旨在更全面評估其優勢與侷限。OpenAI 現面向所有付費使用層級的開發者,在 Chat Completions API、Assistants API 和 Batch API 中提供 GPT-4.5 預覽版。
此外,2 月 26 日 OpenAI 宣佈將向所有 ChatGPT Plus、Team、Edu 和 Enterprise 使用者推出 Deep Research 功能。根據 OpenAI 公告,這些使用者每月將獲得 10 次 Deep Research 查詢,而 Pro 級使用者每月將獲得 120 次查詢。並且,向免費使用者推出 GPT4o mini 驅動的高階語音模式,免費使用者也可以每天使用 ChatGPT 高階語音模式。自然的對話節奏和語調與 GPT-4o 版本相似,同時服務成本更低。
2 月 27 日訊息,字節跳動技術團隊宣佈:國內首個 AI IDE“字節跳動 Trae AI IDE”將於下週登陸中國內地市場。這款 IDE 可深度理解中文開發場景,支援智慧 AI 協作。Trae 支援 AI 問答、程式碼自動補全、基於 Agent 的 AI 程式設計等功能,可以幫助程式設計師自動化完成開發任務,並在一些專案中可以實現端到端開發,使用者提問後能夠直接生成完整的程式碼專案。
2 月 25 日凌晨 2 點,著名大模型平臺 Anthropic 釋出了首個雙思維模型——Claude 3.7 Sonnet。該公司表示,這是其有史以來“最智慧”的 AI 模型。Claude 3.7 提供了標準和擴充套件兩種思考模式:標準思考是無需進行復雜的推理過程,就能立刻提供答案,例如,當用戶詢問“巴黎的埃菲爾鐵塔有多高?”,會迅速給出 324 米。
根據 SWE Bench 測試資料顯示,Claude 3.7 在程式碼能力方面大幅度超過了 DeepSeek-R1、OpenAI 的 o1、o3 模型,MMMLU、Math500 等同樣表現出色。Anthropic 稱,Claude 3.7 Sonnet 是市面上唯一的此類“混合”模型,並將立即投入使用。
分析認為,這一舉措或許能為 Anthropic 在與對手 OpenAI 以及那些投入巨資開發 AI 模型的大型科技公司的競爭中贏得急需的優勢。此外,Anthropic 正在洽談籌集 35 億美元的融資,這一數字遠高於此前預期。據知情人士透露,此輪融資將使這家人工智慧初創公司的估值大致增至 615 億美元。
2 月 27 日,騰訊混元自研的快思考模型 Turbo S 正式釋出。據瞭解,混元 Turbo S 能夠實現“秒回”,吐字速度提升一倍,首字時延降低 44%,同時在知識、數理、創作等方面也有突出表現。透過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。該模型已在騰訊元寶上線,使用者可以選擇 Deepseek R1 或騰訊混元 T1 模型進行回答。騰訊混元表示,正式版的騰訊混元 T1 模型 API 也將很快上線,對外提供接入服務。
當地時間 2 月 25 日,微軟在官網開源多模態 AI Agent 基礎模型 Magma。據介紹,與傳統 Agent 相比,Magma 具備跨數字、物理世界的多模態能力,能自動處理影像、影片、文字等不同型別資料,此外,Magma 還能內建了心理預測功能,增強了對未來影片幀中時空動態的理解能力,能夠準確推測影片中人物或物體的意圖和未來行為。
2 月 25 日,阿里 Qwen 團隊宣佈在 Qwen Chat 釋出了推理模型——深度思考 (QwQ) 。據瞭解,深度思考 (QwQ) 由 QwQ-Max-Preview 支援,這是一個基於 Qwen2.5-Max 的推理模型,擅長數學理解、程式設計、AI 智慧體等。QwQ 可同時支援深度思考和聯網搜尋,並會展示完整的思維鏈。Qwen 團隊稱,QWQ-MAX 官方版本即將釋出,同步會發布 Android 和 iOS 應用程式, 還會發布更小的可在本地裝置部署的模型,如 QWQ-32B 等。
2 月 25 日訊息,阿里雲宣佈旗下視覺生成基座模型萬相 2.1(Wan)開源,此次開源採用最寬鬆的 Apache2.0 協議,14B 和 1.3B 兩個引數規格的全部推理程式碼和權重全部開源,同時支援文生影片和圖生影片任務,全球開發者可在 Github、HuggingFace 和魔搭社群下載體驗。
據介紹,14B 萬相模型在指令遵循、複雜運動生成、物理建模、文字影片生成等方面表現突出,在權威評測集 VBench 中,萬相 2.1 以總分 86.22% 的成績超越 Sora、Luma、Pika 等國內外模型,穩居榜首位置。1.3B 版本測試結果不僅超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯示卡執行,僅需 8.2GB 視訊記憶體就可以生成高質量影片,適用於二次模型開發和學術研究。
-
2 月 26 日,亞馬遜宣佈使用生成式 AI 重建 Alexa 語音助手,命名為 Alexa+。Alexa+ 服務將收費 19.99 美元 / 月,亞馬遜 Prime 會員可免費使用。人工智慧初創公司 Anthropic 的 Claude 模型將為 Alexa+ 提供支援。
-
2 月 28 日,阿里國際宣佈旗下面向全球 B2B 買家的首個 AI 搜尋引擎 Accio 接入 DeepSeek 等最先進的推理模型,正式上線深度研究、商業探索等功能。而此前,阿里國際站為中國外貿商家推出的 AI 工具“生意助手”也已全面接入推理模型。阿里國際站已經用最先進的 AI 推理模型幫商家做外貿了。
-
2 月 28 日,榮耀與阿里在 AI 領域展開合作 。榮耀表示,已與阿里在 AI 領域展開合作,為全球使用者提供服務。目前千問(Qwen)、萬相(Wan)等多款語言、視覺理解、影像生成模型已接入榮耀 YOYO 智慧體,使用者可透過 Magic7 系列手機等終端體驗 AI 功能。
-
2 月 26 日,繼嵐圖知音成為行業首個融合 DeepSeek 能力的車型後,近日,嵐圖稱其自研 AI 語音對話系統將於上半年上車,車控響應速度小於 1 秒,喚醒識別率超 98%。下半年,嵐圖旗下車型還將整體迎來大規模 OTA 更新,新版本將進一步強化車機 AI 功能。
-
2 月 25 日,聯想正式宣佈旗下大模型訓推一體 AI 算力平臺聯想問天 WA7780 G3、大模型推理 AI 算力平臺聯想問天 WA7785a G3 全新升級,單機即可部署 DeepSeek-R1 滿血版大模型(具備 671B 引數)。
-
2 月 24 日,蘋果的 Apple Intelligence 已可以將 Siri 請求直接傳送至 chatGPT。據悉,iOS 18.4 測試版的後端更新裡,蘋果在 Apple intelligence 中為第三方模型提供了“Google”和“OpenaI”選項。這可能意味著在未來的 iOS 更新中,這種大模型整合將正式上線。
在 AI 大模型重塑軟體開發的時代,我們如何把握變革?如何突破技術邊界?4 月 10-12 日,QCon 全球軟體開發大會· 北京站 邀你共赴 3 天沉浸式學習,跳出「技術繭房」,探索前沿科技的無限可能。
本次大會將匯聚頂尖技術專家、創新實踐者,共同探討多行業 AI 落地應用,分享一手實踐經驗,深度參與 DeepSeek 主題圓桌,洞見未來趨勢。

今日薦文
