ChatGPT的記憶能力大幅提升；Meta回應Llama4質量爭議；中美頂級模型效能差距縮至0.3％｜AIGC周觀察第八十六期

整理｜吳瑩曹冰穎（實習）

讓我們一起來回顧一下吧。‍

ChatGPT的記憶能力大幅提升；Meta回應Llama 4大模型質量爭議；中美頂級模型效能差距縮至0.3%；谷歌推出A2A智慧體互動協議；亞馬遜推出比GPT-4o便宜80%的AI語音模型；歐盟擬簡化人工智慧相關法規；英偉達被曝已收購賈揚清創立的Lepton AI；“本源悟空”執行十億級AI微調大模型……

讓我們一起來回顧一下吧。

‍

點選收聽本期AIGC周觀察

4月11日，OpenAI執行長Sam Altman發文稱：“我們大幅提升了ChatGPT的記憶能力——它現在可以呼叫你之前所有的對話內容了！”該功能於當日面向專業版使用者推出，不久後也會向升級版使用者開放。

同日凌晨，OpenAI還開源了專門用於智慧體瀏覽器功能的測試基準——BrowseComp。這個測試基準非常有難度，GPT-4o、GPT-4.5準確率分別只有0.6%和0.9%。但OpenAI最新發布的Agent模型DeepResearch準確率高達51.5%，在自主搜尋、資訊整合、準確性校準方面非常優秀。

當地時間4月5日，美國科技巨頭Meta推出了其最強大的開源人工智慧模型Llama 4。目前有兩個版本，名為Scout和Maverick。Llama 4是一個多模態大模型，能夠處理和整合各種型別的資料，包括文字、影片、影像和音訊，並且可以在這些格式之間轉換內容。但據網友們實測反饋，幾乎是一邊倒的負面評價，並且有不少人質疑其真實效能。

4月8日凌晨，Meta AI部門副總裁Ahmad Al-Dahle發文，回應了關於Llama 4大模型的爭議問題，對於“不同服務中模型質量參差不齊”這一問題，由於模型一準備好就釋出了，應用實現需要時間來進行最佳化調整，團隊後續會繼續進行漏洞修復工作；對於Llama 4“開卷作弊”（在測試集上進行訓練），Ahmad表示這純屬無稽之談，質量差異是由於需要對應用實現進行穩定化處理造成的。

近日，著名AI科學家李飛飛領銜的斯坦福大學人工智慧研究所釋出了最新一期《2025年人工智慧指數報告》。報告指出，中美頂級AI大模型效能已經由2023年的17.5%大幅縮至0.3%，接近抹平。

報告顯示，2024年重要大模型（Notable Models）中，美國入選40個，中國15個。其中，谷歌、OpenAI入選7個並列第一，阿里入選6個，按照模型貢獻度位列全球第三。在業內頂級專家評選出的32項“2024年AI領域重要釋出”中，中國的阿里Qwen2、Qwen2.5及DeepSeek-V3三大發布上榜。

4月9日，谷歌宣佈推出Agent2Agent（A2A）智慧體互動協議，該協議允許生態系統中的AI智慧體進行底層技術無關的相互操作。多個智慧體的協作將帶來更高的自主性，同時成倍提高生產力、降低長期成本。A2A是一種開放協議，是對Anthropic提出的MCP模型上下文協議的補充。

此外，谷歌母公司Alphabet週三（4月9日）重申，今年將斥資約750億美元建設資料中心容量，加倍押注生成式人工智慧。Alphabet執行長桑達爾·皮查伊在谷歌雲計算部門的年會上表示，這筆投資將用於改善其核心產品所需的晶片和伺服器，同時支援Gemini模型等人工智慧服務的開發。

4月9日，亞馬遜正式推出新一代生成式AI語音模型Nova Sonic，標誌著其在人工智慧語音領域取得重大突破。亞馬遜特別強調，該模型在成本效益方面具有顯著優勢，其價格比OpenAI的GPT-4o便宜約80%，堪稱目前市場上最具價效比的AI語音解決方案。

4月9日，歐盟委員會發布“人工智慧大陸行動計劃”，旨在全面提升歐盟在人工智慧領域的競爭力。該計劃聚焦簡化人工智慧相關法規，大力建設“人工智慧工廠”網路，推動大規模人工智慧資料與計算基礎設施建設，增加獲取大量高質量資料的渠道，開發演算法並促進歐盟戰略部門採用人工智慧，以及加強人工智慧技能等。

據歐盟相關公報介紹，在基礎設施建設方面，歐盟目前正在歐洲多地部署13座“人工智慧工廠”。未來，歐盟還將推動建立“人工智慧超級工廠”，這些大型設施將配備約10萬枚先進人工智慧晶片。

4月8日，外國科技媒體The Information報道稱，英偉達已完成對阿里前副總裁賈揚清所創企業Lepton AI的收購，交易價值達數億美元。目前，Lepton大約有20名員工，賈揚清及Lepton另一聯合創始人白俊傑均已加入英偉達。

Lepton成立於2023年，是賈揚清在離開阿里之後創辦的AI Infra公司，主要業務是出租英偉達GPU伺服器，開發軟體幫助創企在雲中構建和管理自己的應用。該公司於2023年5月完成了1100萬美元（約人民幣7900萬元）天使輪融資。

英偉達此次收購，可能與其雲與軟體業務的發展有關。分析機構SemiAnalysis指出，透過收購Lepton，英偉達不僅獲得了額外的收入來源，還可能擠壓其他雲服務提供商的生存空間。就此次收購，英偉達發言人拒絕置評，賈揚清也沒有回覆媒體尋求置評的電子郵件。

近日，本源量子、合肥綜合性國家科學中心人工智慧研究院等機構聯合攻關，在第三代自主超導量子計算機“本源悟空”真機上，實現了全球首次執行十億引數AI大模型微調任務。

微調是指在通用大模型的基礎上，透過進一步訓練特定領域資料，使其適應醫療診斷、金融風控等專業場景。這一成果不僅驗證了量子計算助力實現大模型輕量化的可行性，更為破解大模型“算力焦慮”開闢了新路徑。據介紹，“本源悟空”是目前我國先進的可程式設計、已交付超導量子計算機，已為全球139個國家超2300萬人次提供量子算力雲服務，完成35萬個量子運算任務。

。END 。

值班編輯：郭立琦審校：姜辰雨製作：王儀琪