ChatGPT的記憶能力大幅提升;Meta回應Llama4質量爭議;中美頂級模型效能差距縮至0.3%|AIGC周觀察第八十六期

整理|吳瑩 曹冰穎(實習)

讓我們一起來回顧一下吧。
ChatGPT的記憶能力大幅提升;Meta回應Llama 4大模型質量爭議;中美頂級模型效能差距縮至0.3%谷歌推出A2A智慧體互動協議;亞馬遜推出比GPT-4o便宜80%的AI語音模型;歐盟擬簡化人工智慧相關法規;英偉達被曝已收購賈揚清創立的Lepton AI“本源悟空”執行十億級AI微調大模型……
讓我們一起來回顧一下吧。
點選收聽本期AIGC周觀察
4月11日,OpenAI執行長Sam Altman發文稱:“我們大幅提升了ChatGPT的記憶能力——它現在可以呼叫你之前所有的對話內容了!”該功能於當日面向專業版使用者推出,不久後也會向升級版使用者開放。
同日凌晨,OpenAI還開源了專門用於智慧體瀏覽器功能的測試基準——BrowseComp。這個測試基準非常有難度,GPT-4o、GPT-4.5準確率分別只有0.6%和0.9%。但OpenAI最新發布的Agent模型DeepResearch準確率高達51.5%,在自主搜尋、資訊整合、準確性校準方面非常優秀。
當地時間4月5日,美國科技巨頭Meta推出了其最強大的開源人工智慧模型Llama 4。目前有兩個版本,名為Scout和Maverick。Llama 4是一個多模態大模型,能夠處理和整合各種型別的資料,包括文字、影片、影像和音訊,並且可以在這些格式之間轉換內容。但據網友們實測反饋,幾乎是一邊倒的負面評價,並且有不少人質疑其真實效能。
4月8日凌晨,Meta AI部門副總裁Ahmad Al-Dahle發文,回應了關於Llama 4大模型的爭議問題,對於“不同服務中模型質量參差不齊”這一問題,由於模型一準備好就釋出了,應用實現需要時間來進行最佳化調整,團隊後續會繼續進行漏洞修復工作;對於Llama 4“開卷作弊”(在測試集上進行訓練),Ahmad表示這純屬無稽之談,質量差異是由於需要對應用實現進行穩定化處理造成的。
近日,著名AI科學家李飛飛領銜的斯坦福大學人工智慧研究所釋出了最新一期《2025年人工智慧指數報告》。報告指出,中美頂級AI大模型效能已經由2023年的17.5%大幅縮至0.3%,接近抹平。
報告顯示,2024年重要大模型(Notable Models)中,美國入選40個,中國15個。其中,谷歌、OpenAI入選7個並列第一,阿里入選6個,按照模型貢獻度位列全球第三。在業內頂級專家評選出的32項“2024年AI領域重要釋出”中,中國的阿里Qwen2、Qwen2.5及DeepSeek-V3三大發布上榜。
4月9日,谷歌宣佈推出Agent2Agent(A2A)智慧體互動協議,該協議允許生態系統中的AI智慧體進行底層技術無關的相互操作。多個智慧體的協作將帶來更高的自主性,同時成倍提高生產力、降低長期成本。A2A是一種開放協議,是對Anthropic提出的MCP模型上下文協議的補充。
此外,谷歌母公司Alphabet週三(4月9日)重申,今年將斥資約750億美元建設資料中心容量,加倍押注生成式人工智慧。Alphabet執行長桑達爾·皮查伊在谷歌雲計算部門的年會上表示,這筆投資將用於改善其核心產品所需的晶片和伺服器,同時支援Gemini模型等人工智慧服務的開發。
4月9日,亞馬遜正式推出新一代生成式AI語音模型Nova Sonic,標誌著其在人工智慧語音領域取得重大突破。亞馬遜特別強調,該模型在成本效益方面具有顯著優勢,其價格比OpenAI的GPT-4o便宜約80%,堪稱目前市場上最具價效比的AI語音解決方案。
4月9日,歐盟委員會發布“人工智慧大陸行動計劃”,旨在全面提升歐盟在人工智慧領域的競爭力。該計劃聚焦簡化人工智慧相關法規,大力建設“人工智慧工廠”網路,推動大規模人工智慧資料與計算基礎設施建設,增加獲取大量高質量資料的渠道,開發演算法並促進歐盟戰略部門採用人工智慧,以及加強人工智慧技能等。
據歐盟相關公報介紹,在基礎設施建設方面,歐盟目前正在歐洲多地部署13座“人工智慧工廠”。未來,歐盟還將推動建立“人工智慧超級工廠”,這些大型設施將配備約10萬枚先進人工智慧晶片。
4月8日,外國科技媒體The Information報道稱,英偉達已完成對阿里前副總裁賈揚清所創企業Lepton AI的收購,交易價值達數億美元。目前,Lepton大約有20名員工,賈揚清及Lepton另一聯合創始人白俊傑均已加入英偉達。
Lepton成立於2023年,是賈揚清在離開阿里之後創辦的AI Infra公司,主要業務是出租英偉達GPU伺服器,開發軟體幫助創企在雲中構建和管理自己的應用。該公司於2023年5月完成了1100萬美元(人民幣7900萬元)天使輪融資。
英偉達此次收購,可能與其雲與軟體業務的發展有關。分析機構SemiAnalysis指出,透過收購Lepton,英偉達不僅獲得了額外的收入來源,還可能擠壓其他雲服務提供商的生存空間。就此次收購,英偉達發言人拒絕置評,賈揚清也沒有回覆媒體尋求置評的電子郵件。
近日,本源量子、合肥綜合性國家科學中心人工智慧研究院等機構聯合攻關,在第三代自主超導量子計算機“本源悟空”真機上,實現了全球首次執行十億引數AI大模型微調任務。
微調是指在通用大模型的基礎上,透過進一步訓練特定領域資料,使其適應醫療診斷、金融風控等專業場景。這一成果不僅驗證了量子計算助力實現大模型輕量化的可行性,更為破解大模型“算力焦慮”開闢了新路徑。據介紹,“本源悟空”是目前我國先進的可程式設計、已交付超導量子計算機,已為全球139個國家超2300萬人次提供量子算力雲服務,完成35萬個量子運算任務。
。END 。
值班編輯:郭立琦審校:姜辰雨  製作:王儀琪
關注“中國企業家”影片號
看更多大佬觀點和幕後故事
[ 推薦閱讀 ]


相關文章