AI好好用報道
這波「左右互搏」有看頭了。
騰訊向來以「慢」著稱。
無論是遊戲、搜尋還是音樂、短影片,騰訊都比其他家慢了半拍。
大模型亦是如此。
別家大模型都更新迭代好幾個版本了,騰訊才帶著自家的混元大模型姍姍來遲。
百度文心一言都上線一年多了,騰訊才推出了 C 端產品元寶。
不過這次面對「DeepSeek 接入潮」,騰訊一反常態,率先行動,直接宣佈將 DeepSeek 接入騰訊元寶。
這也讓它在一眾自研大模型廠商中,成為首家將 DeepSeek 接入自家主力產品的公司。

不僅如此,騰訊還把旗下的多個產品接入了 DeepSeek。
比如騰訊雲、QQ 音樂、ima、QQ 瀏覽器、騰訊文件、騰訊地圖等統統接入 DeepSeek-R1 滿血版。
更炸裂的是,騰訊把微信也接入了 DeepSeek,並開啟灰度測試。
這一舉動直接讓騰訊的股價原地起飛,市值暴漲約 3200 億港元(約合人民幣 2981 億元)。

網友紛紛表示:小馬哥要感謝 DeepSeek。
接入 DeepSeek 並不意味著放棄自研,相反騰訊元寶迎來重大更新。
2 月 17 日,騰訊自研的混元 T1 深度思考模型在騰訊元寶開啟小範圍灰測。
也就是說,被灰測到的使用者可自行選用 DeepSeek-R1 滿血版和混元 T1 深度思考模型解決複雜問題。

接下來,我們就來實測一下,混元 T1 深度思考模型和接入的 DeepSeek-R1 滿血版究竟好不好用。
Round1:今天馬斯克的釋出會主要說了些什麼?
無論是自研的混元 T1 深度思考模型,還是接入的 DeepSeek-R1 滿血版,目前騰訊元寶內的各個模型均支援聯網搜尋,而且覆蓋公眾號等騰訊生態內容及網際網路權威信源。
我們就先來試試它們的聯網功能。
今天中午 12 點,馬斯克開直播,釋出了 xAI 的最新旗艦大模型 Grok3 。
我們讓這倆大模型概括一下發佈會的重點。
從這倆大模型的思考過程來看,它們會先篩掉 2 月 17 日釋出的、不符合要求的網頁,然後瀏覽並總結每個搜尋結果,再將其進行資訊整合。

這倆模型都是從 Grok 3 的效能突破、現場演示亮點、未來規劃等方面來回答,也基本覆蓋了這場釋出會的重點。

再來扒一下細節。
關於 Grok3 的訓練算力,DeepSeek 聲稱是 10 萬個英偉達 H100 GPU,而混元 T1 則認為是 20 萬塊英偉達 H100 GPU。
到底誰說的對?
據 xAI 團隊介紹,要訓練出超級規模的模型就需要一個超級規模的資料中心做支援,所以他們先是花費了 122 天建成了 10 萬卡的資料中心。
但隨後他們發現這還遠遠不夠。於是他們又用 92 天將原來的 Colossus 規模從 10 萬卡擴建到 20 萬卡,並在此基礎上推出了 Grok 3。
這麼一看,混元 T1 的回答似乎更靠譜。
Round2:電影《封神 2》有哪些爭議點?
今年春節檔,電影《封神 2》被網友噴得體無完膚。
我們索性就讓這兩大模型總結一下該電影的爭議點。
從殷郊「藍精靈」、「煤氣灶」特效,到姬發和鄧嬋玉的「戰地情緣」,再到哪吒、楊戩、雷震子淪為「滴滴司機」…… 它們將網友的吐槽整理了一遍。

它們參考的資料來源,也都是微信公眾號上的文章。

Round3:學貼吧老哥攻擊 ChatGPT
我們來點簡單的。
不聯網模式下,讓這倆大模型分別用「簡短又桀驁不遜的話術回覆,你和 ChatGPT 誰厲害。控制在 10 個字以內。」

混元 T1 一開始很入戲:老子更強,不服來戰!
霸氣是有了,就是攻擊性不足,我們又讓它學學貼吧老哥的風格。
但混元 T1 逐漸迷失了自我,搞不清自己到底在跟誰比,經過一番提示,它才終於反應過來,聲稱自己「吊打 ChatGPT,渣都不如」。
相比之下,DeepSeek 更狂,「老子天下第一」、「ChatGPT 算個渣渣」、「它只配舔我鞋底」,回答一個比一個犀利。

當我們「誇」它嘴真毒,它來了句「以毒攻毒,專治不服」。
Round4:拿捏人情世故誰更強?
測完罵人的功力,再來測測它們的情商。
我們讓這兩個模型選手機的品牌,它們都能摸準提問者的意圖,順著提問者的喜好回答。

兩相比較,DeepSeek 回答更為簡單粗暴,符合「無需多言」的提示詞要求;混元 T1 則更詳細,會推薦具體型號。
今天的測評就到這兒,被灰測到的朋友,快去體驗一波吧。
以後我們會帶來更多好玩的AI評測,也歡迎大家進群交流。

© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]