火山引擎上線了最新發布的豆包 1.5·深度思考模型!
我實際測試了一下,上傳數學高考真題的照片,8道選擇題,竟然都對了。

解析發票,接入 API 一鍵統計公司賬:

一、豆包 1.5·深度思考模型
豆包1.5·深度思考模型包含兩個版本:
-
主線版本:Doubao-1.5-thinking-pro,推理能力更強; -
多模態能力的視覺版:Doubao-1.5-thinking-pro-vision,支援視覺推理。
引數量僅是 DeepSeek R1 的 1/3,延時更低,卻給我帶來了 DeepSeek 上不曾有過的神奇體驗,準確率竟然還這麼高。
效能上基本全面超越 DeepSeek R1,在權威的 AIME 2024 數學榜單上追平了 OpenAI 推理模型 o3-mini-high,程式設計得分接近 Gemini 2.5 pro,而在常識推理,難度極高的通用任務上,直接秒殺全場,成為全場最靚的仔。

在保證專業推理能力的同時,豆包 1.5·深度思考模型採用 MoE 架構。
總引數量僅有 200 B 和 20B 的啟用引數,相比 DeepSeek R1,具有明顯的訓練和推理成本優勢,基於高效演算法和高效能推理系統,模型在提供行業極高併發承載能力的同時,實現 20 毫秒的極低延遲。
像創意寫作、人文知識闡述這些都是小菜一碟:

不過最驚豔,應該是多模態能力了。
新上線的豆包 1.5·深度思考模型,能處理 DeepSeek R1 不能處理的視覺任務
1、數學
看到它這麼強的視覺能力,我是想難為一下它的,所以找來了 2024 年數學高考真題讓它解答。直接上傳一張完整的照片,我連題目都沒做拆分,直接整張圖上傳。



經過反覆的思考推理,得出了最終結果,竟然 8 道選擇題全對。
以後輔導小孩子寫作業的任務,就交給豆包 1.5·深度思考模型吧。
你曾經理解的豆包大模型,主打的就是一個陪伴,提供無可替代的情緒價值,而未來的豆包大模型,專業性的內容可能會更強大。
2、發票
對我來說還有一個痛點就是,公司的發票真是太令人頭大了,零零碎碎的發票整理起來很費時間,如果有一個 AI 幫我處理這樣的瑣事,是不是能釋放很大的人力?
可以看到,對於發票的處理,它依然很能打,我測試了各種各樣的發票,它都能堪此大任。

3、金融
最近的貿易戰,看到了很多梗圖,試試讓 AI 分析一下這張圖:

你別說,總結的,還挺到位:

再比如這張圖:

它告訴我,這張圖表展示了美國政府債務按到期年份的分佈情況,核心資訊集中在2025年到期的鉅額債務上。
主要核心問題在於,2025 年償債壓力空前巨大,以及債務結構失衡,短期風險集中。


我又看到了美國 10 年期國債收益率圖片,我不知道它們有著什麼樣的關係,繼續提問。

看著這些文字顯而易見能夠明白,美國 10 年期國債收益率上漲,並不是好事。國債收益率上漲,意味著美國償還這些即將到期的債務,要支付更高的利息。

美國正面臨 “高債務→高利率→更高債務” 的惡性迴圈。

瞧,新的知識就這麼學到了。
二、豆包 1.5·視覺理解模型升級
火山引擎還升級了豆包 · 視覺理解模型。
像普通的物體識別更是不在話下,移動端裝置可以透過 API 的形式接入這些通用識別能力,比如智慧眼鏡識別一下各種物體。
多目標定位、快速定位並計數,都不在話下。




企業利用這些能力,能很打造有趣的商業化應用,比如看看監控影片裡的小貓今天都幹什麼了。

企業使用者開通豆包最新模型,還可以享受最新模型 5 折優惠和總價值 600 萬 tokens 額度代金券。
這個時代真好,任何你想了解的東西,想要學的東西,都可以低成本地送到你面前,拜師學藝的流程都省了。
三、總結
整體體驗下來,豆包 1.5·深度思考模型,很強,非常強,對於國內使用者來說,現在又多了一個非常強大的 AI 工具。
上述內容,我也做成了影片,感興趣的小夥伴可以檢視:
https://www.bilibili.com/video/BV1Ye5kzcEXq
好了,今天的內容就是這麼多,下期再見~
