歐洲「DeepSeek」釋出了全世界最好的OCR,網友:蹲蹲中國的免費開源版

繼開源首個 MoE 模型後,他們又釋出了千頁只需 7 塊錢的檔案掃描 API。
作者丨鄭佳美
編輯丨馬曉寧
就在剛剛,那個曾經開源了首個 MoE 模型的歐洲初創公司 Mistral AI 在沉寂一段時間之後又出新活。
Mistral 團隊釋出了一個號稱“全世界最好的 OCR”的產品 —— Mistral OCR,旨在將一些 AI 難以直接識別的粗糙且複雜的檔案進行整理,便於 AI 操作識別。
帖子一經發出,評論區瞬間充滿了各種誇誇言論,但在一眾讚美聲中,也不乏一些真正用過產品的網友的理智發言。
就比如有網友對 Mistral OCR 的產品能力表示認同,但卻有點接受不了它的產品定價,覺得有點太貴,並且期待中國 AI 公司早點發佈一個類似的開源版本,把價格打下來。
同時也有網友親自上手,上傳掃描了手寫板的內容,但最後識別出的文字結果正確率並不是很高。
除此之外,還有被 Mistral 所宣傳的“可以識別超多種語言”噱頭吸引過來的網友,但使用後卻失望的發現它無法識別自己所用語言。
儘管 Mistral OCR 目前還存在著一定的侷限性,但它的出現確實是一次從字元識別到場景智慧的跨越。
1
從圖文到結構化資料的一大步
與傳統的 OCR API 不同,Mistral OCR 是一款多模態 API,它不僅可以識別文字中是否嵌入了插圖或照片,還會為這些圖形元素建立邊界框,並將它們包含在輸出中。
從 Mistral AI 團隊放出的 Demo 影片可以看出,Mistral OCR 能夠將圖文混排的 PDF 檔案轉換成結構清晰的 Markdown 格式檔案。
例如表格+數字的 PDF 組合。
PDF 圖片中數學公式的轉換。
PDF 宣傳圖片中的印地語。
拍得並不方正的論文照片。
甚至帶有水印的文字也可以輕鬆識別。
2
從字元識別到場景智慧的一大步
除了直觀的 Demo 外,Mistral AI 團隊還列舉了 6 點 Mistral OCR 的絕對優勢:
  • 卓越的複雜文件解析能力:Mistral OCR 在理解複雜文件結構方面表現出色,能夠精準解析交錯的影像、數學公式、表格以及 LaTeX 等高階排版格式。這使其在處理包含圖表、圖形、公式和插圖的科學論文等富文字文件時更具優勢。
  • 原生支援多語言與多模態:Mistral OCR 自帶多語言和多模態處理能力,能夠靈活應對不同語言以及多種型別的內容,無需額外適配。
  • 行業領先的基準測試表現:在多項行業基準測試中,Mistral OCR 均取得優異成績,充分展示了其強勁的效能和高準確度。
  • 同類產品中處理速度最快:Mistral OCR 採用輕量化架構,處理速度遠超同類產品,單節點每分鐘可解析高達 2000 頁文件。無論在高負載環境還是大規模資料處理中,它都能保持高效執行,確保穩定效能。
  • 創新性的“文件即提示”結構化輸出:Mistral OCR 率先引入“文件即提示”概念,使使用者能夠直接使用文件作為指令,以獲取更加精準和定製化的結果。它還能輸出 JSON 等結構化格式,便於與後續任務或自動化流程銜接,實現更智慧的內容提取。
  • 可選的自託管部署方案:針對資料隱私要求嚴格的企業或機構,Mistral OCR 提供自託管部署選項,確保敏感資訊始終儲存在本地基礎設施內,滿足合規性與安全性需求。
團隊還將 Mistral OCR 將 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的產品效能進行對比。
最終的結果表明,Mistral OCR 在總體準確率、數學公式識別等方面表現優異,特別是在 2503 版本中,各項指標均大幅提升,達到了新的高度。
在多語言處理方面,得出的資料更是遠遠優於 Google Document AI 和 Azure OCR。
3
歐洲也有自己的“DeepSeek”
Mistral AI 是一家位於法國的初創公司,憑藉其 AI 助手 Le Chat 和多個基礎模型,已被官方視為法國最具前途的科技公司之一,並被認為是唯一有潛力與 OpenAI 競爭的歐洲企業。
Mistral AI 的三位創始人都擁有在全球頂級科技公司中積累的豐富 AI 研究經驗。執行長 Arthur Mensch 曾在谷歌 DeepMind 部門工作,首席技術官 Timothée Lacroix 和首席科學家 Guillaume Lample 則曾是 Meta 的核心成員。憑藉著強大的技術背景,Mistral AI 的創始團隊帶領公司迅速發展。
值得一提的是,自 2023 年成立以來,Mistral AI 在籌集資金方面取得了顯著成績,目標是將前沿 AI 技術普及給每個人,雖然這一目標並未直接挑戰 OpenAI,但它強調了公司對於 AI 開放性的堅定支援。
作為 ChatGPT 的替代品,Mistral AI 推出了聊天助手 Le Chat,並在 iOS 和 Android 上成功上線。在釋出後僅兩週,Le Chat 的下載量便突破了 100 萬次,並一度在 iOS App Store 中登頂法國免費下載榜單。
除此之外,截至 2025 年 2 月,Mistral AI 已籌集了約 10 億歐元(約 10.4 億美元)的資金,其中包括幾輪股權融資和部分債務融資。尤其值得注意的是,在 2023 年 6 月公司釋出首批模型之前,Mistral AI 就成功完成了創紀錄的 1.12 億美元種子輪融資,成為歐洲歷史上最大的一輪種子融資,當時公司估值達 2.6 億美元。
參考連結:
https://mistral.ai/fr/news/mistral-ocr
https://x.com/MistralAI/status/1897694143180112096
更多內容,點選下方關注:

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。

//
近期熱門文章

相關文章