OpenEvidence,醫療領域誕生了第一個廣告模式Chatbot

作者:Bryan
編輯:Cage
上一篇研究圖譜中,我們指出醫療領域很可能是 Vertical Agent 最先落地的領域,其中最有代表性的公司之一是 OpenEvidence,一款專為醫生設計的 AI 專業診斷 Copilot。面對醫學知識的爆炸式增長和臨床資訊的嚴重過載,OpenEvidence 致力於用類似垂直領域 Deep Research 的產品形態,幫助醫生提高診斷效率與決策質量。
創始人 Daniel Nadler 是 AI 領域的連續創業者,他在採訪中提到,OpenEvidence 在美國醫生群體中迅速普及,目前已有超過 10 萬名醫生每月使用他們的產品。2025 年 2 月,OpenEvidence 完成了由 Sequoia Capital 獨家投資的 A 輪融資,融資規模 7500 萬美元,投後估值突破 10 億美元。
有別於傳統醫療軟體依賴醫院系統的複雜採購流程,OpenEvidence 採用直接面向用戶的增長策略:直接向醫生個人提供服務,省去了冗長的審批與集採環節。憑藉精準契合日常臨床需求的功能設計,以及醫生間的口碑傳播,產品實現了病毒式增長。其商業模式則透過與製藥企業、醫療器械廠商合作,嵌入精準廣告投放,將 AI Agent 順利切入傳統醫藥代表和學術會議的廣告預算分配中,開啟了全新的變現路徑。
💡 目錄 💡
   01 背景
   02 產品和技術
   03 商業化與競爭
   04 團隊與融資
   05 結語
01.
背景
在當今醫療領域,醫生們正面臨前所未有的挑戰。醫學知識的爆炸式增長讓臨床診斷和資訊處理變得異常複雜:醫學知識每 5 年會有一次更新,文獻以每兩分鐘一篇的速度增加,PubMed 已索引了 3600 萬篇摘要,每年新增 100 萬篇;Google Scholar 包含約 4 億篇文章、引文和專利。在這樣的背景下,醫生在診療過程中需要處理大量臨床資訊,但傳統搜尋工具難以快速找到深藏在文獻中的特定資訊,導致資訊過載問題愈發嚴重。
與此同時,醫療資源分配的不均衡進一步加劇了問題。世界衛生組織(WHO)的報告顯示,低收入國家醫生接觸前沿醫學證據的頻率僅為高收入國家的 1/9 ,形成了顯著的“認知剪刀差”。即便在美國本土,鄉鎮醫院購買臨床決策系統(如 UpToDate)的滲透率也不及教學醫院的 1/7。
此外,隨著老齡化社會的到來,多病共存的複雜病例愈發頻繁。資料顯示,65 歲以上患者平均服用 5 種以上藥物,其藥物互動作用的可能性超過 3 億種組合,而傳統診療指南在此類場景的覆蓋率不足 7%。在如此複雜的診療環境下,醫生僅憑經驗作出決策的難度顯著增加。
具有 world knowledge + long context 優勢的 LLM 能否改善這一困局?實驗顯示通用 AI 大模型在醫療領域的應用仍存在明顯侷限性。紐約科恩兒童醫療中心的研究人員將 100 份兒科病例報告輸入 ChatGPT,結果顯示其錯誤率比經驗豐富的醫生高出 83%;而在 Medscape 的 150 個病例測試中,ChatGPT 的診斷準確性曲線下面積( AUC )僅為 66%。這些資料表明,AI 在處理複雜疾病時的診斷能力仍存在較大不足。這種侷限性直接影響了臨床醫生對通用 AI 的信任度。當 AI 的建議與醫生的臨床推理不一致時,醫生往往傾向於相信自己的判斷忽略 AI 的建議,導致 AI 在實際診療中的潛力未能被充分挖掘。
面對醫學知識爆炸、資源分配不均以及通用 AI 侷限性等多重挑戰,醫療行業需要找到新的解決方案,以提升診療效率和準確性,同時彌合醫療資源分配的鴻溝。OpenEvidence 是這個方向的代表性公司。
02.
產品和技術
OpenEvidence 是一款專注於輔助醫療診斷的 Chatbot 產品,旨在為醫生和醫學生提供高效、精準的臨床支援。其互動介面設計獨具特色,每句回答均標註交叉引用編號,並在文末附上參考文獻清單,確保資訊的可溯源性和驗證性。
它提供“護理指南”與“臨床證據”雙模式回答,分別側重實踐建議與理論資料支援。每個問題答案後還列出可能的 Follow-up 問題,方便使用者進行多輪深入互動。
此外,OpenEvidence 提供全面的臨床診斷與治療支援。症狀分析模組可快速解析模糊症狀,提供潛在病因分析並推薦相關檢查路徑。治療決策支援功能基於最新研究,推薦治療方案並對比藥物療效及耐藥性資料,特別適用於罕見病與複雜交叉病例。系統還內建即時指南訪問功能,支援快速調取臨床指南與標準,如 CHA2DS2-VASc 評分等。
行政與工作流程輔助功能同樣實用。系統可自動生成預先授權信、患者出院指導等醫療文書,並自動附上引用文獻。此外,整合的 50+ 臨床計算器覆蓋疾病評分、藥物劑量計算等高頻場景,簡化複雜計算流程。
醫學知識跟蹤學習功能(TL;DR)則透過每日精選新發表論文,生成視覺化圖表與專科分類總結,幫助使用者快速掌握學科前沿動態。這種結構化的知識更新機制,為醫生和醫學生提供了持續學習的便捷途徑。
OpenEvidence 對話介面
OpenEvidence 產品主要面向以下使用者群體:
• 醫生(核心使用者):包括全科醫生、專科醫生及偏遠地區醫療資源不足的社群醫生,用於查詢罕見病例、最佳化診療方案、提效工作流程等。
• 護士、醫師助理、藥劑師等:用於查詢護理指南、藥物資訊等。
• 醫學生:用於學習最新臨床指南、備考醫學考試(如美國醫師執照考試 USMLE),獲取結構化知識支援。
• 醫學研究人員:用於追蹤學科動態、關注最新論文摘要與視覺化資料,縮短文獻綜述時間。
以醫生為例,一個使用 OpenEvidence 產品的典型用例如下:
根據其產品設計思路可以看出,OpenEvidence 核心價值主張在於幫助醫生快速獲取最新、最相關的醫學證據,並提供直截了當的臨床診斷建議。系統透過整合跨學科醫學資訊,支援複雜臨床決策,尤其在罕見和邊緣病例處理中表現出色。更重要的是,OpenEvidence 旨在實現醫學資訊的民主化,讓所有醫生,而不僅僅是大型醫療機構的從業者,能夠平等獲取高質量醫學資源。
在技術表現上,OpenEvidence 展現出顯著的可靠性。作為首個在美國醫學執照考試(USMLE)中得分超過 90% 的 AI 系統,其在 USMLE 三項考試中的表現均優於 ChatGPT,整體錯誤率比 ChatGPT 低 77%。這種低錯誤率的表現大幅降低了通用 AI 大模型的幻覺問題,顯著提高了醫生對 AI 助手的信任度。透過這些特性,OpenEvidence 正在重新定義醫療 AI 的實用性和可信度標準。
USMLE 是美國醫學生獲得臨床執業資格的唯一準入測試,考試內容分為三個步驟,分別側重於考察基礎醫學、臨床醫學和技能應用的情況。
那麼 OpenEvidence 是如何從技術上實現其價值主張的呢?自 2022 年創立之初,OpenEvidence 便選擇了與眾不同的技術路徑。當時,行業普遍將注意力放在開發更大引數規模的通用 LLM,而 OpenEvidence 團隊卻專注於開發小型專業化模型。這一選擇雖然一定程度上犧牲了模型的泛化能力,卻顯著提升了其在專業醫學醫療領域的精準性和可靠性。
2023 年,OpenEvidence 團隊的研究論文《Do we still need clinical language models》進一步驗證了這一決策的正確性。論文指出,在醫療領域,小型專業化模型的表現優於大型通用模型,並因此榮獲當年機器學習與醫療保健領域會議的最佳論文獎。
創始人 Daniel Nadler 曾引述美國科幻作家 Ted Chiang 的比喻 “大語言模型就是對世界的 JPEG 壓縮”,意指其在追求廣泛適用性時犧牲了細節精度。而 OpenEvidence 則專注於醫學領域的高質量壓縮,確保在這一關鍵領域的資訊準確性和可靠性。這種專注使得 OpenEvidence 能夠在醫療 AI 領域提供更為精準和可信的資訊支援。
03.
商業化與競爭
Chatbot 領域第一個廣告主導的 business model
OpenEvidence 顛覆了傳統醫療軟體的銷售模式,採用了類似於“消費網際網路”的創新 GTM (Go-To-Market)策略,透過直接面向醫生和醫學研究者提供免費產品,並利用這些專業消費者的口碑傳播快速開啟市場。
這一 GTM 策略的本質是一種依靠產品質量和使用者體驗驅動增長(PLG)的模式,避開了傳統醫療 SaaS 依賴醫院系統採購的複雜流程(包括多次會議、AI 委員會稽核、預算審批等,通常一整套審批決策的週期長達為 2-5 年,且審批結果存在不確定性),從而極大降低了醫生的使用門檻,促使產品在醫生群體中快速傳播。
創始人 Daniel Nadler 也指出,免費策略讓 OpenEvidence 繞過了漫長的企業採購流程。例如,美國退伍軍人事務部(VA)作為全國最大的醫療系統之一,採購新技術通常需要三年時間。而 OpenEvidence 透過免費開放給 VA 醫生,已收到大量認可和讚譽來自 VA 醫生的反饋:許多醫生稱 OpenEvidence 的產品其在關鍵時刻幫助他們做出治療決定,大大改善了退伍軍人的護理質量。
事實證明,OpenEvidence 選擇的這一 GTM 策略卓有成效:OpenEvidence 在短短一年內實現了從零使用者到覆蓋美國 10%-25% 執業醫生的爆炸式增長,每月約有 10 萬名醫生使用該產品,MAU 達到 30-40 萬,這驗證了創始人 Nadler “做一個足夠優秀的產品,它就會自己傳播”的理念。與此同時,OpenEvidence 還獲得了《新英格蘭醫學雜誌》(NEJM)的認可,進一步增強了醫生等專業使用者對於 OpenEvidence 的信任程度。
值得一提的是,OpenEvidence 自 2023 年與《新英格蘭醫學雜誌》(NEJM)建立了獨家戰略合作關係。NEJM 編輯部高層主動聯絡 OpenEvidence 尋求合作,希望其常用工具包含 NEJM 內容,同時拒絕了其他 AI 大模型公司的資料合作邀請。合作框架重視 NEJM 品牌純粹性和學術價值。這是由於,以 OpenEvidence 為中心可以形成上下游互惠鏈條:NEJM 等內容提供方獲得曝光,OpenEvidence 平臺透過更強大的模型服務獲得流量,醫生使用者獲得高質量資訊。具體來說,OpenEvidence 為 NEJM 帶來數千萬訪問量,而 NEJM 為 OpenEvidence 提供使用 NEJM 全文進行訓練的獨家許可權,幾乎即時更新知識庫,持續提升 AI 大模型知識水平。
此外,OpenEvidence 於 2023 年 3 月成為梅奧診所平臺加速器成員,進入為期 20 周的孵化計劃,藉助梅奧的臨床資源和技術支援加速創新。梅奧診所向 OpenEvidence 開放臨床指南和部分去標識化臨床資料集,用於 AI 模型的驗證與最佳化,並提供臨床專家指導,確保建議符合循證醫學規範。
OpenEvidence 還進一步完善 2B 拓展使用者渠道。2023 年 8 月,OpenEvidence 與媒體集團 Ziff Davis 達成協議,其技術將整合到 Ziff Davis 旗下健康相關網站,包括面向健康專業人士的 MedPage Today 和麵向普通讀者的 Everyday Health,進一步擴大使用者覆蓋面。
在變現方式上,OpenEvidence 以精準廣告為核心。透過面向製藥企業、醫療器械廠商等醫療相關行業的廣告投放,實現商業化閉環。由於醫生群體的高價值屬性,其日常診療決策與藥品、醫療器械高度相關,吸引了相關廠商的廣告投入。
廣告內容與臨床決策場景緊密結合,例如在醫生檢視免疫療法論文時,自動推薦相關藥企的 PD-1 抑制劑廣告,並標註引用次數;或在醫生輸入糖尿病合併腎病病例後,推薦 SGLT2 抑制劑並附上真實世界研究資料。我們認為,這種基於專業使用者池的精準廣告模式可能比通用大模型的廣告商業化速度更快。
競爭對手:傳統醫學資料庫
從競爭格局上來看,OpenEvidence 真正的競爭對手其實是 UpToDate 臨床醫學資料庫。UpToDate 是全球最大的臨床社群,現已涵蓋 25 個專科的 10,000 多篇臨床專題,所有的專題都由來自全球的著名臨床醫生遵循循證醫學的原則以教科書/教學指南的形式撰寫,並經過嚴格的同行評議,附上最新的參考文獻,以保證內容質量。截至目前,UpToDate 已經擁有 200 萬醫護人員使用,企業版收費 $50-100/使用者/月,總計年收入 ~5,760 萬美元。
相較於 UpToDate,OpenEvidence 的優勢是 AI 驅動的互動能力,它不是靜態的文字頁面,這意味著使用者可以在針對性的提問後獲得答案,省去了繁瑣的查詢過程。
例如,當醫生問出 “貧困患者如何替代利福昔明治療小腸細菌過度生長” 的問題時,OpenEvidence 的深度垂直模型能跳過百萬字的主題摘要,直接從 metadata 中抓取二甲雙胍聯合療法的亞期臨床資料,輸出精確到第四段落第三行的解決方案。而使用 UpToDate 的醫生,則需要檢視相關主題摘要,點選連結閱讀,才能在文章中找到他們尋求的具體答案。
04.
團隊與融資
團隊
OpenEvidence 的創始人 Daniel Nadler 擁有哈佛大學經濟學博士學位,其學術背景涵蓋經濟學與人工智慧交叉領域,這使他能夠深入理解人工智慧的複雜技術問題,並將其應用於實際商業場景。
他是個跨領域的成功連續創業者的創業經歷同樣令人矚目。2013 年,他與 Peter Kruskall 共同創立了 Kensho Technologies,這是一款專注於服務華爾街的 AI 量化交易工具。Kensho 提出了“ Warren 演算法”,透過分析數百萬個市場資料點尋找相關性和套利機會。2018 年,Kensho 以 5.5 億美元的價格被標準普爾收購,成為當時 AI 領域最貴的一筆交易,標誌著 Nadler 在 AI 領域的首次重大成功。
2021 年,Nadler 創立了 Xyla,專注於開發高準確性的 LLM。Xyla 團隊包括十幾名博士及在讀博士員工,並配備了一臺位於內華達州沙漠的超級計算機。同時,新冠大流行使得 Nadler 意識到醫生在獲取最新醫學知識方面的挑戰。因此,他在 Xyla 中孵化了 OpenEvidence,專注於透過 LLM 提升臨床決策準確性。為解決高昂的運算成本問題,Nadler 和團隊採用了“檢索增強生成”(Retrieval Augmented Generation,RAG)技術,將使用者資料與預訓練大模型結合,提供更有針對性、更可靠的輸出,同時避免 AI 回答中的“幻覺”問題。
除了創業者的身份,Nadler 還展現了多方面的才華。2016 年,他的首部詩集《Lacunae: 100 首想象中的古代愛情詩》出版,並被美國全國公共廣播電臺評為年度最佳書籍。此後,他又涉足電影圈,擔任了《布魯克林秘案》和《帕爾默》的製片人。這些經歷展現了他在科技與藝術領域的多元成就。
Daniel Nadler
Nadler 領導組建的團隊秉承學術精英化風格,成員多來自哈佛、MIT 頂尖實驗室,偏向學術研究落地。他信奉“頂尖人才只想和頂尖人才共事”,在採訪中稱:“在 Kensho 的經驗讓我意識到,如果你讓高智商、學習速度極快的人去攻克一個難題,他們的進展會遠超一支普通規模大 100 倍的團隊。”
CTO Zachary Ziegler 是哈佛大學計算機科學專業的博士候選人,師從 NLP 領域的頂級學者 Alexander Rush,擁有紮實的學術背景和專業的機器學習知識。他曾在 IMAX AI 擔任人工智慧負責人,2021 年與 Nadler 一同創立 Xyla,並作為 CTO 主導了 OpenEvidence 的開發,專注解決醫學領域 AI 幻覺問題。
融資
2025 年 2 月,OpenEvidence 完成 Sequoia Capital 獨家投資 7500 萬美金的 A 輪融資,投後估值超過 10 億美元。紅杉合夥人 Pat Grady 領導了這一輪投資,他認為 OpenEvidence 的採用與消費者網際網路產品的傳播方式相似:“沒有多少醫療工具能像消費者應用程式那樣傳播,但這是其中之一”。
05.
結語
OpenEvidence 的核心價值主張,本質上是利用 AI 破解了醫療領域 “資訊爆炸” 與 “索引低效” 的矛盾。更具有指導意義的是它的商業模式:它像消費網際網路平臺一樣直接 “黏” 住醫生 —— 靠超高準確率、超低幻覺的臨床 AI 工具解決剛需,靠口碑傳播實現裂變,再把專業使用者池轉化為藥企、器械商所青睞的高度場景化的精準廣告場。
由此,OpenEvidence 既踩中了醫生對臨床 AI 工具的迫切需求,又切入了傳統醫療健康企業從前分配給傳統醫藥代表和學術會議的廣告預算——想想看,糖尿病醫生檢視併發症用藥時可以彈出新藥資料,腫瘤醫生制定方案時可以看到最新器械研究……比這些 “醫生決策時精準推送治療方案相關產品” 更高 ROI 的廣告場景可能並不多見。
這種 “垂直領域精準變現” 的打法,為專注於 AI 應用的創業企業思考如何在內卷中殺出重圍提供了一條新的思路。隨著醫療、法律、金融等更多領域的 Vertical Agent 落地,或許我們會看到一個比通用 AI Chatbot 內嵌廣告更高效的商業模式正在成型 —— 而 OpenEvidence,顯然已經搶到了專業醫療賽道的先手棋。
 排版:楊樂樂
延伸閱讀

醫療 Agent 最全圖譜:AI 如何填補萬億美金“效率黑洞”

o3 深度解讀:OpenAI 終於發力 tool use,agent 產品危險了嗎?

OpenAI:computer use 處於 GPT-2 階段,模型公司的使命是讓 agent 產品化

程式碼即介面:生成式 UI 帶來設計正規化重構

Deep Research 類產品深度測評:下一個大模型產品躍遷點到來了嗎?

相關文章