新智元報道
新智元報道
編輯:編輯部 HYZ
【新智元導讀】5天釋出5項領先,從此,人人都有了口袋裡的健康專家——好伴AI。
在醫療領域,我們很多人的痛點就在於,80%的優質醫生都集中在一線城市。與此同時,最近中美網友小紅書對賬的事,再一次揭露了國外醫療程式的繁瑣和不夠人性。
而好伴AI的使命,就是讓每個人無論身在何處,都能擁有口袋裡的健康專家!對使用者,它的口袋裡的健康諮詢專家;對醫生,它是專業知識和經驗的應用和傳播者。
接下來,就讓我們詳細領略一下智診科技的五天釋出會內容,感受一下這款AI將如何變革我們的智慧健康醫學新時代。
簡短目錄如下——
-
Day 1:無限記憶 -
Day 2:全科醫療基座&深度推理 -
Day 3:分身有術 -
Day 4:精準解讀 -
Day 5:好伴AI,觸手可及
Day 1:讓AI擁有無限記憶,事無鉅細地瞭解我們、懂得我們、關心我們
第一天,智診科技透過WiseDiag-Z1讓AI擁有了無限記憶,具體來說,是一種即插即用的記憶力機制。
從腦科學的角度來說,記憶始於神經元之間的訊號傳遞。不過,人類的碳基記憶不是完美的,許多記憶會模糊、消失。而研究者希望,能賦予AI一個全新的記憶系統,克服碳基記憶的弊端。
智診AI系統最基礎的特性,就是支援多國語言,尤其支援中文。並且這個系統模擬了人類記憶的特性,能夠自動提取、儲存三種不同的記憶資訊。
具體來說,包括完整對話內容、以天為單位的記憶總結,和事件級記憶。這樣,在醫療問診的多輪長對話中,它就能方便使用者獲取所需資訊。
同時,為了讓大模型不搞錯模糊代指的記憶,研究者專門開發了基於端到端的多輪多路上下文查詢能力,從而幫助AI理解複雜的多輪對話。

另外,研究者還開發了一個AI的模糊記憶查詢功能,這就可以透過模糊的內容聯想(時間或地點)來查詢記憶。
比如在下面這個demo中,研究者問:前天和你說的關於買咖啡的事,你還記得不?但其實這件事是昨天聊的,不要緊,系統依然查出來了所需資訊。

或者,我們可以讓AI幫忙回憶一下,我有個夢裡有森林和美麗的顏色,那是什麼樣的夢?可以看到,即使使用者記不清細節,好伴AI依然可以根據模糊表述查到準確記憶。

想象一下,為了在醫院看病時,AI醫生分身能事無鉅細地瞭解我們的生活習慣、醫療記錄,像老朋友一樣懂我們,關心我們的身體,這也太令人期待了!
Day 2:全科醫療基座 & 深度推理,懂醫還會聊
第二天,全學科醫學基座大模型WiseDiag首次亮相,與此同時,醫學版o1推理模型也來了。
作為醫學基座大模型,WiseDiag採用了最新一代大模型架構,共有730億引數,具備了強大醫學知識處理能力。
它在超3萬億token的專業級優質醫學資料中完成了訓練。
其中包括,大量權威醫學教材、最新臨床指南,以及海量高水平醫學研究論文。
預訓練之後,WiseDiag還用到了SFT監督微調、PPO直接偏好最佳化的訓練方法,以及受邀的臨床專家深度參與訓練過程。
透過精心設計的訓練,新模型不僅掌握了豐富的醫學知識,更具備了類醫生的臨床思維能力,能夠為醫療決策提供專業、可靠的智慧支援。
在專業能力方面,WiseDiag在中文醫學大模型權威基準CMB和Medbench中,分別拿下了98.39和92.9的成績。
尤其是,在CMB上,分數幾乎接近滿分,愈加證明其對醫學知識掌握到位。
在通用能力方面,WiseDiag也在中文基礎模型評估C-Eval和極具挑戰性的大規模多工理解評測MMLU-Pro中,取得了媲美國內外頂尖模型的表現。

WiseDiag在通用和專業基準上優異表現,恰恰印證了智診的初衷——打造一個既懂醫,又會和人溝通的AI助手。
當然,考試測試是一方面,更重要的是它能夠在實際應用場景中,真正幫助到醫生和患者。
深度思考版本Z1
醫學領域,也有其o1版推理模型。
基於WiseDiag,團隊打造的深度思考版本——Z1在這次釋出會中,首次亮相。
對於一位經驗豐富的醫生來說,在遇到疑難病例時,他會不斷深入分析,反覆推敲論證,並根據新的發現及時調整思路。
這個過程,如果是被AI實現了呢?
透過採用多層次推理擴充套件機制,Z1能夠像專家醫生一樣,進行深入細緻的分析思考和反覆權衡,直至找到最優解。
這一突破,讓WiseDiag不再停留在簡單的「查詢規則配方」層面,而是真正具備了專業的臨床思維能力。
在實際應用中,Z1已展現出了令人矚目的深度思考能力。
接下來不如看個栗子,開啟好伴AI,我們將疑難雜症的一個病例發給它,讓AI幫我們做出診斷。

在經過深思熟慮之後,好伴AI基於所給的資訊,準確指出了這個病症——龐貝病。
要知道,這是一個全球罕見的遺傳代謝病,全球發病率1/30萬。不僅如此,它還是症狀「偽裝者」,若能早期識別對治療影響極大。
但對於醫生而言,得出診斷都是一種挑戰。
如果AI能對類似罕見病早期預見,將會帶來極大的醫療價值。
可以看到,好伴AI不僅給出了最終的診斷,還給出了完整鑑別診斷思路。這種診斷模式與臨床醫生的思維高度吻合,能夠真正助力醫生的日常診療工作。

當然了,AI提供的只是一個高敏預警,承擔的角色是輔助診斷/決策,並不能取代真正的醫生。
若真懷疑是罕見病,患者應儘早面診專業醫師,需要結合病史、體格檢查、影像學結果、多項實驗室檢查來做綜合判斷。
不論Wisediag,還是Wisediag-Z1,它們都是全學科醫學大模型。
有了這樣一個強大的基座大模型,我們就能打造出一個專屬的專業級健康專家助手。
Day 3:AI醫學專家分身有術,7×24為你診療
第三天,研究者還帶來了醫學領域的AI智慧體——醫學專家分身系統。
醫少患多,這種不平衡的醫療資源,造成了各大醫院專家每天被上百位患者「圍追堵截」的現狀。
特別是,知名專家的號幾乎「一票難求」。
這時,如果每個醫生能夠有一個「分身」,可以7×24小時對全國患者做出回應,對醫生和患者來說都是福音。
這不僅讓更多人能享受到優質醫療資源,還能大大節省就醫成本和時間,讓看病變得更加便捷高效,讓高水平健康醫療資源實現普惠。
對於準媽媽來說,最常見的一個問題是——剖宮產和順產側切,哪種方式對身體傷害更大?
王權利是浙二醫院產科權威專家,在好伴AI中,就有一個AI版的王權利主任。
接下來,就把這個問題交給這位AI專家,在經過60多秒思考,參閱12篇權威資料後,它給出了非常詳實的解讀。
它的回覆專業性強且富有人文關懷,既講清了順產和剖宮產的醫學利弊,又很好地安撫了準媽媽的心理需求。
而且, 為了說明問題,AI還援引了WHO的權威資料,並給出溫馨提示。

王權利專家現場點評道,「它用『內傷』和『外傷』這個比喻很形象地解釋了剖宮產和順產的區別。其中,『出血1000ml的定義』這個細節和我在抖音影片中的描述一致,體現了較強的專業性和實用性」。
他還表示,「這個AI分身已經達到自己80%的功力,未來經過改善,可能會達到90%以上」。

專家AI分身能夠實現,背後的門道是什麼?
那便是,醫學編碼模型Med-Embedding+醫學知識庫+網路搜尋。
在如此專業的領域中,AI能準確理解各種複雜的醫學術語,前提是其向量化,Med-Embedding的效用便是在此。
每一個醫學文字都可以轉化成一個「向量」,就像擁有一個獨特的地理座標。
舉個栗子,患者提出一個問題,「醫生,我最近皮膚髮黃,尿色變深,還總是肚子疼,感覺特別沒精神,這是怎麼回事」?
Med-Embedding可以精準將這段描述,轉化為一個1794維的「醫學座標」。
普通的編碼模型很難區分「發燒38度三天」和「反覆低熱」的區別,因其座標分佈比較近。但對於醫生來說,資訊側重點是完全不同的。
Med-Embedding卻能夠捕捉到醫學臨床意義的細微差別,從而精準把這兩個資訊座標隔開,從而區分出它們的醫學關係。
在MedicalQARetrieval等多個醫學召回測評集中,Med-Embedding也拿下了不錯的成績。

王權利主任的AI分身是在WiseDiag基礎上,透過醫學編碼模型,學習了其發表的40+篇論文,以及影片平臺上近400個影片後打造的。
就比如,他的個人習慣用語、打比方,甚至是一些碎碎念,AI分身可是學的有模有樣。
它學會了王權利在每日查房時必問的那句——「昨晚睡夠8小時了嗎」?
此外,AI能有理有據,全憑智診擁有自主可控的醫學網路搜尋、醫學全科知識庫和專家個性化知識庫。
其中,醫學全科知識庫包含40多萬條持續更新的醫學知識;專家個性化知識庫則收錄了每位專家獨特的臨床經驗和專業見解。
未來,這些知識還會持續更新和維護,以確保資訊時效性和準確性。

為了確保可靠性和透明度,在AI回答中列出了詳細參考連結,確保資訊可溯源
最值得一提的是,智診還將專家經驗做成了「數字外掛」,融合了頂尖專家的經驗和診療思路。
正如演示中所示,專家分身不僅保留了好伴AI的優勢,甚至能模擬專家特有的臨床思維模式,提供更精準的建議。
從此刻起,任何一個人開啟好伴APP,找到「產科王利權」專家分身,即可獲得——
3秒生成個性化產檢計劃、1分鐘解讀唐篩報告、24小時線上的「孕期守護者」。
如今,國家正在對「分級診療」「網際網路+醫療」大力扶持,最佳化醫療資源配置,解決群眾「看病難、看病貴」的問題。
在這樣的背景下,口袋醫生的出現就十分應景了。它緩解了基層醫療機構的壓力,提高了公眾的自我健康管理,還能輔助醫療專業人員。
可以說,它的出現與政策的方向是完全一致的。
Day 4+5:好伴AI精準解讀醫學報告,像醫生一樣給出診斷
第四天和第五天,研究者將上述技術凝練成了觸手可及的產品——「好伴AI」。

第一款專注於全人類健康生活、醫療諮詢的智慧助手軟體,誕生
上面說到,很多時候專家號一票難求,但有了好伴AI這個醫學專業領域的聊天機器人,我們的這些難題就可以迎刃而解一大部分!
這是因為,它能夠讀懂複雜的醫學報告,能夠像醫生一樣給出詳細的分析、診療和判斷。
在首頁,我們可以使用檢測單解讀、體檢報告解讀、全科醫學諮詢、專家分身諮詢等核心功能。
或者,直接輸入語音或文字,跟AI健康管家「好小伴」發起對話。

相信很多人都有這樣的經歷:在醫院拿到檢測報告單後一籌莫展,看不懂複雜的醫學用語,也不理解異常的數值或結果。
這時,我們就可以使用好伴AI的檢測單解讀功能。

將血氣報告拍照上傳好伴AI後,它便開始了詳盡的分析,並給出了輔助診斷結果和依據:高度懷疑是DKA,即糖尿病酮症酸中毒,建議患者去做尿酮體檢測和尿常規,需要立即就醫。
可以看到,整個分析過程邏輯縝密,並且明確對患者強調了緊急性。

這個真實病例的就診檔案中還有兩份檢查單,正是尿常規和糖尿病酮症的指標;可以證明AI醫生推薦的檢查專案的正確性
另外,我們還可以上傳自己的體檢報告,它會給我們一份專家級的解讀報告。整個體檢報告智慧諮詢功能,非常準確、科學、個性化。
在填寫完一份調查問卷之後,好伴AI就會進行綜合分析,並給出一份「健康諮詢報告」。

首先,是結合了使用者生活習慣和同年齡段人群資料的健康得分,可以反映使用者當前的身體狀況。
然後,它還給出了一份詳細的健康狀況綜述,指出體檢報告上的異常,給出分析和應對方式。


而報告最核心、最詳細的部分,就是健康風險解讀。包括對異常指標可能原因的分析、對健康的影響、此次檢測的侷限性、後續處理建議和異常項的精準認知。
值得一提的是,這些都是由WiseDiag模型結合醫學知識庫和網路搜尋得出的。

智診AI的研究者表示,這是自己在國內外見過的最詳細、最看得懂的體檢報告解讀了。
而下面這個專家分身功能,是研究者基於智診醫療大模型,融合多位三甲醫院專家的診療經驗和知識打造出來的。可以說,每一位醫生分身,背後都有真實的知名專家。
比如,我們試試這個問題:孩子忽然發燒39度兩天了,身上有紅疹,可能是什麼病?

可以看得到,國內外常見的通用AI,一般只會建議退燒藥,但好伴AI會提示——「警惕川崎病,建議立即就醫並檢查C反應蛋白」。
這完全就是普通家長很難想到的專家級建議!

上下滑動檢視
因為川崎病是小兒發熱合併皮疹、黏膜變化的一種疾病,有「發熱、結膜充血、口唇/舌頭紅、四肢末端改變」等典型臨床表現,需要儘早診治,AI醫生的這個診斷,就顯得非常及時了。
AI醫生做出警示後,家長可以儘快就診,排除其他發熱病因,而不要過度慌亂,或者僅依賴網路諮詢。
再比如下面這個真實案例:患有癲癇的孕婦,未補充葉酸,正在服用拉莫三嗪,胎兒能要嗎?
產科主任AI分身直接上重點:孩子能要!它還乾脆利落給出行動清單——產檢、補葉酸、停中藥。
同時,它還用「一起努力」給患者穩定情緒,讓醫囑變成了貼心的叮囑。

上下滑動檢視
值得注意的是,孕期癲癇用藥需謹慎,拉莫三嗪是比較常見的安全性相對較高的抗癲癇藥,但具體方案仍需產科和神經內科醫生聯合評估。
目前,AI只是提供了常規指導,對於實際患者來講,還需要個體化與產科大夫溝通,及時做血藥濃度監測、胎兒畸形篩查等。
或許會有讀者有疑慮:AI醫生究竟靠不靠譜呢?
為此,智診AI請到了十位醫學專家,對包括WiseDiag在內的四個平臺提供的服務診斷結果打分,可以看到WiseDiag被公認為TOP 1。

對於體檢報告的解讀,十位專家也給出了打分,WiseDiag依然明顯處於領先水平。

曾有報告稱,在國內,80%的優質醫療資源集中在一些主要城市中,而好伴AI的出現,可以讓患者無論身在何處,都能在口袋裡擁有一位健康專家。
同時,每位專家也能同時服務成千上萬名患者。
這,便是醫療普惠的意義。
當然了,AI的作用並非完全取代臨床醫生,而是作為一種極具前景的輔助決策工具。
因此,它必須在合規框架、倫理與安全性驗證下,才能讓更多患者放心受益。
雖然AI可以「看懂檢測報告」「協助做罕見病診斷」,但在實際臨床使用中,醫生通常需要結合病史、體格檢查、影像學結果、多項實驗室檢查來做綜合判斷。
因此,AI系統目前主要的角色是「輔助診斷/輔診決策」,在臨床上應與專業醫師的面診相結合,而並不是完全替代醫生。
智診API開放平臺釋出,開發者也能用
令人激動的是,智診API開放平臺也同時釋出了!
從此,開發者也能參與這場醫療AI革命。

針對不同場景需求,智診打造了3款同系列模型。
WiseDiag-Z1,是標準版的全科醫學通用大語言模型,基於技術底層開發,適用於大多數健康諮詢場景。
在此基礎上,智診還打造了深度推理強化版Z1 Thinking。它能模仿頂尖醫生的思維過程,適合多步驟複雜場景健康諮詢,如針對疑難病症的診斷、多階段治療方案的輔助設計等。
而Z1 Lite,是希望更快更經濟得到答案的使用者的不二之選。它更具價效比,在保持大部分核心效能的情況下,能幫普通使用者低成本獲得服務。
此外,智診還提供了幾個高附加值的特色工具,如智診Med-Embedding(醫學向量化模型),矽基永久記憶資料庫,高效能醫學OCR工具(Med-OCR)等。
為了助力開發者,智診AI為每個新賬號都提供10美元免費額度。
深度思考,重構醫療AI新正規化
過去一年,人們都在講應用落地,而醫療AI是大模型落地最佳場景之一。
連更5天釋出會,從無限記憶、深度推理模型、到專家分身系統、口袋助手,再到API開放,智診開啟了AI重塑醫療的全新旅程。
前段時間,世界經濟論壇公佈的一份報告中,預測了全球有80億AI醫生的願景。
AI已經成為醫療行業變革的主要力量,預計2024-2032年將以43%的速度增長,屆時AI醫療市場規模將達到4910億美元。

另有德勤統計,到2030年,全球醫護人員缺口預計達1000萬,這個數字意味著醫療不公平現狀依舊存在。
在國外,谷歌DeepMind團隊曾專門做出了AI醫療大模型Med-PaLM,拿下92.6%高分水平媲美臨床醫生。
除了谷歌之外,還有IBM醫療大模型Watson、斯坦福基礎模型研究中心的BioMedLM(PubMedGPT)等等。
反觀國內,有專攻醫療領域百川智慧,還有訊飛星火醫療大模型等頭部科技公司,均在這一領域有所深耕。
能夠做出醫療領域的「推理模型」,智診還是國內首次。
與傳統大模型相比,深度思考推理模型能夠模擬醫生的臨床思維過程,從症狀診斷到邏輯推導,這正是醫療決策中的關鍵環節。
另一方面,推理模型另一個重要特點便在於其「可解釋性」。
在醫療決策中,理解診療背後的原因至關重要。
一般來說,AI給出建議的推理過程,需要與臨床醫生的邏輯相匹配。否則,若AI出現幻覺,可能會帶來嚴重的醫療事故。
WiseDiag-Z1能清晰展示診斷的每一步推理過程,這不僅有助於醫生驗證AI的判斷,還能幫助患者更好地理解自己的病情。
不僅如此,智診AI在上線時,已與個多位臨床專家展開合作,並進行了反覆驗證。
同時,它還會不斷自主收集和糾正「錯誤case」,逐步迭代,盡最大程度減少誤診漏診的隱患。
而在醫療資料快速積累的今天,具備推理能力的醫療模型,還具備了持續學習和能力進化的潛力。
透過不斷吸收新的醫學研究成果、臨床經驗,它們可以始終站在在醫學前沿,為醫生患者提供最新、最準確的診療建議。
隨著醫療資源分佈資源不均問題日益突出,推理模型的價值更加凸顯。
它可以作為基層醫療機構的得力助手,幫助提升診療效率和準確性,讓每個人都能享受到高治療醫療服務。
這也是為什麼世界經濟論壇,會提出80億AI醫生的願景。
放眼未來,推理模型必將成為重塑醫療服務的核心力量。下一步,最重要就是讓WiseDiag走向落地。
接下來,智診將會打通產學研相結合的路線,不僅要與醫院、保險機構合作,還要與科研院校共研專案。
另外,好伴AI將面向所有人開放,同時智診API開放平臺將交到每一份同行者手中。
讓醫療資源實現真正的普惠化,才是AI醫療最具價值的意義所在。
可以期待,WiseDiag和好伴AI將贏得大眾和醫療行業人士的認可,智診的技術將點亮全社會。
點選「閱讀原文」可瞭解APP和API的詳細資訊


