
沒有什麼技術能像大語言模型一般,能在破圈之後如此迅速地接入各行各業。但未等到他們找到合適的商業路徑,行業已圍繞引數、成本、效能等要素開始內卷,深陷算力“堆積”。
今年1月,橫空出世的DeepSeek-R1改寫了過去一年由GPT們主導的遊戲規則。創新的模型架構與訓練最佳化策略之下,DeepSeek向業界證實:有限規模的引數也能創造高效能的通用模型。
除了打破“算力壟斷”,DeepSeek引數高效微調(PEFT)、混合專家架構(MoE)等創新設計還成功降低了大模型的“入場門檻”。
低成本疊加“國產”標籤,國內大量頂級醫院,前沿醫療科技企業迅速展開部署,甚至是醫保局都在高調宣佈接入DeepSeek,將大模型再度推至風口浪尖。
究竟跟風還是新的路徑?動脈網近日與已接入DeepSeek的科技醫療企業們進行了對話,逐一回答“DeepSeek在醫療領域的真實價值”“DeepSeek在醫院的應用方式”及“基於DeepSeek-R1的醫療場景應用開發現狀”三個問題。
01
低成本算力需求下,基層醫療成為新落地可能?
遠在DeepSeek-R1誕生之前,國內已有醫院部署通用模型,主動開啟了生成式AI的探索之旅。
由於臨床相關的資料不能脫離院區,當時的大模型只能透過封裝入院。這裡問題在於:大部分醫院擁有的資源環境基本是面向通用計算的CPU,少有醫院有面向圖形處理和平行計算的GPU資源,很難提供充足算力。
算力的困境緊扣成本。眾多醫院中,佼佼者有能力花大價錢上全套的GPU,將通用模型完整搬入院內,服務全院系統;少部分能對模型進行精簡,使其特定的科室受益。
當絕大部分醫療機構不能自由配置大模型、開發相關臨床應用時,醫療大模型的從業公司也不過好過。缺乏充足的買方,他們很難在大模型方向上進行持續的高額研發投入。
DeepSeek-R1的出現打破了這一現狀。藉助創新架構與開原始碼,它從根本上解決了通用模型的部署、執行產生的成本問題。
福鑫科創CEO吳笛表示:由於DeepSeek-R1採用的是混合專家架構(MoE),每次推理時僅啟用約370億引數(總引數6710億),避免了傳統稠密模型必須全引數啟用的高昂計算成本,理論上能在節省40%以上算力消耗的前提下保持推理的精度。若企業需要擴充套件模型規模,也無需線性增加算力投入即可補全模型能力。

DeepSeek、GPT o1 、GPT o3 mini能力對比
(輸入價格僅統計Cache Hit下標準時段的價格,資料來源:動脈網、深透智醫)
更為重要的是,DeepSeek擁有非常友善的MIT license協議,允許使用者本地化部署,自由使用、複製、修改和分發軟體,也鼓勵了企業在產品中採用和整合,鼓勵合作和創新,從而推動整個生態系統的發展。
這種開放的生態系統使得普通醫療機構能夠根據自身的業務需求,開發出更符合實際應用場景的醫療大模型。若只是部署一些蒸餾得到的100B引數量以內的小模型,不少基層醫療手中的整合顯示卡都能帶動模型順利執行。
"在我們同區域型醫療機構的溝通中發現,他們的訴求其實更加明確,希望能將DeepSeek的推理能力用在基層,因為那裡最缺能夠處理複雜能力的醫生。"
總的來說,DeepSeek-R1的價值在於降低了大模型應用的門檻,開闢了新的落地市場,同時加速了垂直應用的誕生。這個過程中,這一新興模型給予了醫療大模型走向商業化的可能。
02
醫療機構如何用好DeepSeek?
當計劃部署大模型的醫院及從事大模型開發的醫生個體日趨增多,醫療IT產業中處於上游位置的眾多企業也隨之活躍了起來。
據衛寧健康CTO趙大平介紹,DeepSeek-R1出現後,國內的主流部署模式可簡單劃分為三種。首先他們可以快速從雲端、源端下載模型,快速完成部署,主要適用於已有顯示卡裝置的大型醫院。若醫院沒有運算需要的顯示卡,他們可以去雲端租用裝置。同時,也有部分民營醫院選擇訂閱的方式實現部署,主要服務於特定科室。
此外,風口之下亦催生了不少製造大模型一體機的企業。但在趙大平看來,醫院要想實現大模型的有效執行,首先要將其與醫院資訊系統本身進行融合,其次資訊系統本身要儘量使用支援AI執行的智慧架構。
畢竟,大模型一體機雖然能夠透過外掛的方式實現一部分互動能力,但很難與醫院已有的幾十套系統進行充分資料交換。除非能夠實現“模型+應用”的一體式解決方案,否則很難滿足醫院多元的需求。
那麼,理想狀態下醫院應該如何部署大模型?趙大平認為:伴隨大模型的不斷深入,未來醫院的配置方式一定是多元混合的。“醫院可能會配置一個大模型及一些服務細分科室的小模型。大模型用於需要推理、思考、診斷的大型互動場景,小模型用於強調規則、強調判斷、矯正以及簡單生成的場景,在滿足需求的同時實現最經濟最高效的應用。”
"進一步延伸,醫院中存在很多移動化的場景,如果我們能將手機上的小模型建立起來,那麼現有醫療流程中的大量工作可以向移動端轉移,極大提升醫療效率。"
再談醫生及其他試圖主動開發臨床應用的個體。
DeepSeek爆火的同時,各式教程順勢而出,鋪天蓋地,鼓勵使用者獨立配置、訓練模型。但在醫療領域,DeepSeek的出現雖然降低了模型訓練的各項門檻,但本地化訓練私有模型需要經過資料準備與處理、模型選擇與配置、模型訓練、模型評估與調優、模型部署與整合五個步驟,仍需要研究人員具備一定的技術功底。
“現在的很多大模型的應用開發程度不高,很多醫院的研究機構在買了卡配置了模型之後都想立馬搭建一個特定場景的應用,但在實際操作時會發現不具備相應的開發能力。要實現醫生個體的廣泛使用,並以此取得研究成果,我們還需等待服務方對UI進行升級,進一步簡化大模型應用的開發路徑。”
換句話說,企業與醫療機構共同進行垂直模型開發,仍是醫療AI的主旋律。
03
DeepSeek下,醫療場景應用開啟革新?
DeepSeek-R1雖在醫療領域實現了大規模部署,但上線時間較短,在應用場景的開拓方面,它暫未突破大模型已有應用範疇,更加聚焦於部署訓練成本的降低與文字處理效率的提升。最初階段中,著力於網際網路醫療的一批大模型企業最先受益。
譬如,騰訊健康透過騰訊雲接入DeepSeek系列,再結合自研的混元大模型,迅速完成了對智慧導診、預問診、健康問答、影像報告解讀及質控等醫療服務的迭代,並加速幫助全國超過1000家醫院快速升級智慧應用。
目前,騰訊的“深圳醫保”應用其智慧客服已搭載了最新AI大模型。使用者可以自由地選擇擅長推理的DeepSeek,或者可以多維度理解問題的騰訊混元,無論是諮詢"生育津貼怎麼算"這類複雜政策,還是詢問"門診特定病種如何認定"等專業問題,融合後的大模型都能結合具體參保情況,給出精準到位且具備“Think”的解答,在回覆使用者的同時幫助使用者理解問題。
當DeepSeek積累的醫療資料日益增多,它在醫院場景中的應用優勢也開始逐步顯露。得益於在提示詞方面的要求顯著降低與思維鏈技術賦能,DeepSeek有效提升了AI在臨床診斷中的透明度與可解釋性,並能幫助醫生更為高效地與模型溝通。
舉個例子,醫生過去使用大模型生成手術方案,需要完整清晰地寫明過往病史、手術情況等資訊,而使用DeepSeek時只用輸入一些關鍵資訊,模型會在“Think”的過程中自主填補相關資訊。
此外,醫療推理講究循證過程,DeepSeek不僅能夠提供有效的診療建議,更能詳細闡明其背後的推理過程,包括診斷依據、用藥選擇和檢查專案等。這種透明化極大化解了醫生對AI系統的猜忌,為醫患溝通提供了清晰的依據,進而促進了AI技術在臨床中的更廣泛應用。
“很多醫生都非常關注模型‘think’的過程,他們會大致掃一眼Deepseek的邏輯,這是一種重要的互動,能讓醫生產生信任。”
到目前為止,已有不少醫院上線了大模型相關應用。以醫療文書書寫為例,福鑫科創、衛寧健康等企業都開發了類似應用。以福鑫科創為例,該公司與武漢協和醫院、武漢大學中南醫院等醫院落地門診、住院多個場景的AI生成式電子病歷系統,嘗試提高醫生的書寫病歷效率。
傳統的醫生在門診看診場景中,單個患者就診時長按照10分鐘計算,一般用於書寫電子病歷的時間在5分鐘,開藥、開檢查的時間在3分鐘,真正用於問診的時間也平均只有2分鐘。有了AI之後,AI會即時記錄醫患的對話,並將其轉化為醫學術語,按照門診電子病歷模板自動書寫電子病歷,省下電子病歷的書寫時間。
“按照一個醫生每天看診50個病人計算,每天可以至少節省1個多小時的書寫病歷時間,若醫院將節省的時間用於看診更多的患者,那大模型可以為醫院創造實實在在的經濟價值。”因而在吳笛看來,這是目前價值最高,相對容易落地的場景。
由於DeepSeek模型本身沒有投餵過CT、MR相關影像資料,企業開發相關應用時需要自行建立影像資料集並構建模型。因而相較於各類文字工具,醫學影像領域展開基於DeepSeek大模型研究相對較少。
目前,深智透醫在內部工具層面對DeepSeek進行了部分探索。譬如,他們將DeepSeek用於影像資料多模態標準化和增強,利用影像資料+meta data非影像資料(EMR、HIS\RIS、DICOM header等有大量語言資訊)提高成像內容及命名的一致性,最佳化下游應用(例如hanging protocol等更準確一致可以提高醫生效率)。
而在質控資料分析方面,深智透醫則在嘗試藉助大模型提升醫學影像質量控制、異常識別能力、工作流問題互動能力。
需要注意的是,雖然基於DeepSeek進行的影像學研究頗為有限,但行業對於影像大模型已實現大量研究成果。部分企業基於GPT等模型建立起了影像基座模型,並在臨床試驗中證實了LLM對於醫學影像診斷的準確率、效率提升。伴隨DeepSeek能力的進一步增強,這些企業亦有可能慢慢轉至國產通用模型。
再談醫院場景之外的藥物研發,這裡同樣是各類大模型的重要競技場。
目前,深智透醫已在嘗試使用DeepSeek處理醫學影像標準化問題,進而在醫藥研發試驗中更好地解決影像資料質控等問題。據深智透醫CEO宮恩浩透露,該企業已簽約一批國際藥廠,最佳化他們已有研發中的影像試驗資料。
還有一些模型雖然沒用DeepSeek,但也採用了類似的創新技術。
例如,百圖生科的xTrimo系列大模型同樣採用了Moe框架,其V3版本可處理DNA、RNA、蛋白質、細胞、化合物-蛋白互作、蛋白-蛋白互作及生命系統等七大模態資料,可實現從鹼基對到細胞叢集的全尺度建模,進而賦能抗體和細胞基因療法藥物領域、靶點發現方面、微生物等領域的科學研究。
不過也需注意,無論是醫療機構相關的賦能,還是藥物研發的前沿探索,開發者們使用DeepSeek等大模型幾乎都是在原有場景中進行升級,尚未能開發出顛覆已有場景的應用,談不上革新。好在DeepSeek- R1的上線僅有不足兩個月的時間,伴隨時間的推移,我們很有可能目睹來自醫療AI的驚喜。
04
無遠弗屆
雖說DeepSeek-R1的出現極大程度推進了醫療領域對於大模型的應用深度,但理性來講,要在醫院日常之中用上大模型,仍然需要等待不少時日。
首先,解決複雜問題需要大模型像醫生一樣結合患者的各模態資料,進行綜合推斷。但在“Think”過程中,DeepSeek時常會陷入一種可能無限迴圈的情況,導致出現大量無關於問題本身的答案。對醫療這樣嚴肅、高頻的領域,必須消除這些場景幻覺才能有望規模化落地。
其二,DeepSeek擁有的“國產”身份證明使其更受國內醫療機構的青睞,但要規模應用,仍需符合醫學資料隱私與安全合規。因而需要DeepSeek出臺更完善的資料脫敏、加密技術,確保患者資料安全。
其三,DeepSeek解決的是過往大模型欠缺的產品質量和效能問題,未能找到“殺手級應用”推動醫療機構主動付費。就目前來看,AI的付費邏輯還是和使用者認知及產品本身方向是否能真實降本增效創收賦能有關。因此,DeepSeek要想規模落地,一是提升醫院與醫生的接受度,二是要在傳統AI的基礎上進一步提升。至於誰付費這一問題,從AI近十年的發展看,基層醫療比等級醫院更為需要大模型的支援。
第四,DeepSeek的技術突破並非不可複製。如今,GPT的部分版本已將模型訓練成本大幅壓縮,逼近DeepSeek水平,且在邏輯推理能力方面不斷提升。這需要DeepSeek進一步鞏固優勢,在實際臨床問題方面做出成果。
儘管挑戰重重,我們依然能夠從中看到很多積極的東西。畢竟,大量醫療企業與醫療機構的加入必將生成更多的垂直應用,拓寬大模型商業化的可能。
同時,DeepSeek等模型自身的潛力也不容忽視。按照現有大模型的迭代速度,每三個月通用模型都將完成一波全面迭代。或許在2025年之中,我們便能目睹某一大模型脫穎而出,逐一攻克上述問題,與眾多醫療科技企業一同開啟醫療大模型的新圖景。

感謝
福鑫科創CEO吳笛
衛寧健康CTO趙大平
衛寧健康人工智慧實驗室負責人陳旭
深智透醫CEO宮恩浩
騰訊健康使用者平臺總經理吳志剛
騰訊優圖實驗室天衍研究中心負責人吳賢
對於本文的支援

*封面圖片來源:神筆PRO


如果您認同文章中的觀點、資訊,或想進一步討論,請與我們聯絡;也可加入動脈網行業社群,結交更多志同道合的好友。

