前百度AI大牛親述:押注十年,踩坑無數後,簽下200家三甲醫院

“一個人能做什麼事,很大程度取決於他手裡的資源。”
作者丨劉楊楠
編輯丨巴里
圖源丨文心一言
無論是早些年的資訊化,還是今天的大模型,技術改變世界的宏大敘事裡,醫療或許都是最難啃的“硬骨頭”。
資料壁壘高築、場景複雜多變、容錯率趨近於零……但因其內含的巨大商業價值和社會價值,多年來都吸引著無數創業者奔赴其中。
2016年創辦左醫科技的張超,便是其中之一。張超畢業於電子科技大學,曾經擔任百度NLP知識挖掘方向的負責人、知識圖譜專家,也曾任新國大的研究助理。
左醫科技是一家知識圖譜和醫療大模型協同驅動的醫療科技公司,其客戶已經覆蓋全國200多家三甲醫院,其中40%是top100的醫院,包括北京協和醫院、武漢同濟醫院、中國醫大一院、四川省人民醫院、重慶醫科大學附屬兒童醫院等。
創業十年,張超從未離開技術一線,他幾乎能敏銳捕捉到每一次技術轉折的訊號,卻也無法跳出醫療科技變現難的普遍困境。
踩了無數坑之後,張超深知:“一件事能不能做成,時機很重要。”
在“AI醫生”這個最火熱的新趨勢裡,他延續著一名技術創業者對技術路徑的敏銳嗅覺,押注“端到端+場景”深度結合的技術路線。同時,他也用更多精力鑽研商業模式,試圖在傳統的醫療服務模式之外,給公司探索更多商業想象。

押寶“端到端”

2020年,左醫科技第一次嘗試把Transformer用在醫患對話上,開發了一款智慧問診程式,內部稱之為“AI Doctor(AI醫生)”。
張超自己也眼前一亮:“親身體驗後會發現,在Transformer出現之前,所有的人機互動都很‘傻’。”
後來,張超帶團隊嘗試在GPT-2上做微調,發現效果不錯,但成本太高,加之GPT-2引數規模較小,微調很難突破效能天花板。團隊又在國內的一系列模型上嘗試微調,發現效果都不理想。“當時就有些懷疑這條路線了,但現在看來是那時候國內的模型能力確實不行。”張超坦言。
時間到了2022年,在ChatGPT釋出前,OpenAI釋出instructGPT時,左醫的技術團隊已經注意到其效能有很大躍升。“但我們第一反應是不信,因為谷歌之前發了很多酷炫的demo,都沒有真正落地。”張超表示,直到自己真正體驗了ChatGPT,才確信AI能力真的迎來了歷史性轉折。
起初,左醫科技曾嘗試自己訓練模型,但很快發現,公司很難長期支撐規模如此之大的資料和算力投入。
於是,左醫科技及時停止訓練,轉而在開源模型的基礎上訓練醫療領域的垂類模型。經過一系列測評後,左醫在眾多開源模型中選擇了通義千問。
2023年5月,左醫科技釋出了醫療垂類大模型,並應用落地於四川省人民醫院、北京天壇醫院等百強醫院。
DeepSeek出圈後,左醫科技也曾嘗試在DeepSeek上繼續訓練,但團隊權衡之後,還是選擇繼續基於通義千問做訓練。
由於LLaMA、通義千問等稠密模型引領的開源浪潮已經形成了成熟的開源生態,而DeepSeek系列為MoE架構,屬於稀疏模型,其開源生態相對不成熟,原本走稠密模型路線的團隊若想轉換路線,就要面臨更大的工程難題。另外,從實際的場景需求考慮,張超認為,對醫療場景而言,引數規模可能不需要太大。
但隨著通用模型不斷提升,關於“垂直模型是否會被替代”的討論也開始沸沸揚揚。
退一步看,垂直模型之所以會引領一波小高潮,本質是因為通用模型在獲取專有資料方面存在障礙,只要這個問題不解決,垂直模型就會有其特定的價值。“比如DeepSeek在醫療方面幻覺很重,表現比OpenAI o1差很多,是因為OpenAI有專門的醫療團隊。”張超說。
不過,張超坦言,隨著通用模型不斷迭代,未來留給垂直模型的生存空間確實會越來越小,但這並不意味著要直接放棄垂類模型。“飛機比火車跑得快,但火車總能去到一些飛機去不了的地方。未來做垂類模型的人要想一想,哪些事情是通用模型做不到的。”
2024年12月23日,張超在朋友圈釋出了一個左醫GPT-o1版的內測影片,其醫療診斷效果相比指令模型提升15%以上。但DeepSeek-R1釋出後,左醫就放棄就釋出該推理模型。
張超認為,參考Deep Research圍繞核心場景打造端到端的應用會是未來重要的方向。
目前,AI在醫療領域的落地有三種進階形態:提示詞、工作流和端到端。
市面上很多產品都透過“提示詞”或“工作流(Workflow)”來實現健康諮詢的AI產品,但這類解決方案容易在多步驟流程中累積錯誤,降低整體準確率,也很難滿足越來越複雜多樣的醫學場景。
張超表示:“這兩條路線都需要人類參與設計,人的能力會限制智慧應用的能力。而端到端推理能夠讓模型超越人的能力的限制。”
2024年12月,左醫科技開始探索端到端訓練的AI Agent,透過深度強化學習整合CoT(Chain of Thought推理)、智慧互動、工具呼叫和知識檢索等流程,讓AI醫生在面對真實就醫場景時,能自發“想辦法”查詢資訊和綜合分析,從而做出更符合臨床邏輯的判斷。
“端到端推理和場景深度結合本質不是在做模型,而是把模型能力和場景資料融在一起,最終以Agent的形態呈現。”張超表示。
圖片來源:左醫科技
而端到端的壁壘,很大一部分在於構建資料集的能力。張超坦言:“資料清洗的過程就像‘和麵一樣’,水多了加面,面多了加水,本質上是一個要求熟練度的工種。”
換言之,資料清洗真正的Know-how在於,無數次實操過程中積累的“錯題集”。張超舉了一個形象的例子,病歷是很多模型訓練主要的資料來源,但真實的病歷有時會寫明病理,這就會給模型“漏題”,因此要把病歷中解釋病理的部分刪去,再餵給模型。
近期,左醫科技透過端到端構建的Agent已經在重慶醫科大學附屬兒童醫院落地,雙方推出了“重兒·小乙AI家庭醫生”。同時,左醫科技還推出了兒科循證知識庫,基於國內外兒科指南、專家共識、教科書等高質量專業資料來源構建,並由專業團隊核驗,保留清晰可追溯的引用來源;能夠讀懂文字、識別檢查報告,並根據需要自動推薦患教影片、提供預約掛號等服務。
張超表示,知識的來源和組織形式,同樣會影響RAG降低幻覺的效果。“構建高質量的RAG肯定不能簡單把網際網路資料堆進去。即使是學術論文,也並非全篇都有引用價值。”張超表示。
多年來,左醫科技積累了多種資料來源,包括網際網路資料,聽譯機器人採集的真實的醫患交流資料,以及模型在輔助診斷過程中生成的資料。同時,左醫科技會藉助多年來積累的專家資源,在海量原始資料中提取最有價值的資訊,一篇論文中可能只提取10條真正有價值的資料納入RAG,以此來最大程度提升模型對知識的應用。

B端保利潤,C端求增長

毋庸置疑,“AI醫生”是大模型賦予整個醫療行業的新故事,創業邦在此前的文章中曾梳理了AI醫生的市場現狀,可謂是“八仙過海,各顯神通”。
在張超看來,AI醫生在醫院的落地順序應是:全科-專科-專科專家。
從行業發展歷程來看,醫療資訊化的過程也是從全科逐漸向專科滲透的。但張超並未給這個結論附加太多合理性。他坦言:“一個人做什麼事,很大程度上取決於他手裡的資源。我們積累了大量全科資料,從全科切入是水到渠成的結果。”
目前,左醫科技正在探索AI醫生在專科的落地,並率先在兒科達成合作。張超透露,某種程度上,這也是一個無心插柳的結果。“重慶醫科大學附屬兒童醫院領導非常認可這個方向,目標一致,更好執行。”張超表示。
他進一步表示,在醫學界,兒科是一個很好的研究領域,因為很多罕見疾病都在兒科發現,兒童在很多疾病上症狀也不夠典型。但正因為它很難,所以在商業化過程中要更慎重,例如很多藥都不能給兒童用。從這一點上說,兒科並非一個很好的商業化場景。
在兒科之外,左醫科技還同步嘗試了心理以及內分泌、婦科、呼吸科、神經內科等大內科,未來也會逐步推進AI醫生在各科室的落地。
但張超透露,公司接下來會逐漸調整商業化重心。
目前,左醫科技已經能夠給醫院提供覆蓋“診前、診中、診後”的全流程服務,覆蓋全國200多家三甲醫院,其中top100的醫院達40%。但張超感受到,當前的醫療資訊化市場正越來越“卷”。
“醫院臨床要求太高了,很多資訊化技術做不到。另外,醫院的使用者流量在下降,醫改政策變化間接導致醫院收入降低,他們投入到資訊化轉型的每一分錢都會更謹慎,加上三甲醫院等優質醫療資源本就稀缺,醫院和某家合作後,其他家廠商很難再進來。”
這種情況下,部分廠商會選擇“破釜沉舟”,直接給醫院免費送軟體,送服務。“但這樣終究不是長久之計,”張超說,“甚至現在一些醫院部署DeepSeek一體機都是在浪費錢,本質依然是一個很重商務的模式。軟體專案必須要做到90%以上的毛利,否則一定是虧的。”
在此背景下,左醫科技未來會在B端會爭取更多利潤,保留預問診、分導診、語音轉寫病歷等標準化程度高,且客戶反響好的專案,把專案“做少、做深、做精”。“你不用去追逐馬,當你有一片草原,馬自然會來找你。”
接下來,左醫科技會重點在C端找新的增長曲線。
從2023年開始,左醫就嘗試以B端帶動C端,基於端到端技術打造的AI醫生,與寧夏中衛市、銀川市、北京西城區衛健委簽約,將“AI醫生”升級為“AI家醫”,以此逐漸積累流量和資料。
圖片來源:左醫科技
張超透露,現階段,左醫科技的C端產品採用會員訂閱收費的模式。未來流量足夠大之後,還可以探索更多商業模式,比如AI醫生根據和使用者的互動資料為使用者推薦個性化的健康類產品。
具體到醫療流程上,張超坦言,未來會將重點放在“診前”和“診中”。
他進一步解釋道,從使用者習慣來看,診後的主要場景是慢病管理,但除了腫瘤等疾病外,慢病大多是生活習慣導致的,簡單的人機互動很難真正改變什麼;從商業模式來看,慢病管理最終的受益方是政府醫保基金,而醫保基金分配是一件很嚴肅的事情。
不過,就短期來看,獲取流量仍是左醫科技探索C端落地的關鍵關卡。而如何打通C端應用的商業閉環,也是當下最困擾張超的問題。

一位技術創業者的自白

十年前,張超還在百度自然語言處理(下文簡稱“NLP”)部門擔任資深研發工程師、文字知識挖掘方向技術負責人以及知識圖譜實體建模專家。
但張超不滿足於大廠相對安穩的生活,隱隱生出創業的衝動。在公司內部一次IBM科學家的分享會上,張超偶然發現,國外有團隊正在探索用NLP技術輔助醫療診斷的應用。
於是,張超產生了一個今天看來“不切實際”的想法:醫療是一個知識驅動的領域,而自己又擅長知識圖譜技術,只要有足夠的醫療資料,構建一個能做各種推理的機率模型,或許就能達到輔助診斷的目標。
“本質上還是覺得,手裡有一把錘子,而醫療這個釘子還不錯。”張超說,“畢竟連馬雲當時都在說,‘下一個能超越我的人,一定出現在醫療健康行業’。”
但真正啟動創業後,張超發現,自己想得太簡單了。當時的張超,幾乎對醫療一無所知。醫療資料怎麼獲取,病歷怎麼看,診斷怎麼做,甚至到了醫院該找誰談合作都一頭霧水。
無奈之下, 張超從自己最熟悉的技術切入,沒資料就從公開渠道爬資料。但很快,團隊發現公開資料效果太差,只能硬著頭皮想辦法找醫院要資料。
彼時正處國內醫療資訊化的熱潮,湧現了很多第三方醫療資訊化廠商。
當時,一家腫瘤大資料平臺率先向張超遞出橄欖枝:“你們能不能做一個病歷結構化的系統?”這是張超接到的第一個客戶需求,但他發現,自己完全看不懂病歷。“說白了有點一頭扎猛了,我們只掌握了一些技術,但在醫療領域的認知幾乎空白。”
後來,在投資人的引薦下,一位醫療銷售人員加入左醫。2017年,左醫漸漸開始和第三方醫療資訊化廠商合作,左醫提供技術,資訊化廠商和醫院溝通提供資料。張超及團隊人員也在專案磨合中逐漸積累醫療認知。
今天回看,左醫做了很多超前的技術,包括目前火熱的CDSS(臨床輔助診斷系統)、預問診系統、聽譯機器人等,但由於技術和商業環境不成熟,最終都沒有引起足夠的市場反響。
客觀來看,醫療資訊服務本質上要面臨所有軟體廠商都會面臨的商業窘境——重商務、強定製化的專案制交付,左醫一度也陷入“做得越多,虧得越多”的困境。”張超自己覆盤發現,創業早期確實花了很多錢,做一些不該做的專案,找了一些本不需要的人。
“技術創業者太想用技術解決所有事情了,並且會對技術的短期進步更樂觀。之前我們一直想憋個大招,總想做新的東西,覺得有了更牛的技術是不是就能改變公司的境況。”張超說。
但事實證明,至少在醫療行業,醫院不只需要效能拉爆的“滿血”技術,更需要保證錯誤率最低,且能夠長期穩定供應的廠商。直到現在,左醫科技賣得最好的產品仍是五六年前開發的。
而未來,更多故事會發生在C端。對於整個醫療服務行業來說,C端或許都是一個全新的世界:如何獲取流量,如何維持使用者粘性,如何找到合理的收費模式?一切都尚待摸索。
“對於我來說,創業沒有回頭路。”張超說,“一件事能不能做成,時機很重要。我們之前對時機把握得不夠好,但現在我們踩了足夠多的坑,市場需求也很旺盛,我相信我們接下來的路會走得更穩。”

相關文章