
隨著人工智慧技術的迅猛發展,生物科學領域正迎來一場深刻的變革。AI 不僅為藥物研發和疾病診斷帶來了新的工具和方法,還透過資料驅動的方式,重新定義了生物科學的基礎研究正規化。然而,面對海量資料和複雜系統,傳統的科學研究計算資源和技術逐漸暴露出侷限性。津渡生科憑藉其自主研發的 GeneLLM™ 大模型,系統性的透過硬體、演算法、架構、最佳化、資料等多個方面的創新,正在為這一領域提供輕量化、精準化的解決方案,推動 AI 與生物科學的深度融合。
01
進入 Deepseek 時代,資料多維特性與 AI 算力侷限的矛盾逐漸凸顯
儘管 DeepSeK Biobank)需處理超過 50 萬樣本的 PB 級資料。蛋白質組學資料的複雜度更高,單個質譜實驗可產生數萬級到百萬級肽段訊號,如果需要同時載入多組學資料,進行 RNA 三維結構預測、分子動力學模擬等計算密集型任務,往往導致計算複雜度出現非線性增長,記憶體需求超過 1 T。
因此,生物科學 AI 模型與語言類模型並非一個賽道。打破傳統計算方式甚至基礎科學研究方法的侷限,推動生產力的革命性提升。
從這個角度看,只有創新性的底層自研科學模型有能力完成成本更低、效率更高的科研方案。
津渡生科自 2022 年成立以來,便深入洞察生物科學研究領域的計算資源需求高、模型普適性不足、資料複雜多樣的三大痛點,從輕量化架構、雙重配置晶片、底層演算法最佳化、專家級資料篩選和高效儲存技術五個角度入手,率先完成了輕量級多組學大模型 GeneLLM™ 的佈局:
1. 痛點一 計算資源需求高:大規模模型的訓練和推理需要極高的算力支援,導致成本高昂,難以普及。津渡生科透過多種策略,同時部署雲平臺和推理一體機,配置進口和國產化晶片多種方案,核心大模型 GeneLLM™ 經過最佳化,顯著降低了算力需求和儲存需求(低至 1.5 B 引數量),同時利用智慧資源排程技術,使 GeneLLM™ 能夠在雲平臺和臺式推理一體機上高效執行,大幅降低了科學研究計算成本。
2. 痛點二 模型普適性不足:現有生物科學模型往往針對特定任務設計,缺乏跨領域、跨場景的通用性,GeneLLM™ 從原始生物資料(如測序資料)進行訓練,經過高效壓縮技術,透過低至百例的資料即可完成單個疾病的分析。
3. 痛點三 資料複雜多樣:生物資料的多樣性使得深度學習演算法在實際應用中表現不佳,難以滿足生物科學的創新性研究需求,GeneLLM™ 透過自適應學習和多模態資料整合技術,搭配上百個生物模型的 Bioford™ 平臺能夠高效處理複雜的生物資料,提升演算法的魯棒性和準確性,從而滿足創新性研究的多樣化需求。
02
GeneLLM™ 與 Deepseek 同源的北大 AI 基因
GeneLLM™ 是一款融合津渡生科核心技術的大型語言模型,其設計理念與 Deepseek 的核心一致,強調垂類科學領域的專精應用,致力於推動行業創新。津渡生科聯合創始人沙磊教授,畢業於北京大學計算機學院計算語言學研究所,長期致力於 AI 演算法最佳化與產業化應用,曾在牛津大學擔任副研究員,並在蘋果公司擔任 NLP 高階科學家。沙教授不僅為 GeneLLM™ 的研發提供了深厚的技術支援,其在人工智慧領域的卓越貢獻,也使得該專案在推動科學與技術進步方面具有獨特優勢。值得一提的是,沙教授與 DeepSeek 團隊的核心研發人員師出同門,有著緊密的學術淵源,曾為羅福莉、代達勱等人的師兄。
以 GeneLLM™ 為基礎的一站式生物科學研究平臺 Bioford™,目前已經集成了上百個生物科學大模型,涵蓋基礎研究、醫學診斷、藥物研發、生物製造、生物育種、環境監測等多個領域,配置使用者友好的模組化互動介面設計,並提供可擴充套件的單個任務的模型框架,支援跨領域的任務的適配與整合,大幅提升了模型在不同使用場景下的通用性和實用性。
GeneLLM™ 的核心優勢包括:
1. 多領域多維資料整合:能夠處理基因組、轉錄組、蛋白質組、宏基因組學和表觀組學等多維度資料,將人工智慧演算法、基因組學、生物資訊學等技術成果深度融合,提供全面的科研支援。
2. 跨領域知識遷移:透過預訓練和微調,平臺模型能夠適應基礎研究、醫學診斷、生物製造、生物育種、環境監測和疾病治療的多樣化任務需求,具備高度的靈活性。並且根據不同客戶的需求,提供輕量化的推理裝置和定製化解決方案,降低中小型研究機構的技術門檻。
3. 高效推理能力:GeneLLM™ 能在數週內完成單個疾病的小樣本資料微調,顯著提升科研效率。
以 GeneLLM™ 為基礎,津渡生科還透過 AI 演算法和模型,實現了生物科學研究產業化的快速落地。例如,津靈系列試劑盒透過 AI技術完成了高階生物試劑的進口替代, 這一佈局不僅滿足了生物科學研究的本地化需求,還進一步解決了中小型科研機構在裝置投入和技術使用方面的成本痛點。
03
生物科學的 AI 基座 —— GeneLLM™ 引領基礎科研的“科學革命”
接下來,GeneLLM™ 將繼續為生物科學領域提供高效的科研工具,助力基礎科研領域的創新。例如,在癌症基因組學和阿爾茨海默症早期風險評估中,GeneLLM™ 已經展現出顯著的潛力。隨著技術的不斷成熟,未來將有更多疾病可以透過這一平臺完成基礎科研領域的突破,從而大幅提高企業和科研單位的創新效率,降低產業化成本。
從長期來看,津渡生科的目標是將 Bioford™ 平臺打造成為生物科學領域的標準基礎設施,成為全球科研人員和企業的核心支撐。透過不斷擴充套件平臺功能,Bioford™ 將涵蓋更多應用場景,包括藥物篩選、環境監測、生物育種等。作為 AI 與生物科學交匯的先鋒,津渡生科不僅在技術創新上做出了巨大突破,還在行業前景的把握上展現了超強前瞻性的戰略眼光。
接下來,津渡生科將致力於透過全球夥伴的合作,推動 AI+ 生物科學的跨界創新。例如,與北大醫院的戰略合作,不僅驗證了 GeneLLM™ 的臨床價值,還為胃癌、結直腸癌的早期風險評估提供了新的解決方案。此外,津渡生科還注重社會責任,確保技術應用的倫理合規性,推動科技創新與社會福祉的平衡。展望未來,津渡生科將繼續以“ AI 科技探索生命之謎 ”為使命,透過 GeneLLM™ 的深度應用,加速形成新質生產力,推動全球生物科學研究的智慧化轉型。
領跑只是第一步,我們的目標是萬億級的賽道崛起。
關於津渡生科
津渡生科致力於提供一站式 AI 生物科學研究解決方案,其自主研發的多組學大模型 GeneLLM™ 已完成 15 億引數和 3.5 萬億鹼基序列的預訓練版本。基於 GeneLLM™,津渡生科打造一站式科學服務平臺 BioFord™ ,聚焦醫學診斷、藥物開發、生物製造、基礎科研,生物育種及環境監測六大核心場景。BioFord™ 平臺包含九大生物科學模型庫:多組學基礎模型、蛋白質模型、RNA 三維結構預測模型、生物醫學文字處理模型、生物醫學影像處理模型、化學基礎模型、CRISPR 相關預測模型、單細胞分析模型和時間序列預測模型,為科研和產業使用者提供先進的 “AI for BioScience” AI 生信計算服務、雲平臺服務和推理一體機,已服務於華大基因、百度飛槳、協和腫瘤醫院、上海交通大學醫學院附屬上海兒童醫學中心、中國環境科學院等國內領先機構。
津渡生科在深圳、北京佈局研發中心,創始團隊由四位牛津校友領銜,彙集了人工智慧、生物資訊、生物工程等領域的頂尖科學家和工程師,在《Nature》《Nature Communications》等頂級期刊發表論文六十餘篇。
以“ AI 科技探索生命之謎”為使命,津渡生科將繼續突破 AI+ 生物科學的技術邊界,為生物科學研究與產業化應用提供創新動力,助力國家科技創新與產業升級。




如果您想對接文章中提到的專案,或您的專案想被動脈網報道,或者釋出融資新聞,請與我們聯絡;也可加入動脈網行業社群,結交更多志同道合的好友。

