過去的三年,對我們科技創業者來說,每逢春節,必不安寧。2023 年 ChatGPT 炸場,2024 年 Sora 顛覆影片創作,今年春節 DeepSeek 又掀起新的風暴。所以今天我會結合大家關心的話題,分享我對大模型與資料結合的一些理解,包括“1 個問題、2 個判斷和 3 個建議”。
過去我們通常認為企業的核心競爭力包含人才壁壘、技術壁壘以及資本壁壘。
先看人才壁壘。當每家企業都能以 5 萬元僱傭具備清北畢業生知識結構的數字化員工時,“人才壁壘”已被 AI 拉平。程式設計師用 Cursor 寫程式碼,律師用 AI 寫法律文書,專業技能門檻正在被快速拉平。AI 時代,企業需要重新定義自己的人才和人才優勢。能否跟 AI 共生共創是未來企業員工的標準技能,就像資訊化時代,員工需要會用電腦會用 Office 一樣。
再看技術壁壘。AI 時代,技術壁壘包含算力、演算法 / 模型和私域資料三大因素。回顧過去 15 年,從大資料普及到 AI 普惠,技術平權的週期從十年縮短到三年。現在中小企業也可以以極低的算力成本使用 DeepSeek 開源模型或 API 服務。當 GPU 和演算法都變成基礎設施,企業與企業之間技術護城河還剩下什麼?唯一沒被抹平的差異化要素,就是企業的私域資料。用大白話說就是:你有多少高質量資料,就能擁有多強的智慧。
最後看資本神話的破滅。移動網際網路時代大家比拼“融資”和"燒錢”的速度,從“百團大戰”延襲到“百模”大戰,直到遭遇了 DeepSeek 的降維打擊——DeepSeek 7 天使用者破億,根本不給資本築牆的時間。我認為有一個概念發生了變化,就是“知本”這兩個字,知識的知。知識的流動速度要比資本快十倍百倍,“知本”的槓桿效率也比資本要大十倍百倍,企業真正的壁壘不再是資本壁壘,而是你獨有的認知體系和獨有的知識庫。知本一旦形成競爭優勢,往往不可逆,因為同行來不及反應,戰鬥就已經結束了。因此,DeepSeek 沒有開源他們的訓練資料集,但開源了模型和核心程式碼,因為他們知道,當自己擁有“知本”優勢的時候,自己的下一代模型依然會領先同行,競爭優勢並沒有丟失。

基於以上分析,企業核心競爭力的落腳點究竟在哪裡?我們認為,無論是零售品牌、先進製造還是金融機構,各行各業的核心競爭力都將建立在"知本"之上,具體表現為企業的私有知識庫體系。人才、技術、資本等傳統壁壘正在快速消融,唯有知識資產難以被複制和超越。
未來的企業將構建多維知識庫矩陣,透過多智慧體(Agents)的協同與互動,形成動態進化的知識、決策與行動網路。在這一體系中,經營決策場景因其知識密度和價值密度最高,自然成為核心戰場。企業的每一次決策,都是對市場認知、客戶洞察、產品理解和技術評估的綜合體現,這一過程本質上就是知識的萃取與應用。

這也解釋了為什麼 DeepSeek 崛起後,市場對 Chat BI 表現出如此強烈的關注,因為它精準切入企業經營決策這一核心場景。經營決策場景下企業知識語義表達的載體就是“指標”,其管理平臺就是“指標平臺”。也因此,指標平臺是企業最為確定性的私域知識庫,Chat BI 是當前最為確定性的 AI 垂直應用之一。
BI 作為企業數字化程序中最為基礎和普遍的應用場景,其與 AI 的結合是必然趨勢。今天,我要提出兩個關鍵判斷:
第一,Chat BI,其關鍵不在 BI,而在資料。

Chat BI 帶來互動層體驗變革,讓“人人都是資料分析師”這一口號成為可能。但是,人類分析師遇到過的問題,Chat BI 也一樣會遇到,一樣存在“資料不好找、不敢用、用不對、取不出”的問題。
如果不解決資料供給側的問題,資料消費側的創新一樣無法實現分析體驗的革命。這裡最主要的問題有:指標隨業務發展而動態變化,怎麼讓業務日常溝通的指標口徑跟 AI 獲取到的指標語義保持一致,怎麼讓指標口徑跟資料庫裡的資料保持一致,如何保證 Chat BI 在獲取資料時的響應速度?
以上問題決定了 Chat BI 與資料倉庫之間必然依賴指標平臺實現語義層中介,實現資料的 AI-Ready。
正如自動駕駛必須依託電動車而非燃油車才能實現,Chat BI 要實現真正的資料對話,必須建立在指標平臺的語義化和虛擬化基礎之上。這個指標中間層的引入,不僅要解決資料供給問題,更要實現資料的智慧化治理和價值轉化。
因此,Chat BI 的真正挑戰不在於提升分析效率,而在於重構資料供應鏈。只有當資料能夠被高效獲取、準確理解和安全使用時,AI 的分析能力才能得到充分發揮。
第二,Chat BI 的核心不在 GPU,而在 CPU。

要理解這一點,我們需要剖析 BI 活動的本質——它是一個既消耗腦力又消耗體力的複雜過程。
腦力層面,資料分析依賴資料分析師的腦力智慧,受限於個人處理能力;體力層面,需要大量的計算、儲存和資料處理資源。
首先,基於人工的資料分析是低頻的,一個人一天只能夠處理幾件事;同時,人是可以容錯的,人有主觀能動性。面向人工的資料分析場景,工程領域誕生了 ETL 和傳統資料倉庫架構。
但 AI 不是這樣的。一方面 AI 會釋放十倍百倍的分析需求,靈活性要求也極高;另一方面 AI 是低度容錯的。那傳統 ETL 工程體系和工程師體系是否能夠支撐 AI 時代海量、靈活的分析需求呢?
這正是我們三年前就提出 NoETL 理念的根本原因。NoETL 就是透過將 ETL Engineers 驅動的資料工程轉變為 ETL Agents 驅動的資料工程,實現資料處理流程的自動化重構。只有完成這種生產力變革,才能真正滿足 AI 時代的資料分析需求。
這種轉變不僅僅是技術升級,更是整個資料處理正規化的革命。它解決了傳統 BI 體系中最根本的供需矛盾,為 Chat BI 的真正落地掃清了障礙。
基於以上分析,我提出企業 Chat BI 落地的三個建議。
第一,好資料,強智慧。企業擁有多少好資料,就能擁有多強大的智慧。什麼是“好資料”?好的資料應該是“好找的、敢用的、沒有歧義的、AI-Ready 的”。反映在指標平臺上,要產出好資料需要指標平臺具備強大的指標定義能力,要實現 100% 的指標可以語義化定義,同時需要有強大的資料智慧加速能力,實現至少 95% 的查詢可以秒級返回。因此,我們認為,一個好的指標引擎必須實現真正的“管研用一體化”,才能解決 ChatBI 真正用起來的問題。
第二,可溯源,可審計。在資料分析領域,資料準確是一切使用的前提。如何解決大模型的幻覺問題需要系統性的思考和設計,需要實現思維鏈與資料鏈的雙重展開,白盒化地呈現 Chat BI 從意圖識別、語義理解,到查詢 SQL 等每一個環節的生成結果,做到端到端可溯源、可審計。
第三,全開放,大生態。指標平臺是企業在 AI 時代的數字基建。指標平臺的定位是企業內經管決策領域的知識庫,獨立於各類敏捷 BI、Chat BI、Agents 之外,為它們提供統一的資料語義層。正因其基建的定位,指標平臺必須具備下層相容性和上層開放性。對下,它不應繫結特定的計算引擎和資料倉庫,能夠支援動態連線不同的資料來源;對上要跟各類工具、應用場景形成生態合作,比如 Quick BI、WPS,各類 Chat BI 產品,還包括各類業務解決方案的廠商,比如醫療、財稅等。
我們堅信,NoETL 指標平臺作為一個新興的品類,一種基礎設施,需要保持足夠的獨立性和開放性,不被特定的技術供應商繫結,才能保持可迭代性。
我們公司名稱“Aloudata”,其實源於“AI on data”的理念。我們堅信,AI 時代的關鍵是 Data,是知識庫,是資料語義層,是資料虛擬化,這是我們的判斷,也是我們創立這家公司的初心。而我們所提出的 NoETL 的全新資料工程體系也以 AI-Ready 為核心使命。懂 BI、會洞察,為企業構建 AGI 時代的數智基建,相信我們是專業的。