如何公正評價百度開源的貢獻?

引子近日,因百度宣佈開源文心大模型而引發熱議,不少媒體與業內人士對李彥宏及百度此前的言論提出質疑,發表例如“李彥宏“推翻”李彥宏”,“李彥宏此前言論遭“打臉”類似的文章,甚至有人認為百度的“開源”只是表面文章。面對這些質疑,涉及對企業開源貢獻評價標準的不同理解。其實人的看法會因為世事變化發生很大的變化,出現打臉是在所難免的。但是,公正的評價一個企業的開源貢獻,不能只看他們說了什麼、謀求了多大商業利益,而應從開源世界的標準出發,看他們到底做了什麼、貢獻了什麼。本文將從如何客觀評價企業開源貢獻的方法入手,並結合百度多年來的優秀開源專案,給出一個公正的評價。

一、如何公正評價企業的開源貢獻

評價一個企業的開源貢獻,關鍵在於看做了什麼而非說了什麼。以下幾點是常用的評價方法:
  1. 專案質量與長期價值
    (1)專案本身質量:優秀的開源專案應該能夠在工業界得到廣泛的應用。它應該是在它的技術生命週期內,在解決一些開發者實際的問題上有獨到之處,這是這個專案的最根本的技術價值。即開源專案本身得有用,而且確實被工業界廣泛使用了。例如,可以考察這個開源專案被企業和開發者實際使用的案例數量等指標。
    (2)專案長期價值:一個專案被開源出來,如果不能長期迭代,不斷解決各種新的問題,而只是開源了一個版本然後就沒有更新了,那麼這個專案雖然也有一點點價值,但是價值很有限。持續的程式碼提交、定期的版本釋出(尤其是對高危漏洞的及時修復版本)、積極的社群維護,都是專案長期價值的體現。
  2. 人才培養
    企業開源不僅是程式碼的貢獻,更是培養開發人才、推動整個行業技術進步的重要途徑。企業透過開放專案,不僅提升了自身技術水平,也為整個生態輸送了大量高質量的人才。所以看企業開源的價值,圍繞開源專案帶來的人才培養也是重要的一個方面。例如,可以考察該企業是否圍繞這個開源專案開展了相關的培訓、認證、開發者活動,以及開源社群中湧現出的優秀開發者和貢獻者是否得到了行業的認可和發展,而不僅僅只侷限在這一個專案上。
  3. 對行業的長期技術推動與生態效應
    評價企業開源貢獻,還需關注其在行業內對標準制定、技術創新和生態構建方面的影響。一個企業的開源行為如果能推動整個產業技術進步,形成廣泛的影響力,則其貢獻不可小覷。例如,可以考察企業開源專案是否參與了行業標準的制定,是否引領了新的技術方向,是否構建了開放協作的生態系統,吸引了產業鏈上下游的參與者。
總之,公正評價應著眼於實際成果——開源專案的本身質量和長期價值,以及企業對人才培養與生態建設的長遠貢獻,而非僅憑商業成功或單純的口號來論斷。另外,國內某些媒體往往只以開源商業化的成功以否來評價一個企業開源的價值,其實企業開源只是該企業其整體商業戰略的一個環節,企業商業的成功取決於多個因素,市場、營銷、渠道、交付、團隊等等,開源只是其中一個因素而已。所以業內也有不少企業,開源專案做的相當不錯,但是對應的商業化做的不怎麼成功。例如雲原生領域內的基石專案Kubernetes的創始方是Google公司,但是容器雲即基於kubernetes搭建的雲服務,在全球公有云市場份額最大的是AWS。(根據 perplexity.ai搜尋2023 年容器雲全球市場份額得到2023年全球容器雲市場份額的前三名是亞馬遜AWS、微軟Azure和谷歌雲,分別佔據32%、20%和9%的市場份額。)這充分說明,開源專案的成功與其商業化成果之間不能簡單劃等號。雖然谷歌雲在容器雲市場份額不如AWS和Azure,但是任何行內人都不會否定Google在雲原生領域內的突出貢獻,是它開源的kubernetes並加上docker共同創造嶄新的雲原生產業。因此不能拿商業的不成功,來否定開源專案本身的成功,進而否定該公司開源的不成功。

二、百度的優秀開源專案舉例

百度多年來在開源領域的探索和投入不容小覷,其多個開源專案在國內外都產生了深遠影響。筆者簡單列舉幾個筆者熟悉的專案,而這些專案僅僅是百度眾多開源專案中的幾個。
  1. Apollo
    作為開放的自動駕駛平臺,百度Apollo自2017年開源1.0以來持續迭代,引領了自動駕駛技術的開源潮流,不僅樹立了技術標杆,也促使更多企業和研究機構加入開放合作,共同推動產業進步。據瞭解,國內眾多自動駕駛車廠和技術提供商,要麼基於Apollo的開原始碼魔改,要麼借鑑其開源的架構設計和原始碼實現之後再構建自己的系統,這充分體現了Apollo的技術價值。
    同時,Apollo在人才培養生態建設上的貢獻同樣突出。其開源平臺為高校、科研機構和初創公司提供了寶貴的學習和實踐機會,培養了眾多自動駕駛領域的技術人才。此外,Apollo開放的架構和工具鏈降低了行業技術門檻,推動了自動駕駛技術的普及,並吸引了車企、晶片廠商等產業鏈夥伴,共同加速技術落地。可以說,Apollo不僅貢獻了技術,還透過開源促進了人才成長和產業生態的發展。有行業專家指出,Apollo 的開源模式加速了中國自動駕駛技術的發展程序,降低了整個行業創新的成本。
  2. PaddlePaddle(飛槳)
    作為中國首個產業級深度學習平臺,飛槳為廣大開發者提供了全面的AI解決方案,推動了人工智慧技術的普及和商業落地,其生態已輻射眾多產業領域。筆者個人覺得尤其重要的是,PaddlePaddle在教育界和產業界長期進行了大量的培訓和推廣工作,成功培養了大批人工智慧的開發者和科學家,為後來大模型研發的遍地開花奠定了堅實的基礎。飛槳平臺在推動中國人工智慧人才培養方面發揮了重要作用。
  3. ECharts
    ECharts 是源於百度的一款基於 JavaScript 的資料視覺化庫,現在是隸屬於Apache開源軟體基金會的頂級專案。自開源以來在資料視覺化領域取得了顯著的成就和廣泛的應用.截至目前,ECharts 在 GitHub 上已獲得超過 6.19萬 Star,在同類資料視覺化庫中名列前茅 (資料來源: GitHub)。它廣泛地被各種資料BI產品所整合,例如Apache Superset等等。還在國內外多個行業內被廣泛使用,例如資料分析、互動教育等。比較難得的是,雖然是源於百度的開源專案,但是專案的貢獻者是來自多個公司的志願者,並沒有來自百度的全職維護者。社群的長期發展一直得到足夠保證,目前正在籌備下個大版本ECharts 6.0 的釋出。
  4. brpc
    作為起源於百度的一款高效能、分散式的遠端呼叫(RPC)框架,在特別吃效能的大規模分散式場景下使用很多,例如各大網際網路公司的搜尋、廣告、推薦、儲存等系統上。它同樣是Apache開源軟體基金會的頂級專案,開源至今培養了大批高效能應用的開發者。目前的維護者是來自多家公司的志願者,也同樣沒有百度全職員工的投入,但一直在不斷的往前發展,包括增加新特性,釋出安全修復版本等。2016年開源至今一直不斷發展新的Committer,還發布了數十個新的版本。今年1月份他們還發了兩個版本,增加一些新的特性和修復了一些Bugs。brpc 專案的持續迭代和社群活躍度,體現了其強大的生命力。
當然,這幾個專案只是本人比較熟知的幾個專案,只是冰山下的一角。除此之外,還有Doris、BFE、SAN等數百個專案。透過這些專案,我們可以看到百度不僅在核心技術上做出了實際貢獻,而且透過開源模式推動了整個技術生態的發展和人才的培養。

三、結論

評價一個企業的開源貢獻,應從源於這個企業的開源專案的技術質量、社群影響、人才培養以及對產業生態的推動等多方面進行綜合考量。百度在這些方面都有著突出表現——
  • 其開源專案如Apollo、paddlepaddle、ECharts、brpc等,不僅在技術上具備先進性,還被廣泛應用於工業界;
  • 同時,百度還透過開源平臺培養了大量技術人才,推動了自動駕駛、人工智慧等多個行業的進步。
因此, 綜合來看, 百度的開源努力為中國乃至全世界的技術進步和產業生態建設做出了積極貢獻,而針對部分過激言論,則顯然是片面的、不夠全面的評價。當然,我們也應該看到,企業開源是一個複雜而動態的過程,百度的開源之路也面臨著很大的挑戰和改進空間。
四、最後
百度不惜“打臉”自己,成為業內首個從閉源路線轉向開源路線的大模型廠商,這一決定本身就展現了相當的魄力。從商業角度來看,開源意味著放棄部分技術封鎖帶來的競爭壁壘,承擔更多的不確定性,但百度依然選擇開放文心大模型,表明其對技術共創和生態繁榮的認可。從行業角度來看,百度的這一舉措不僅為國內大模型開源生態注入了新的活力,也為其他廠商提供了新的參考路徑,推動國內人工智慧技術的開放合作與良性競爭。有評論認為,無論如何,百度這次的選擇,都是中國AI開源發展史上具有里程碑意義的一步,但是從長期來看,仍然有待時間和市場的檢驗。


相關文章