JuiceFS2024:開源與商業並進,邁向AI原生時代

即將過去的 2024 年,是 JuiceFS 開源版本推出的第 4 年,企業版的第 8 個年頭。
回顧過去這一年,JuiceFS 社群版依舊保持著快速成長的勢頭,GitHub 星標突破 11.1K,各項使用指標增長均超過 100%,其中檔案系統總數量較前一年更是增長了 8.5 倍企業版同樣持續保持高速增長,繼去年實現盈虧平衡後,商業營收實現了翻倍增長,為未來的社群持續投入和產品最佳化提供了堅實的保障。
2024年,隨著 AI 技術的迅猛發展,AI 正逐漸成為企業發展的新基建,企業的基礎架構正朝著 AI 原生化趨勢邁進。在這一變革的推動下,JuiceFS 社群也迎來了顯著的增長。
來自 AI 場景的使用者佔比大幅增加,且滲透到教育、製造、風電、生物醫藥等多個行業。在新興 AI 行業裡,除了基礎模型研究的企業,如 MiniMax、智譜、階躍星辰等,大量中小型 AI 服務軟體公司也加入了社群,成為重要的使用者群體。
接下來,讓我們一起回顧 JuiceFS 的這一年。

01 產品迭代:

企業級管理 、多雲架構、大規模 AI 場景

JuiceFS 社群版

過去一年,JuiceFS 社群版釋出了 9 個版本。持續保持每年一個大版本的釋出節奏,v1.2 版本是自 2021 年開源以來的第三個重大版本,此版本大幅提升了 JuiceFS 在企業級許可權管理方面的能力,繼續提升處理大規模資料的易用性,關鍵功能包括支援 POSIX ACL 、平滑升級、S3 Gateway 和 JuiceFS Sync 的諸多最佳化。

JuiceFS CSI Driver

JuiceFS CSI 在過去一年釋出了 16 個版本,專注於為 Kubernetes 環境中的使用者提供更穩定、易用的操作,主要更新包括平滑升級、統一配置、kubectl 外掛和快取組 Operator

JuiceFS 企業版

JuiceFS 企業版專為海量檔案高效能計算場景設計。過去一年中,針對大規模 AI 場景的需求,企業版在多雲架構、AI 生態相容性、海量檔案的效能穩定性等方面進行了深入最佳化。v5.1 版本新增了可寫映象叢集、支援 Python SDK 、分散式快取副本和 S3 閘道器賬號管理等功能。在下一個版本中,我們還在挑戰更多的極限場景,繼續推進分散式快取效能最佳化、熱點分割槽自動均衡、高效能 FUSE 改進等。

02 AI 助推社群發展:增長與活躍並進

社群版開源的第 4 年,社群使用者還在持續壯大。根據使用者反饋資料顯示,JuiceFS 的各項關鍵資料上持續呈現出快速增長趨勢,2024 年的增長尤為突出:
  • • JuiceFS 檔案系統數量達超 3 萬個,增長 8.5 倍
  • • 活躍客戶端數量超 10.7 萬個,增長超 2 倍
  • • 檔案數量增至 3,000 億個,增長 3.3 倍
  • • 管理的資料量達到 700 PiB,增長 4.2 倍
從資料使用規模來看,2024年的增長速度顯著加快。加速增長的同時,社群依舊保持高度活躍。2024 年一共處理了 265個 issue,Issue 的首次回覆時間中位值為 22 小時,意味著使用者在提出 Issue 後,通常在 1 天內就能得到回覆。
(JuiceFS 社群 Issue 首次回覆時間,資料來源:OSSInsight)
全年,我們在多個行業大會分享我們的實踐,KubeCon 中國、KCD 上海、QCon、稀土大會等。此外,還舉辦了 11 場 Office Hours,向用戶介紹新功能、解答疑問;舉行了 11 場 meetup,展示了 JuiceFS 在各行業和場景中的應用,幫助新使用者更有信心地將 JuiceFS 應用於生產環境中,值得一提的是今年的案例多來自於 AI 領域。
  1. 1. 管錫鵬,BentoML
  2. 2. 魯蔚徵,中國人民大學
  3. 3. 王新,知乎
  4. 4. 馬濤,Jerry
  5. 5. 王天慶,貝殼找房
  6. 6. 徐國昊,中山大學
  7. 7. Jon Jiang,MemVerge
  8. 8. Jonnas,Clobotics 
  9. 9. 星龍,MiniMax
  10. 混合雲環境大模型訓練,基礎系統的挑戰與實踐
  11. 10. 吳森棟,海柔創新
  12. 11. 鄭亞軍,摩爾線程
  13. 從 NFS 到 JuiceFS, 低成本提升 AI 訓練效能
  14. 12. 於相洋,vivo
  15. 13. 賀龍華,好未來
  16. 14. 位傳海,同程旅行
  17. 15. 丁聰,Lepton AI
  18. 基於 JuiceFS 構建多租戶、高效能儲存平臺
除了上述案例涉及的場景,JuiceFS 在 AI 領域的應用已非常廣泛,使用者涵蓋多個子領域:
  • 生成式 AI:MiniMax、智譜、階躍星辰、面壁智慧等;
  • 平臺應用類:小紅書、WPS、知乎、韓國國民搜尋平臺 NAVER、LiblibAI 等;
  • AI 基礎架構:如 Lepton AI、BentoML、矽基流動、Cerebrium 等;
  • 自動駕駛:Momenta、地平線、大疆卓馭等。
在應用 AI 技術的其他行業,如金融量化基金、消費電子、生物醫藥等,JuiceFS 也擁有眾多使用者。我們深感榮幸能獲得這些科技創新者的信任。
海外使用者也在持續增長,GitHub 上的星標、官網訪問資料均顯示,今年有超過 50% 的使用者來自海外。此外,JuiceFS Slack 英文頻道成員數量較去年增長了 70%。JuiceFS 的多篇技術文章被 DZone 等海外媒體收錄,並多次登上 Hacker News 首頁,同時我們也首次在 The IT Press Tour、DataTalksClub 等海外媒體的活動中嶄露頭角。
將 JuiceFS 應用在生產環境中的海外使用者也逐漸增多,同樣大量集中在 AI 領域,如 fal.ai、LeptonAI、BentoML、Cerebrium、Baseten 、 RunComfy 等。
在此,我們衷心感謝大家在過去一年裡一路相伴與支援。你們每一位的參與與反饋,幫助 JuiceFS 持續進步;特別感謝在各類活動和博文中分享 JuiceFS 使用心得的使用者們,讓 JuiceFS 被更多人看見。
希望新的一年,JuiceFS 能繼續讓你的工作更輕鬆、高效。🥳❣️👊

掃碼加入使用者群 


參與 JuiceFS 社群討論

關於 Juicedata
Juicedata,杭州果汁資料科技有限公司是一家企業級儲存服務供應商,開發了雲原生分散式檔案系統 JuiceFS,致力於在大資料時代下,為企業打造安全、高效能、自主可控的儲存基礎設施及服務。
2021 年,JuiceFS 正式在 GitHub 上開源,已經獲得 11.1K star,歡迎開發者加入我們。 (github.com/juicedata/juicefs)

相關文章