↑點選藍字 關注我們
12 月 28 日,「AI 為伍 重啟征程」2024 OSC 源創會年終盛典在珠海嘉遠世紀酒店圓滿落下帷幕。本次活動由開源中國、Gitee 主辦,華為聯合主辦,珠海市香洲區科技和工業資訊化局、廣東省科學院珠海產業技術研究院、珠海市軟體行業協會、珠海市科技發展促進會、澳門亞太 IT 協會提供支援。

本次活動秉承 “自由、開放、分享” 的宗旨,自開啟報名後就受到了全國各地開發者和 IT 企業的關注,吸引到行業內的頂尖專家、技術領袖和一線開發者積極報名,現場觀眾達 400 餘人,會場座無虛席,參會人數再創新高。
2024 年,源創會走過不同城市,舉辦了 8 場城市沙龍,1 場年終盛典,匯聚上千位開發者、近 70 位優秀講師。與此同時,開源中國和 Gitee AI 社群生態的發展也離不開業界專家與合作伙伴的支援。為了感謝各位合作伙伴的支援與貢獻,本次大會組委會特別頒發“源創會 2024 年度技術領航者”、“開源中國 2024 年度突出貢獻專家”、“Gitee AI 年度最佳合作伙伴” 三大獎項。
大會現場巧妙設定了一系列精彩紛呈、趣味盎然的活動,如“可樂滾滾樂”、“展臺互動集章”、“尋找神秘人”等小遊戲,讓參會者門在繁忙的學習交流之餘,也能盡情享受活動帶來的歡樂時光。


大會精彩內容集錦
「AI 為伍 開源同行」主論壇
聚焦開源與大模型技術的融合與發展

上午,在「AI 為伍 開源同行」的主論壇現場,華為資深開源工程師李佳偉發表了題為《主流開源軟體原生支援昇騰:大模型訓練與推理的輕鬆之選》的精彩演講,詳細闡述了華為昇騰在對主流開源軟體,諸如 vLLM 、ONNXRuntime 、ollama 、llama.cpp 等進行原生支援方面所取得的顯著進展以及當前的實際狀況,旨在為廣大開發者搭建起更為便捷、高效的大模型訓練與推理平臺,助力其在 AI 領域的探索與創新之路更加順暢無阻。
李佳偉指出,在當今時代的科技浪潮中,AI 軟體領域正呈現出爆發式增長的強勁態勢,不斷突破傳統邊界,實現著顛覆性的成長與跨越,同時,程式碼規模朝著更加精簡高效的方向發展,已成為不可逆轉的趨勢。面對智慧計算領域開源軟體如雨後春筍般蓬勃湧現的局面,華為昇騰秉持著開放、包容的態度,誠摯歡迎各路賢才精英踴躍加入,共同挖掘技術潛力,拓展創新邊界,攜手推動 AI 技術邁向新的高峰,為全球科技產業的發展貢獻力量,共繪智慧未來的宏偉藍圖。

紅帽大中華區首席架構師張家駒帶來題為《大模型技術創新與合作 —— 在人工智慧領域擁抱開源價值觀》的分享。步入 AI 時代,開源概念亦需順勢革新,秉持 100% 開源價值觀成為必然要求,這意味著不僅程式碼要開源、權重需開放,訓練資料以及訓練方法等方面同樣要實現開源共享。基於這樣的理念,紅帽精心發起了 InstructLab 專案。InstructLab 志在打造一個開放包容的社群平臺,讓每一個人都能擁有平等參與大模型開發的契機,使 AI 真正化作普惠大眾的技術力量。

在《大模型在研發安全的應用實踐》的分享中,騰訊程式碼安全負責人張棟強調,程式碼安全已成為大企業推進安全左移的核心點。傳統程式碼安全方案在效率與能力上存在明顯瓶頸,騰訊混元大模型透過其卓越的語義理解與泛化能力,在存量場景中突破傳統能力上限,有效提升高危風險檢出的準確率(質)、檢出數(量)和修復效率。更重要的是在增量場景中,大模型為邏輯類漏洞和自動審計提供了落地的可能,使傳統技術較難解決的複雜問題得以推進,實現從 “提質提量” 到 “擴邊增效”,推動程式碼安全實現質的突破與應用領域的拓展。

螞蟻集團高階演算法專家餘航則是分享了 CodeFuse 基座模型。CodeFuse 源於螞蟻自身的開發場景及程式碼庫沉澱,基於海量高質量程式碼資料和程式碼領域特色詞表,以及多工微調技術 MFT ,已從單環節智慧化演進到企業級端到端的研發智慧體探索,並開源了多個自研和微調的程式碼大模型,總下載量近 200 萬。
餘航詳細介紹了,CodeFuse 旗下極具特色的倉庫級程式碼圖大模型 CGM,在行業權威的 SWE-Bench Lite 榜單上表現卓越,成功解決了 41.67% 的問題,在競爭激烈的 SWE-Bench Lite 開源榜單中脫穎而出,榮登榜首之位。這一成績的取得,不僅彰顯了 CodeFuse 模型的高超效能與精準能力,更為整個程式碼大模型領域樹立了新的標杆,為後續的研究與應用提供了極具價值的參考與借鑑,有望引領行業朝著更加高效、智慧的方向發展。

Vivo 高階系統架構專家徐海波在題為《 vivo 藍河作業系統的 AI 技術探索與前沿實踐》的分享。他介紹,BlueOS 藍河作業系統是 vivo 自研面向通用人工智慧時代的智慧作業系統,具備更智慧的 AI 互動、更流暢的效能、更安全的核心及框架等特點。
「GenAI 開發關鍵技術」主論壇
聚焦 GenAI 開發中的關鍵技術

在下午「GenAI 開發關鍵技術」主論壇中,英飛流創始人兼 CEO 張穎峰發表題為《新一代企業級多模態 RAG 引擎》的演講。張穎峰表示,隨著 LLM 多模態能力的增強,RAG 也需要步入多模態時代,它並不限於對日常圖片,音影片的檢索增強,還應該涵蓋當下佔據大部分的非結構化文件,發掘出這些資料的商業價值。

Gitee 私有云產品總監林靖靖發表《資料智慧跟蹤體系的構建》分享,深入闡述了 Gitee DevOps 如何打破資訊孤島,形成研發管理全域智慧的產品組合,結合企業過程資產庫和研發過程資產資訊庫,基於 AI 大模型 multiagents 和 RAG 技術,實現企業組織研發過程智慧化、體系化,加速體系成熟,構築智慧化軟體工廠。

文心快碼 Baidu Comate 架構師徐曉強釋出題為《文心快碼在程式碼生成場景下的知識豐富探索與實踐》的演講。為了提供給開發者更加準確的生成結果,文心快碼這兩年不斷豐富上下文的探索,在程式碼續寫場景下做 “準確度” 和 “速度” 的平衡。也探索了基於 Agent 的程式碼改寫能力。隨著模型能力的提升,文心快碼已經能夠在更多場景和更模糊的指令下完成更困難的任務。

IDEA 基礎軟體中心高階工程師費浩祥釋出題為《MoonBit 和 AI 的協同設計》的演講。會上,費浩祥為大家介紹了 MoonBit 是如何在程式語言和工具鏈的上針對 AI 程式碼生成進行協同設計,並介紹這些設計是如何改善模型的效能,從而幫助 MoonBit 使用者完成常見的編碼任務。

華為開源生態專家楊滔發表《大模型時代的昇騰 AI 》主題分享。楊滔指出,人工智慧時代,昇騰基礎軟硬體平臺提供從底層算力、運算元、框架、套件等層面對人工智慧從模型開放到應用的全流程支援。
在人工智慧框架方面,昇思 MindSpore 持續創新,透過易用性提示,對大模型訓推的支援,擁抱 AI 時代的創新,降低使用者開發和應用成本。
AI 應用使能套件作為昇騰生態領域的關鍵視窗,專注於賦予開發者圍繞模型的全方位的能力,涵蓋模型訓練與推理一體的高效流程,有力地降低了昇騰硬體開發的技術門檻。

矩陣起源研發 VP 趙晨陽在題為《如何利用多模態模型構建適用於 LLM 搜尋的資料》的分享中表示,智慧體表現好壞依賴於資料,也進一步應證了高質量 “知識” 對於 LMM 的重要性。隨後,趙晨陽進一步闡述在多模態資料融合階段,更是需要創新性的演算法和模型架構,來打破不同模態之間的語義鴻溝,實現資料的有機整合和協同表達。

Java 開發者應該如何構建 Agent?會上,Spring AI Alibaba 專案負責人劉軍則向大家介紹了基於百鍊模型服務的 AI 應用開發框架 “Spring AI Alibaba” 及其開發框架的架構與基本使用。Spring AI Alibaba 開源專案基於 Spring AI 構建,是阿里雲通義系列模型及服務在 Java AI 應用開發領域的最佳實踐,提供高層次的 AI API 抽象與雲原生基礎設施整合方案,可以幫助開發者快速構建 AI 應用。

Alluxio 首席架構師傅正佳帶來題為《構建大模型時代的高效能 AI 資料底座》的分享。傅正佳介紹,Alluxio 是一個位於資料儲存和計算框架之間,提供資料抽象、統一訪問、分散式快取加速、資料親和性排程等功能的開源資料編排平臺。Alluxio 透過幫助企業構建大模型時代的高效能 AI 資料底座以應對 I/O 挑戰,提升 AI 算力的效率與效能,被廣泛應用於模型訓練與推理、自動駕駛、AI 製藥、金融量化以及影片渲染等場景。
「昇騰 AI 大模型與應用開發」分論壇
聚焦昇騰 AI 大模型與應用開發

在下午的「昇騰 AI 大模型與應用開發」分論壇上,華為昇思生態總監王神迪博士帶來題為《昇思 MindSpore AI 框架使能大模型原生創新》的分享。昇思 MindSpore 作為大模型時代 AI 框架的新選擇,作為中國乃至世界的框架 “新勢力”,引領技術創新,加速全面智慧化時代到。目前,社群下載量 1000 萬 +,社群核心貢獻者 3.5 萬,認證企業數超 1500+ 家。

華為主任工程師張俊怡發表了題為《昇騰大模型 MindSpeed 訓練加速庫系列介紹》的演講。張俊怡圍繞 MindSpeed 向大家介紹訓練加速庫系列,深入闡釋了其核心技術架構與獨特優勢。MindSpeed 訓練加速庫旨在應對當前人工智慧領域對高效、快速訓練日益增長的需求,透過最佳化演算法、改進記憶體管理以及充分利用硬體平行計算能力等手段,顯著提升了模型訓練的速度與效率。

華為昇騰生態套件專案架構師潘邵武帶來題為《昇騰生態開發套件,模型訓推新體驗》的分享。為提升昇騰平臺的模型開發效率,加速開發者 AI 應用創新,華為計算產品線牽頭開發了 AI 應用使能套件,已適配 LLaMa-Factory 、Stable Diffusion WebUI 等開源生態套件,覆蓋了微調訓練、推理部署、模型評測等模型開發應用全流程。會上,潘邵武圍繞昇騰生態,向大家展示了 AI 應用使能套件生態全景,以及 OpenI 啟智社群所開展的各類活動,希望與廣大開發者共建昇騰 AI 生態。

迅龍軟體系統開發工程師徐洋帆為大家帶來題為《香橙派:開源 + AI ,探索無限可能》的分享。徐洋帆介紹,香橙派與華為昇騰目前聯合研發的高算力人工智慧產品,包括 OrangePi Alpro、OrangePi Al Studio 等,具有強大的計算能力和高效的運算速度,能滿足市場上各行各業及個人開發者對 AI 推理應用開發的需求,能讓企業以更低的門檻嘗試 A,推動企業的智慧化升級。

魔樂社群負責人、天翼雲專家李寶龍為大家帶來題為《與魔樂一起,繁榮國產 AI 生態》的分享。魔樂社群(Modelers)是全新的人工智慧社群,擁有包容的工具鏈體系,已託管和展示昇思、DeepSpeed、AI 應用使能套件等框架或平臺。他還表示,魔樂社群堅持走開源、公益的路線,免費、長期支撐應用創新。值得一提的是,魔樂社群對使用者制定了成長激勵計劃,鼓勵使用者在不同領域深入學習和實踐,從而實現個人和專業上的成長與發展。

開源中國 Gitee AI 負責人彭博則為大家分享《 Gitee AI 如何在國產算力上構建 Serverless API 及其應用場景》。彭博指出,模型引擎和應用引擎已經暴露出一些問題,如模型引擎體驗失敗率高,應用引擎要編寫跟 GPU 推理相關的程式碼門檻高等等。因此 Gitee AI 推出 Serverless API,直接呼叫 API,無須關心底層的 GPU 推理程式碼;同時相容 OpenAl 介面,門檻低;體驗穩定,部署簡單;按次付費,價格實惠。

落到具體,情感機器(北京)科技有限公司 AI 生態負責人陳少宏則是為大家帶來題為《 SwanLab+openMind 打造國產 AI 開發者工具鏈》的分享。他介紹,情感機器(北京)科技有限公司是一家專注於人工智慧和機器學習底層工具研發的高科技企業。旗下 SwanLab 是一款專為 AI 訓練設計的過程記錄工具,幫助開發者發掘出最具潛力的 AI 模型,將與 AI 應用使能套件共同打造全球領先的人工智慧研發工具鏈。
在本次 2024 OSC 源創會年終盛典的推進過程中,我們心懷無盡感激,向一路同行的贊助商、支援單位、合作伙伴們致以最誠摯的鳴謝。

合作伙伴

我們明年源創會再見!
END
熱門文章


↓分享、在看與點贊~Orz