AI大模型如何影響基礎軟體行業中的開發工具與環境?

OSCHINA
↑點選藍字 關注我們
最近,開源中國 OSCHINA、Gitee 與 Gitee AI 聯合釋出了《2024 中國開源開發者報告》
報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態資料進行多方位的總結和梳理。
在第二章《TOP 101-2024 大模型觀點》中,IDEA 基礎軟體研究中心講席科學家、Moonbit 平臺負責人張宏波提到,AI 大模型提升程式設計師最終使用體驗有幾個方向,快速的更新迭代適合生成程式碼的垂類 AI 大模型只是一方面,更重要的是從程式語言入手,打造一個完整和 AI 高度整合的 IDE 生態。
全文如下:

2024 年 AI 大模型如何影響基礎軟體行業中的「開發工具與環境」

文 / 張宏波
前言
AI 大模型是指在機器學習和深度學習領域,採用大規模引數(至少在一億個以上)的神經網路模型。這些模型在訓練過程中需要消耗大量算力和高質量資料資源。AI 大模型主要分為自然語言處理(NLP)大模型、計算機視覺(CV)大模型、多模態大模型等,其中 NLP 大模型和多模態大模型在市場中佔據主導地位。
目前 AI 大模型行業應用的實現路徑主要有兩種:一是持續加大對通用大模型的研發投入,提升 AI Agent 能力,直接服務各行業;二是融合行業專業知識,基於通用大模型打造垂類行業模型。垂類行業大模型已通用大模型的基礎,透過二次訓練和最佳化,實現更精準的行業應用。
60% 的企業透過垂類行業大模型實現 AI 大模型在行業的應用佈局。金融、政務、影視遊戲和教育領域是大模型滲透率最高的四大行業,滲透率均超過 50%。電信、電子商務和建築領域的應用成熟度較高。
一、AI 大模型正在顛覆基礎軟體行業
基礎軟體是指構成計算機系統和資訊科技基礎設施核心的軟體,它們為應用程式的執行、資料處理和系統管理提供基本功能和支援。作業系統、資料庫、中介軟體和網路軟體、安全軟體、系統管理軟體、虛擬化軟體、雲平臺等都屬於基礎軟體。
作為構建軟體世界的重要工具,隨著 AI 大模型能力的不斷釋放,基礎軟體行業正在快速變革,傳統的軟體公司受到巨大沖擊。
來自美國老牌 VC Menlo Ventures 的報告顯示:以 ChatGPT 為例,在它的影響下 Stack Overflow 的網路流量減少了一半。IT 外包公司和傳統的自動化公司必須為即將到來的 AI 自動化挑戰做準備。隨著時間的推移,即使是 Salesforce 和 Autodesk 等軟體巨頭也將面臨被 AI 公司顛覆的危險。
面臨的挑戰
當然機遇之中也蘊含著挑戰。
值得注意的是儘管 AI 大模型在軟體開發中的潛力巨大,但也面臨資料隱私與安全性、模型可解釋性、資源成本高以及法律與倫理風險等挑戰。為了應對這些挑戰,需要制定相應的資料保護政策、提高模型透明度、最佳化資源分配,並在法律層面清晰界定 AI 應用的責任歸屬。
大模型最常用的呼叫方式是透過模型廠商或者雲服務提供商的 API 進行呼叫。在一些關注資料隱私和安全的商業公司裡面,這通常意味著需要從模型廠商或者雲服務提供商處購買昂貴的私有化部署的例項。
大模型在大量的資料上進行了訓練,獲得了很強的泛化能力,但是在一些少見、結構化的資料上仍然沒有辦法表現的足夠優秀。現有的解決方案,例如推理時進行約束解碼、微調,通常會導致模型能力的退化。如何讓模型能夠在推理的時候 “主動” 地生成符合期望約束的輸出,仍然是一個沒有解決的問題。
二、AI 程式設計成為熱門賽道
AI 程式設計在過去一年的矽谷是非常熱門的話題,包括 GitHub Copilot 等 AI 產品成功破圈使用者達數百萬。根據 Gartner 預測,到 2028 年,智慧編碼助手在企業軟體工程師群體中的採用率將從 2024 年初的不到 14% 提升至 90%。IDC 估計,到 2029 年,AI 編碼工具市場規模達 40 億美元。最近谷歌 CEO Sundar Pichai 也表示,谷歌超 25% 新程式碼均由 AI 完成。
很重要的一個原因是程式設計像數學一樣結果非常容易評估,但是當下的 AI 程式設計有兩個很大的瓶頸,第一個是缺乏對領域知識的理解,比如 GitHub Copilot 對所有的程式語言用的都是一樣的模型,它甚至無法保證生成的這個程式語言的語法一定是正確的。
第二個是它缺乏原生的 IDE 支援,這也是因為時間關係,以前的 IDE 都沒有預想到未來程式碼將由 AI 生成,所以現在的 IDE 無法與 AI 大模型進行一個高效的互操作,例如要修復 Copilot 的一個問題,我們需要一個接一個的串形進行修復,但大模型對算力的要求很高,會產生較大的延遲。
最近矽谷還有一個非常火的公司叫做 Cursor,它的官網上專門有一篇文章描述:「怎麼用已有編譯器傳統智慧幫助大模型生成一個更高效可靠的程式碼」,證明 Cursor 也預見到了 AI 程式碼生成需要更為宏觀的看到工具鏈上的每一環,工具鏈包括:程式語言、整合開發環境(IDE)、偵錯程式、編譯器和構建工具等。
但因為 Cursor 是一個做 IDE 的公司,它本身不擁有程式語言的服務,如果能從程式語言開始自底向上的適配大模型,程式設計體驗將會產生質的飛躍。
三、AI 程式設計主要的機遇在於自底向上重構工具鏈
目前絕大多數程式語言誕生在 AI 大模型時代之前,也就是說此前很少有人認真設想過未來程式碼將由 AI 生產。
幾乎沒有人從底層考慮如何適配 AI 程式設計,建立一整套開發者工具包括程式語言、編譯器、除錯工具、構建系統、靜態分析安全檢測工具等。
特別是程式語言不僅要設計易於人類學習的程式語言,還要設計易於 AI 學習和生成程式碼。以 Python 舉例,它的優勢是對於人類易讀易學,動態型別系統減少了程式碼量,允許快速原型開發,增強了開發效率。但效能問題、記憶體消耗和多執行緒和併發處理確是它的劣勢。
在 AI 大模型時代 Python 的優勢不再明顯,機器永不疲憊,不會因為程式碼枯燥而降低生成速度,劣勢卻愈發變成挑戰。優秀的智慧程式設計助手不能僅關注行業大模型,AI 大模型對於「程式設計」只是冰山上的技術,未來將是「開發工具和環境」與 AI 大模型高度整合平臺的天下。
一家科技媒體近期的一篇文章中提到:“現階段在海外能解決這種 IDE 生態問題的中國團隊尚且看不到。”IDE 指的是整合開發環境,指用於提供程式開發環境的應用程式,包括程式碼編輯器、編譯器、偵錯程式和圖形使用者介面等工具,如微軟 VS 系列問題。他認為,目前中國公司們哪怕想在海外實現 Cursor 這樣的 “外掛邏輯”,也是遙遙無期。
當然,國內並非真的無人有能力整合平臺生態,MoonBit(月兔)是從程式語言到整合開發環境(IDE)、偵錯程式、編譯器和構建工具等全部自研的中國團隊,目前正在致力於打造下一代 AI 雲原生開發平臺。
MoonBit 誕生於 ChatGPT 橫空出世之後,有更好的機會去重新構想整個程式語言工具鏈該如何與 AI 友好的協作,不用承擔太多的歷史包袱。一開始就從頂層設計考慮如何讓語言和工具 (IDE, 偵錯程式,靜態分析,包管理等)一體化發展。這兩點使得 MoonBit 在非常早期就構建了專屬 MoonBit 的雲端 IDE 和 AI 程式碼助手,並創新性的從底層構建之初就與 AI 大模型進行適配。
一個更加完善的 AI 程式設計場景出現:
  • 透過思考語言設計和工具鏈適配,IDE 和工具鏈能夠非常靈活地在當前的倉庫檢查、執行並更新 AI 大模型生成的程式碼塊。
  • IDE 內建的測試功能除了為程式設計師提供一種方便測試的機制以外,能夠很好地在程式碼上下文中作為相關程式碼的示例,從而大大提高程式碼生成及相關下游任務的正確性。
  • 除了在 IDE 中向用戶提供常規的 AI 生成測試、撰寫文件、修復錯誤等功能外,還能夠提供完全後臺執行的自動化智慧體,透過讀取編譯器的各項反饋來完成各種相對複雜、長時間的下游任務,例如提升測試覆蓋率、從自然語言提示生成完整程式碼元件或者專案等。
四、總結
未來程式設計師的工作場景,會更多的使用到 AI 大模型程式碼生成助手。值得注意的是,提升程式設計師最終使用體驗有幾個方向,快速的更新迭代適合生成程式碼的垂類 AI 大模型只是一方面,更重要的是從程式語言入手,打造一個完整和 AI 高度整合的 IDE 生態。

作者簡介
張宏波
現任基礎軟體中心首席科學家、 Moonbit 平臺負責人,是通用程式語言 ReScript 的作者,程式語言 OCaml 前核心開發人員。本科畢業於清華大學電子系,在美國賓夕法尼亞大學讀博期間受 Bloomberg 邀請,從事函式式語言編譯器的開發工作。
閱讀完整報告https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf

🔗《2024 中國開源開發者報告》正式釋出
分享在看點贊~Orz

相關文章