MLNLP釋出《LLMs-from-scratch》專案中文翻譯版本|原英文專案獲得38000次星標

MLNLP社群是國內外知名自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
社群的願景是促進國內外自然語言處理,機器學習學術界、產業界和廣大愛好者之間的交流和進步。

1
專案動機

原專案地址:https://github.com/rasbt/LLMs-from-scratch.git
本專案是對 GitHub 專案 《LLMs-from-scratch》的中文翻譯,包括詳細的 Markdown 筆記和相關的 Jupyter 程式碼。翻譯過程中,我們儘量保持原意的準確性,同時優化了部分語序和表達方式,以更貼閤中文學習者的閱讀習慣。需要特別說明的是,原作者為該專案的主要貢獻者,本漢化版本僅作為學習輔助資料,未對原內容進行修改或延伸。 
由於個人能力有限,翻譯中可能存在不足之處,歡迎提出寶貴意見並多多包涵。希望透過這一翻譯專案,能幫助更多中文學習者受益,同時為國內社群的 LLM 學習和研究貢獻一份力量。 
本專案的特色:
  1. 詳細的 Jupyter 程式碼註釋:幫助學習者快速上手實踐。
  2. 精準的術語翻譯:譯者結合實際交流中的常用術語,提供更貼近實際應用的表達。
  3. 豐富的附加材料:包含拓展知識的資源,並對部分關鍵內容提供了原論文索引,便於快速理解與深入學習。
本專案所用的徽章來自網際網路,如有侵犯您的圖片版權,請聯絡我們刪除。
2
課程簡介
提到大型語言模型(LLMs),我們可能會將其視為獨立於傳統機器學習的領域,但實際上,LLMs 是機器學習的一個重要分支。在深度學習尚未廣泛應用之前,許多領域(如語音識別、自然語言處理、計算機視覺等)因需要大量專業知識應對複雜問題,機器學習的作用相對有限。然而,近年來深度學習的快速發展徹底改變了這一狀況,LLMs 成為推動人工智慧技術革命的關鍵力量。
在 《LLMs-from-scratch》專案中,不僅關注 LLMs 的基礎構建(如 Transformer 架構、序列建模等),還深入探索了 GPT、BERT 等深度學習模型的底層實現。專案的每一部分都配備詳細的程式碼實現和學習資源,幫助學習者從零開始構建 LLMs,全面掌握其核心技術。 
3
課程資源
– 英文原版地址:https://github.com/rasbt/LLMs-from-scratch.git
– 教材網址:https://amzn.to/4fqvn0D
– 漢化地址:https://github.com/MLNLP-World/LLMs-from-scratch-CN.git
此外,本課程還配備相應的程式碼實現,每章均提供完整的 Python 模型程式碼的 Jupyter 筆記本,所有資源均可線上免費獲取。
4
筆記目錄
5
筆記預覽
《第二章: 文字資訊處理》部分預覽
6
專案地址

關於我們

MLNLP 社群是由國內外機器學習與自然語言處理學者聯合構建的民間學術社群,目前已經發展為國內外知名的機器學習與自然語言處理社群,旨在促進機器學習,自然語言處理學術界、產業界和廣大愛好者之間的進步。
社群可以為相關從業者的深造、就業及研究等方面提供開放交流平臺。歡迎大家關注和加入我們。

相關文章