1

專案動機

原專案地址：https://github.com/rasbt/LLMs-from-scratch.git

本專案是對 GitHub 專案《LLMs-from-scratch》的中文翻譯，包括詳細的 Markdown 筆記和相關的 Jupyter 程式碼。翻譯過程中，我們儘量保持原意的準確性，同時優化了部分語序和表達方式，以更貼閤中文學習者的閱讀習慣。需要特別說明的是，原作者為該專案的主要貢獻者，本漢化版本僅作為學習輔助資料，未對原內容進行修改或延伸。

由於個人能力有限，翻譯中可能存在不足之處，歡迎提出寶貴意見並多多包涵。希望透過這一翻譯專案，能幫助更多中文學習者受益，同時為國內社群的 LLM 學習和研究貢獻一份力量。

本專案的特色：

詳細的 Jupyter 程式碼註釋：幫助學習者快速上手實踐。

精準的術語翻譯：譯者結合實際交流中的常用術語，提供更貼近實際應用的表達。

豐富的附加材料：包含拓展知識的資源，並對部分關鍵內容提供了原論文索引，便於快速理解與深入學習。

本專案所用的徽章來自網際網路，如有侵犯您的圖片版權，請聯絡我們刪除。

課程簡介

提到大型語言模型（LLMs），我們可能會將其視為獨立於傳統機器學習的領域，但實際上，LLMs 是機器學習的一個重要分支。在深度學習尚未廣泛應用之前，許多領域（如語音識別、自然語言處理、計算機視覺等）因需要大量專業知識應對複雜問題，機器學習的作用相對有限。然而，近年來深度學習的快速發展徹底改變了這一狀況，LLMs 成為推動人工智慧技術革命的關鍵力量。

在《LLMs-from-scratch》專案中，不僅關注 LLMs 的基礎構建（如 Transformer 架構、序列建模等），還深入探索了 GPT、BERT 等深度學習模型的底層實現。專案的每一部分都配備詳細的程式碼實現和學習資源，幫助學習者從零開始構建 LLMs，全面掌握其核心技術。

課程資源

– 英文原版地址：https://github.com/rasbt/LLMs-from-scratch.git

– 教材網址：https://amzn.to/4fqvn0D

– 漢化地址：https://github.com/MLNLP-World/LLMs-from-scratch-CN.git

此外，本課程還配備相應的程式碼實現，每章均提供完整的 Python 模型程式碼的 Jupyter 筆記本，所有資源均可線上免費獲取。

筆記目錄