
1
專案動機
專案動機
原專案地址:https://github.com/rasbt/LLMs-from-scratch.git
本專案是對 GitHub 專案 《LLMs-from-scratch》的中文翻譯,包括詳細的 Markdown 筆記和相關的 Jupyter 程式碼。翻譯過程中,我們儘量保持原意的準確性,同時優化了部分語序和表達方式,以更貼閤中文學習者的閱讀習慣。需要特別說明的是,原作者為該專案的主要貢獻者,本漢化版本僅作為學習輔助資料,未對原內容進行修改或延伸。
由於個人能力有限,翻譯中可能存在不足之處,歡迎提出寶貴意見並多多包涵。希望透過這一翻譯專案,能幫助更多中文學習者受益,同時為國內社群的 LLM 學習和研究貢獻一份力量。
本專案的特色:
詳細的 Jupyter 程式碼註釋:幫助學習者快速上手實踐。 精準的術語翻譯:譯者結合實際交流中的常用術語,提供更貼近實際應用的表達。 豐富的附加材料:包含拓展知識的資源,並對部分關鍵內容提供了原論文索引,便於快速理解與深入學習。
本專案所用的徽章來自網際網路,如有侵犯您的圖片版權,請聯絡我們刪除。
課程簡介
提到大型語言模型(LLMs),我們可能會將其視為獨立於傳統機器學習的領域,但實際上,LLMs 是機器學習的一個重要分支。在深度學習尚未廣泛應用之前,許多領域(如語音識別、自然語言處理、計算機視覺等)因需要大量專業知識應對複雜問題,機器學習的作用相對有限。然而,近年來深度學習的快速發展徹底改變了這一狀況,LLMs 成為推動人工智慧技術革命的關鍵力量。
在 《LLMs-from-scratch》專案中,不僅關注 LLMs 的基礎構建(如 Transformer 架構、序列建模等),還深入探索了 GPT、BERT 等深度學習模型的底層實現。專案的每一部分都配備詳細的程式碼實現和學習資源,幫助學習者從零開始構建 LLMs,全面掌握其核心技術。
課程資源
– 英文原版地址:https://github.com/rasbt/LLMs-from-scratch.git
– 教材網址:https://amzn.to/4fqvn0D
– 漢化地址:https://github.com/MLNLP-World/LLMs-from-scratch-CN.git
此外,本課程還配備相應的程式碼實現,每章均提供完整的 Python 模型程式碼的 Jupyter 筆記本,所有資源均可線上免費獲取。
筆記目錄

筆記預覽
《第二章: 文字資訊處理》部分預覽

專案地址

關於我們
