
1
專案動機
專案動機
之前社群釋出了《LLMs-from-scratch》專案中文翻譯版本V1.0。本次,社群更新了該專案,增加了所有額外材料的翻譯。額外材料對原專案的每個章節都增加了較為詳細的資源介紹,可以進行良好的補充。
由於個人能力有限,翻譯中可能存在不足之處,歡迎提出寶貴意見並多多包涵。希望透過這一翻譯專案,能幫助更多中文學習者受益,同時為國內社群的 LLM 學習和研究貢獻一份力量。
本專案的特色:
詳細的 Jupyter 程式碼註釋:幫助學習者快速上手實踐。 精準的術語翻譯:譯者結合實際交流中的常用術語,提供更貼近實際應用的表達。 豐富的附加材料:包含拓展知識的資源,並對部分關鍵內容提供了原論文索引,便於快速理解與深入學習。
本專案所用的徽章來自網際網路,如有侵犯您的圖片版權,請聯絡我們刪除。
課程簡介
提到大型語言模型(LLMs),我們可能會將其視為獨立於傳統機器學習的領域,但實際上,LLMs 是機器學習的一個重要分支。在深度學習尚未廣泛應用之前,許多領域(如語音識別、自然語言處理、計算機視覺等)因需要大量專業知識應對複雜問題,機器學習的作用相對有限。然而,近年來深度學習的快速發展徹底改變了這一狀況,LLMs 成為推動人工智慧技術革命的關鍵力量。
在 《LLMs-from-scratch》專案中,不僅關注 LLMs 的基礎構建(如 Transformer 架構、序列建模等),還深入探索了 GPT、BERT 等深度學習模型的底層實現。專案的每一部分都配備詳細的程式碼實現和學習資源,幫助學習者從零開始構建 LLMs,全面掌握其核心技術。
課程資源
– 英文原版地址:https://github.com/rasbt/LLMs-from-scratch.git
– 教材網址:https://amzn.to/4fqvn0D
– 漢化地址:https://github.com/MLNLP-World/LLMs-from-scratch-CN.git
此外,本課程還配備相應的程式碼實現,每章均提供完整的 Python 模型程式碼的 Jupyter 筆記本,所有資源均可線上免費獲取。
額外材料目錄

筆記預覽



專案地址

關於我們
