自己電腦搭建AI大模型詳細教程，支援通義千問、Llama3、介面呼叫等…

你好，我是郭震

今天教程關於在自己電腦搭建大模型，支援開源的大模型，像主流的通義千問2.5，Llama3，教程還包括如何使用這些大模型做介面呼叫，實現自動化輸出。

如下圖所示，這是我自己的電腦安裝的兩個AI大模型，一個是qwen 7b尺寸，另一個是llama3 8b尺寸：

本地部署大模型有哪些好處呢？

首先，因為這些大模型都是開源的，安裝在自己的電腦上也是免費使用的，如下圖所示啟動qwen7b後，我可以直接在命令視窗提問它，全球各地有記載的歷史最低溫度是多少？，後面是qwen的回覆：

其次，安裝大模型在自己電腦除了我們可以直接免費使用它外，還有一個很大的好處，就是我們可以結合自己的私有檔案系統，打造一個大模型+個人知識庫的AI系統，既保護了個人資料隱私，也讓AI「更懂你」。

大模型的一些基本知識科普

可能點進來看我這篇文章的朋友，有不同行業、不同專業的，可能對一些大模型的基本概念不太瞭解，下面就先做一個基本梳理。

其中比較重要的比如qwen7b, llama8b，這裡的7b、8b代表什麼？

b是英文的billion，意思是十億，7b就是70億，8b就是80億，70億、80億是指大模型的神經元引數（權重引數 weight+bias）的總量。目前大模型都是基於Transformer架構，並且是很多層的Transformer結構，最後還有全連線層等，所有引數加起來70億，80億，還有的上千億。

大模型和我們自己基於某個特定資料集（如 ImageNet、20NewsGroup）訓練的模型在本質上存在一些重要區別。主要區別之一在於，大模型通常更加通用，這是因為它們基於大量多樣化的資料集進行訓練，涵蓋了不同領域和任務的資料。這種廣泛的學習使得大模型具備了較強的知識遷移能力和多工處理能力，從而展現出“無所不知、無所不曉”的特性。

相比之下，我們基於單一資料集訓練的模型通常具有較強的針對性，但其知識範圍僅限於該資料集的領域或問題。因此，這類模型的應用範圍較為侷限，通常只能解決特定領域或單一任務的問題。

Scaling Laws這個詞大家可能在很多場合都見到過。它是一個什麼法則呢？

大模型之所以能基於大量多樣化的資料集進行訓練，並最終“學得好”，核心原因之一是Scaling Laws（擴充套件規律）的指導和模型自身架構的優勢。Scaling Laws指出引數越多，模型學習能力越強；訓練資料規模越大、越多元化，模型最後就會越通用；即使包括噪聲資料，模型仍能透過擴充套件規律提取出通用的知識。而Transformer這種架構正好完美做到了Scaling Laws，Transformer就是自然語言處理領域實現擴充套件規律的最好的網路結構。

知道這些基本知識後，我們回到安裝大模型到本地步驟上。一共只需要三步就能做到和大模型在本地會話。

第一步

，我使用的是ollama管理各種不同大模型，當然還有其他工具，不過ollama是比較直接、比較乾淨的，如下所示，一鍵下載後安裝就行了，安裝過程基本都是下一步：