DeepSeek塞進小盒子?ESP32微型AI伴侶開發指南!

今天要給大家介紹的,是一個充滿趣味與挑戰的開源專案 —— 小智 AI 聊天機器人。

一、小智簡介

小智 AI 聊天機器人是蝦哥開發的開源專案,以 MIT 許可證釋出:
https://github.com/78/xiaozhi-esp32

這個專案旨在幫助更多人踏入 AI 硬體開發的大門,讓我們瞭解如何將當下熱門的大語言模型應用到實際硬體裝置中。
麵包板效果:

已經支援的開源硬體:
  • 立創·實戰派 ESP32-S3 開發板
  • 樂鑫 ESP32-S3-BOX3
  • M5Stack CoreS3
  • AtomS3R + Echo Base
  • AtomMatrix + Echo Base
  • 神奇按鈕 2.4
  • 微雪電子 ESP32-S3-Touch-AMOLED-1.8
  • LILYGO T-Circle-S3
  • 蝦哥 Mini C3
  • Moji 小智AI衍生版
  • 璀璨·AI吊墜
  • 無名科技Nologo-星智-1.54TFT
  • 無名科技Nologo-星智-0.96TFT
  • SenseCAP Watcher

二、小智已實現功能

  • 多樣聯網方式:支援 Wi-Fi 和 ML307 Cat.1 4G 聯網。
  • 便捷喚醒與打斷:BOOT 鍵喚醒和打斷,支援點選和長按兩種觸發方式,還具備離線語音喚醒 ESP – SR 功能,操作簡單又高效,能即時打斷對話,就像和真人聊天一樣自然。
  • 強大的語音互動:實現流式語音對話,支援國語、粵語、英語、日語、韓語 5 種語言識別。
  • 優質大模型加持:集成了大模型 TTS(火山引擎或 CosyVoice)和大模型 LLM(Qwen, DeepSeek, Doubao),擁有可配置的提示詞和音色,還具備短期記憶功能,每輪對話後能自我總結,讓對話更加連貫和智慧。
  • 豐富的顯示功能:OLED/LCD 顯示屏不僅能顯示訊號強弱,還能展示對話內容,甚至支援 LCD 顯示圖片表情,為你的聊天增添更多樂趣。

三、硬體支援

專案支援多種開源硬體,從立創・實戰派 ESP32 – S3 開發板,到樂鑫 ESP32 – S3 – BOX3、M5Stack CoreS3 等,滿足不同開發者的需求。
而且,它還支援麵包板手工製作,對於想要親手實踐的朋友來說,是個絕佳的機會。
詳細教程可在飛書文件《小智 AI 聊天機器人百科全書》中檢視,即使是硬體小白,也能輕鬆上手。
https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb

四、開發環境與智慧體配置

  • Cursor 或 VSCode
  • 安裝 ESP-IDF 外掛,選擇 SDK 版本 5.3 或以上
  • Linux 比 Windows 更好,編譯速度快,也免去驅動問題的困擾
  • 使用 Google C++ 程式碼風格,提交程式碼時請確保符合規範
如果我們已經擁有一個小智 AI 聊天機器人裝置,可以登入 xiaozhi.me 控制檯進行配置。
同時,專案還提供了詳細的 WebSocket 通訊協議文件,對於想要在個人電腦上部署伺服器的朋友,可以參考:
https://github.com/78/xiaozhi-esp32/blob/main/docs/websocket.md

五、Linux版本小智

百問網團隊最近也在嵌入式Linux平臺上進行適配,專案連結:
https://github.com/100askTeam/xiaozhi-linux
已支援硬體列表:
  • 100ASK_T113s3-PRO Tina4系統 : 100ASK_T113s3-Pro_Tina4
  • 100ASK_T113s3-PRO Tina5系統: 100ASK-T113s3-Pro_Tina5
  • DongshanPI-AICT Tina4系統 : DongshanPI-AICT
  • 100ASK_IMX6ULL-PRO Buildroot20系統 : 100ASK_IMX6ULL-PRO
感興趣的朋友可以去玩一玩。無論是從學習技術,還是從享受趣味科技的角度來看,都非常值得一試。

相關文章