Bài 8. Hướng dẫn nạp Firmware và cài tiếng việt cho Chatbot AI Xiaozhi

Chatbot AI Xiaozhi là một dự án mã nguồn mở giúp người dùng trải nghiệm trợ lý giọng nói thông minh ngay trên nền tảng phần cứng ESP32, với khả năng nhận lệnh, trò chuyện và điều khiển thiết bị IoT thông qua giao thức MCP (Model Control Protocol). Để chatbot Xiaozhi hoạt động, bạn cần nạp firmware thích hợp vào ESP32 và thiết lập ngôn ngữ tiếng Việt để giao tiếp dễ dàng hơn. Bài viết này Điện thông minh E-smart sẽ hướng dẫn chi tiết từng bước từ A đến Z.

Chuẩn bị phần cứng

Trước tiên, bạn cần chuẩn bị bộ thiết bị cơ bản:

  • Bo mạch Mini ESP32-S3-N16R8
  • Loa băng 4Ohm 2W
  • Màn hình Oled 0.96 inch hoặc TFT 1.54 inch dùng chíp ST7789
  • Cáp USB Type-C
Linh kiện phần cứng dùng làm chatbot ai xiaozhi tiếng việt

Tải firmware Xiaozhi

Bạn có thể tải firmware chính thức từ GitHub của dự án Xiaozhi: https://github.com/78/xiaozhi-esp32

Trong bài viết này mình đã chuẩn bị cho các bạn 2 Firmware Tiếng Việt ứng với kít Mini ESP32-S3-N16R8 (Tải Firmware tại đây).

Phiên bản dùng cho màn hình Oled 0.96 inch đi kèm với kít Mini ESP32-S3-N16R8

Board mini esp32-s3-n16r8 dùng cho chatbot ai xiaozhi

Phiên bản dùng cho màn hình TFT 1.54 inch ST7789 (cần trang bị và đấu nối thêm theo sơ đồ)

Board mini esp32-s3-n16r8 dùng cho chatbot ai xiaozhi

Nạp firmware cho ESP32 bằng Flash Download Tool

Mở phần mềm Flash Download Tool (Espressif cung cấp chính thức). Phần mềm này có kèm trong file Firmware ở trên.

  1. Mở phần mềm Flash download tool và chọn chipType là ESP32-S3
  2. Chọn file firmware .bin tương ứng với phiên bản cần dùng.
  3. Đặt địa chỉ nạp là 0x0.
  4. Chọn đúng cổng COM của ESP32 (nếu không thấy cổng COM thì ấn giữ nút IO0 và rồi ấn nút RST trên board)
  5. Nhấn Start để nạp.
Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Hiện chữ FINISH là đã nạp code hoàn tất. Bạn cần rút cáp kết nối cổng USB rồi cắm lại cho mạch khởi động lại.

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Kết nối Wi-Fi cho Xiaozhi

Sau khi boot, Xiaozhi sẽ vào chế độ cấu hình AP (Access Point).

Board mini esp32-s3-n16r8 dùng cho chatbot ai xiaozhi

Dùng điện thoại hoặc laptop, tìm Wi-Fi có tên dạng: XIAOZHI_XXXX

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Kết nối vào đó, rồi mở trình duyệt và truy cập: 192.168.4.1

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Chọn Wi-Fi nhà bạn và nhập mật khẩu để Xiaozhi tự động kết nối mạng. Sau khi hiển thị như hình bên dưới là hoàn thành bước thiết lập WiFi.

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Nếu muốn đổi lại Wi-Fi khác thì ta cần ấn nút RST rồi ấn nhanh nút IO0 trên board thì sẽ vào lại chế độ cấu hình Wi-Fi, lúc này có thể đổi lại thông tin Wi-Fi mới.

Thêm thiết bị vào server xiaozhi.me và thiết lập ngôn ngữ tiếng Việt

Đây là bước bắt buộc để thiết bị hoạt động đầy đủ với AI Xiaozhi Cloud.

Lấy mã xác thực từ thiết bị

Sau khi ESP32 khởi động lần đầu và kết nối Wi-Fi thành công, bạn sẽ thấy dòng thông báo chứa mã xác thực (Verification Code) — thường là 4 đến 6 ký tự.
Ghi lại mã này, bạn sẽ cần để thêm thiết bị vào hệ thống.

Board mini esp32-s3-n16r8 dùng cho chatbot ai xiaozhi

Đăng nhập vào XiaoZhi Console

Mở trình duyệt và truy cập: https://xiaozhi.me/console

Đăng nhập hoặc tạo tài khoản mới (qua số điện thoại hoặc tài khoản gmail). Mình sẽ đăng nhập bằng tài khoản gmail cho đơn giản.

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Thêm thiết bị mới

  1. Trong trang Console / Agents, chọn Add Device.
  2. Nhập mã xác thực mà thiết bị hiển thị.
  3. Nhấn Xác nhận / Confirm.
Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Nếu thành công, thiết bị sẽ xuất hiện trong danh sách của bạn trên Console / Agents

Thiết lập ngôn ngữ và giọng nói

Sau khi thiết bị được thêm vào, vào phần Configure Role.

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Đặt tên, chọn ngôn ngữ và thiết lập thông tin cho chatbot

Hướng dẫn nạp firmware tiếng việt cho chatbot ai xiaozhi

Sau khi thiết lập xong tất cả thì ấn vào nút SAVE để lưu lại thông tin. Sau đó ấn nút RST để khởi động lại board ESP32 lại là hoàn thành.

Lúc này bạn có thể ấn nút IO0 trên board để đánh thức và trò chuyện được với chatbot AI xiaozhi này bằng Tiếng Việt. Trong firmware này, mình đã thiết lập chức năng “Wake Word” cho chatbot xiaozhi này với cụm từ là “Hey, ily” hoặc “Hi, Lily” để có thể tự đánh thức mà không cần phải ấn nút IO0 trên board.

Kết luận

Với vài bước đơn giản, bạn đã có thể nạp lại firmware cho Chatbot AI Xiaozhi nói tiếng Việt trên ESP32. Nếu bạn muốn học sâu hơn cách mở rộng tính năng Xiaozhi (thêm module cảm biến, điều khiển thiết bị bằng giọng nói), hãy theo dõi kênh YouTube Điện thông minh E-smart để xem hướng dẫn chi tiết qua video thực tế.

4.5/5 - (8 bình chọn)

12 Bình luận

  1. tôi đa mua 1 mạch Ai , do em yêu khoa học quá nên nó đơ luôn,
    tôi đã dùng Command prompt để xóa FIMWARE CŨ VÀ CÀI LẠI THEO HƯỚNG DẪN …nhuneg sao mạch tôi đèn khởi động không sáng mạch không hoạt động….tôi đã cài fin ware cho màn hình 0.96 inch.
    xin hãy giúp đỡ,tư đầu tới cuối làm đúng hết, mà rút ra ghim voo mạch không sáng đèn

    • Bạn xem lại video trên bài viết này rồi làm lại từng bước theo hướng dẫn nhé, nạp firmware oled 0.96 xong thì rút hết điện ra rồi cắm lại mới được nha

  2. Admin có thể cho mình xin code của bản 1.54 tft để mình tuỳ chỉnh 1 số trong chi tiết trong đó rồi mình tự build lại fw được không ạ ?

    • Thực ra cái code này mình tải về từ trang chủ xiaozhi.me về, các bạn có thể lên đó tải về để chỉnh sửa lại theo ý muốn nhé.

  3. Cho em hỏi muốn đổi từ khoá wakeup thì phải làm sao ạ? Em không có kiến thức nhiều

    • Phải chỉnh lại trong phần setting của code mới được bạn ơi, dùng espidf mở source code của nó lên mới chỉnh lại được

  4. Mình đã làm theo video của bạn, đã thành công xin cảm ơn bạn rất nhiều. Mình vẫn còn 1 lỗi là con AI của mình không đánh thức bằng giọng nói được mà phải bấm nút. Mình dụng fw của màn ole nhé. Mong bạn giúp đỡ. Xin cảm ơn

    • Phần đánh thức bằng giọng nói này nó so sánh tần số của đoạn âm thanh offline nên đôi khi mình phải phát âm chuẩn và đúng tần số của dãy âm đó nó mới phát hiện được

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Tuyển sinh khóa Lập trình ESP32 căn bản K20, lớp 2-4-6 khai giảng ngày 05/12/2025. Học phí 1tr/khóa (12 buổi). Đăng ký qua zalo: 0919.890.938 (còn 5 suất)

X
Contact Me on Zalo