SEO Tools & Software

XML Sitemap Generator

Công cụ tạo file sitemap.xml tự động hoặc thủ công, liệt kê các URL quan trọng để gửi tới công cụ tìm kiếm.

4 lượt xem Cập nhật: 28/05/2026

XML Sitemap Generator là gì?

XML Sitemap Generator là công cụ giúp tạo file sitemap.xml — một tập tin văn bản định dạng XML liệt kê các URL quan trọng trên website, kèm thông tin như thời điểm cập nhật cuối, tần suất thay đổi và mức độ ưu tiên. Công cụ này có thể hoạt động tự động (quét toàn bộ trang web) hoặc thủ công (người dùng nhập URL từng trang), sau đó xuất ra file sitemap.xml chuẩn W3C và tuân thủ hướng dẫn của Google, Bing và các công cụ tìm kiếm lớn.

Tại sao quan trọng trong SEO?

File sitemap.xml không trực tiếp nâng thứ hạng, nhưng là cầu nối hiệu quả giữa website và công cụ tìm kiếm. Nó giúp bot thu thập dữ liệu (crawler) phát hiện nhanh các trang mới, trang ít liên kết nội bộ (orphan pages), hoặc trang nằm sâu trong cấu trúc website. Theo tài liệu chính thức của Google, sitemap đặc biệt hữu ích với:

  • Website mới chưa có nhiều liên kết ngoài
  • Trang chứa nội dung động (ví dụ: blog, sản phẩm theo bộ lọc)
  • Trang chỉ được liên kết qua JavaScript hoặc form (khó thu thập tự động)
  • Website có hàng nghìn trang mà cấu trúc liên kết phức tạp

Không có sitemap không khiến website bị phạt, nhưng thiếu nó có thể làm chậm quá trình lập chỉ mục — nhất là với nội dung giá trị cao nhưng chưa được phát hiện kịp thời.

Cách hoạt động

Hầu hết XML Sitemap Generator hoạt động theo một trong hai cơ chế:

  1. Quét tự động: Công cụ gửi yêu cầu HTTP đến trang chủ, sau đó lần theo thẻ <a href="...">, thẻ <link rel="canonical"> và sitemap con (nếu có), xây dựng cây URL. Một số công cụ nâng cao còn phân tích robots.txt, xử lý redirect (301/302), bỏ qua URL trùng lặp hoặc thuộc thư mục bị chặn.
  2. Nhập thủ công: Người dùng cung cấp danh sách URL (dạng text hoặc CSV), chọn ngày cập nhật, mức độ ưu tiên (priority) và tần suất thay đổi (changefreq). Công cụ sẽ đóng gói thành XML đúng chuẩn.

Mọi file sitemap.xml đều phải tuân thủ định dạng bắt buộc: bắt đầu bằng khai báo namespace xmlns="http://www.sitemaps.org/schemas/sitemap/0.9", mỗi URL nằm trong thẻ <url></url>, và giới hạn tối đa 50.000 URL / file, dung lượng tối đa 50 MB (nén). Nếu vượt, cần chia thành nhiều file và dùng sitemap index.

Hướng dẫn thực hiện

Dưới đây là quy trình tạo và triển khai sitemap.xml bằng công cụ miễn phí phổ biến (ví dụ: Screaming Frog SEO Spider hoặc công cụ online như XML-Sitemaps.com):

  1. Bước 1 – Chọn phương pháp: Với website nhỏ (<500 trang), dùng công cụ online. Với website lớn hoặc cần kiểm soát cao (có trang thành viên, admin), nên dùng phần mềm desktop hoặc plugin CMS (như Yoast SEO cho WordPress).
  2. Bước 2 – Nhập URL gốc: Điền địa chỉ trang chủ (ví dụ: https://example.com). Đảm bảo không có dấu gạch chéo thừa (https://example.com/ là hợp lệ, https://example.com// thì không).
  3. Bước 3 – Cấu hình quét: Tắt tùy chọn “crawl subdomains” nếu không cần; chọn độ sâu quét (thường 5–7 cấp); loại trừ thư mục không cần lập chỉ mục (ví dụ: /admin/, /wp-includes/).
  4. Bước 4 – Xuất file: Sau khi quét xong, nhấn “Generate Sitemap”. Lưu file dưới tên sitemap.xml ở thư mục gốc (cùng cấp với robots.txt).
  5. Bước 5 – Kiểm tra & gửi: Mở file bằng trình duyệt hoặc validator như XML-Sitemaps Validator. Sau đó gửi trực tiếp vào Google Search Console và Bing Webmaster Tools.

Lỗi thường gặp

Dưới đây là 4 lỗi phổ biến và cách khắc phục:

Lỗi Nguyên nhân Cách sửa
URL không tồn tại (404 trong sitemap) Trang đã xóa nhưng vẫn nằm trong sitemap Cập nhật lại sitemap sau mỗi lần xóa/trình bày lại nội dung; dùng plugin tự động đồng bộ (ví dụ: Rank Math tự loại bỏ URL 404)
Sitemap trả về mã 403 hoặc 401 File bị chặn bởi .htaccess, tường lửa hoặc quyền truy cập server Kiểm tra permissions (nên để 644); đảm bảo không có rule deny trong .htaccess; thử truy cập trực tiếp https://example.com/sitemap.xml
URL bị ghi sai định dạng Dùng HTTP thay vì HTTPS, thiếu dấu gạch chéo cuối (tùy trường hợp), hoặc có ký tự đặc biệt chưa được encode Dùng hàm urlencode() cho tham số; đảm bảo tất cả URL trong sitemap dùng cùng giao thức và phiên bản (www/non-www)
Google báo “Sitemap không hợp lệ” Thiếu thẻ bắt buộc (<loc>), thẻ đóng sai, hoặc dùng ký tự Unicode không hỗ trợ Mở file bằng Notepad++ → chuyển sang encoding UTF-8 không BOM; kiểm tra thẻ mở/đóng bằng trình validator

Ví dụ thực tế

Một cửa hàng điện máy có 12.000 sản phẩm, cấu trúc phân loại theo thương hiệu → dòng sản phẩm → model. Nhiều trang sản phẩm chỉ xuất hiện khi người dùng lọc qua JavaScript, không có liên kết tĩnh từ trang chủ. Trước đây, Google chỉ lập chỉ mục ~3.000 trang. Sau khi dùng Screaming Frog để quét toàn bộ danh mục (kích hoạt JavaScript rendering), xuất sitemap.xml gồm 11.200 URL, thêm thẻ <lastmod> cập nhật theo ngày nhập kho, và gửi lên Search Console — trong vòng 10 ngày, số trang được lập chỉ mục tăng lên 9.800, lượng traffic từ tìm kiếm tăng 37% (theo báo cáo Search Console tháng 4/2024).

Câu hỏi thường gặp

Sitemap.xml có cần cập nhật thường xuyên không?

Có. Với website thường xuyên đăng bài (blog, tin tức) hoặc cập nhật sản phẩm, nên tạo lại sitemap mỗi lần xuất bản nội dung mới. Một số hệ thống tự động sinh sitemap mỗi giờ (tùy cấu hình). Với website tĩnh, cập nhật mỗi tháng là đủ.

Có thể có nhiều sitemap.xml trên cùng một miền không?

Không — chỉ được đặt duy nhất một file sitemap.xml ở thư mục gốc. Tuy nhiên, bạn có thể có nhiều file sitemap con (ví dụ: sitemap-posts.xml, sitemap-products.xml) và tập hợp chúng trong một sitemap index (sitemap-index.xml), rồi gửi index này vào Search Console.

XML Sitemap Generator có hỗ trợ đa ngôn ngữ không?

Có thể thay đổi. Một số công cụ cao cấp (như DeepCrawl, Sitebulb) nhận diện thẻ <link rel="hreflang"> và đưa vào sitemap đúng định dạng. Với công cụ đơn giản, bạn cần thêm thủ công các phiên bản ngôn ngữ theo chuẩn hreflang trong sitemap.