Sitemaps
Danh sách các URL được gửi thủ công hoặc tự động để hỗ trợ Google hiểu cấu trúc và ưu tiên lập chỉ mục.
Sitemaps là gì?
Sitemaps (bản đồ trang web) là tập tin văn bản định dạng XML hoặc TXT liệt kê các URL quan trọng trên website, kèm thông tin như thời điểm cập nhật gần nhất, tần suất thay đổi và mức độ ưu tiên so với các trang khác. Đây là cách bạn chủ động giới thiệu cấu trúc nội dung với Google và các công cụ tìm kiếm — không phải để thay thế việc thu thập tự nhiên (crawling), mà để hỗ trợ quá trình lập chỉ mục chính xác và hiệu quả hơn.
Tại sao quan trọng trong SEO?
Sitemaps không trực tiếp nâng thứ hạng, nhưng ảnh hưởng mạnh đến khả năng Google phát hiện, thu thập và lập chỉ mục đúng trang — đặc biệt với website mới, trang ít liên kết nội bộ, hoặc nội dung động (như blog, sản phẩm theo bộ lọc). Khi Google hiểu rõ cấu trúc, tỷ lệ trang được lập chỉ mục tăng, giảm rủi ro bỏ sót trang quan trọng như trang danh mục sâu, bài viết cũ có giá trị, hoặc trang không có backlink bên ngoài.
Theo tài liệu chính thức của Google: Sitemaps giúp công cụ tìm kiếm biết được những trang nào bạn muốn lập chỉ mục, và cung cấp dữ liệu bổ sung để đánh giá mức độ ưu tiên. Tuy nhiên, việc đưa URL vào sitemap không đảm bảo rằng Google sẽ lập chỉ mục trang đó — điều này còn phụ thuộc vào chất lượng nội dung, trải nghiệm người dùng và các yếu tố kỹ thuật khác.
Cách hoạt động
Khi bạn gửi sitemap qua Google Search Console (GSC), Google sẽ:
- Đọc toàn bộ danh sách URL trong tập tin;
- So sánh với dữ liệu crawling hiện tại (trang đã thu thập, trang bị chặn bởi robots.txt, trang trả mã lỗi...);
- Cập nhật lịch trình thu thập dựa trên thông tin
<lastmod>,<changefreq>và<priority>(nếu có); - Gửi báo cáo trạng thái trong GSC: số URL hợp lệ, cảnh báo, lỗi và tiến trình lập chỉ mục từng URL.
Lưu ý: Giá trị <priority> chỉ áp dụng trong phạm vi cùng một sitemap — không so sánh giữa các sitemap khác nhau. Google cũng không sử dụng <changefreq> để điều chỉnh tần suất thu thập thực tế, mà chỉ dùng làm tham khảo.
Hướng dẫn thực hiện
Dưới đây là quy trình triển khai sitemap chuẩn cho website Việt Nam:
- Tạo sitemap: Dùng plugin (WordPress: Yoast SEO, Rank Math), công cụ online (XML-Sitemaps.com), hoặc script tự viết. Với website lớn (>50.000 URL), chia thành nhiều sitemap con và dùng sitemap index để quản lý.
- Đặt đúng vị trí: Lưu tập tin tại gốc miền (ví dụ:
https://example.com/sitemap.xml). Nếu dùng nhiều loại (blog, sản phẩm), đặt theo thư mục rõ ràng (ví dụ:/sitemap-posts.xml,/sitemap-products.xml). - Liên kết trong robots.txt: Thêm dòng
Sitemap: https://example.com/sitemap.xmlvào cuối tập tinrobots.txt. Đây là cách phổ biến nhất để Google phát hiện tự động. - Gửi thủ công qua GSC: Vào Indexing > Sitemaps, nhập đường dẫn sitemap → nhấn Submit. Chỉ gửi sitemap gốc (không gửi sitemap index nếu đã gửi các sitemap con riêng lẻ).
- Giám sát định kỳ: Kiểm tra tab Sitemaps trong GSC mỗi tuần để phát hiện lỗi, cảnh báo hoặc URL bị từ chối lập chỉ mục.
Lỗi thường gặp
Dưới đây là 4 lỗi phổ biến và cách xử lý:
| Lỗi | Nguyên nhân | Cách khắc phục |
|---|---|---|
| URL bị chặn bởi robots.txt | Trang nằm trong sitemap nhưng bị cấm thu thập qua robots.txt |
Sửa robots.txt hoặc gỡ URL khỏi sitemap nếu không cần lập chỉ mục |
| URL trả mã 404 / 5xx | Trang đã xóa hoặc lỗi máy chủ | Cập nhật sitemap định kỳ; dùng redirect 301 nếu trang chuyển địa chỉ |
| URL không tồn tại trong sitemap index | Gửi sitemap con nhưng quên thêm vào sitemap index | Kiểm tra lại cấu trúc sitemap index, đảm bảo tất cả <sitemap> đều đúng định dạng và khả dụng |
| Định dạng XML sai cú pháp | Thiếu thẻ đóng, ký tự đặc biệt chưa được escape (& → &) | Dùng trình kiểm tra XML như W3C Markup Validation trước khi gửi |
Ví dụ thực tế
Một website bán hàng điện máy tại Việt Nam có 12.000 sản phẩm, 800 bài blog và 40 trang danh mục. Trước khi dùng sitemap:
- Chỉ 62% sản phẩm được lập chỉ mục (theo báo cáo GSC);
- Nhiều bài blog cũ không xuất hiện trong kết quả tìm kiếm dù có từ khóa phù hợp.
Sau khi triển khai:
- Tạo 3 sitemap riêng:
/sitemap-products.xml(dành riêng cho sản phẩm),/sitemap-posts.xml(blog),/sitemap-pages.xml(trang tĩnh); - Thêm tất cả vào
/sitemap-index.xmlvà khai báo trongrobots.txt; - Gửi từng sitemap qua GSC và theo dõi trong 14 ngày.
Kết quả: Tỷ lệ sản phẩm được lập chỉ mục tăng lên 94%, thời gian trung bình để bài blog mới xuất hiện trong tìm kiếm giảm từ 17 ngày xuống còn 5–7 ngày.
Câu hỏi thường gặp
Sitemap có cần cập nhật thường xuyên không?
Có. Với website thường xuyên đăng bài hoặc cập nhật sản phẩm, nên tạo sitemap tự động (qua plugin hoặc cron job) và gửi lại khi có thay đổi lớn. Với website tĩnh, cập nhật thủ công mỗi tháng là đủ.
Một website có thể có bao nhiêu sitemap?
Google cho phép tối đa 50.000 URL mỗi sitemap và 50.000 sitemap trong một sitemap index. Với website vừa và nhỏ ở Việt Nam, 1–3 sitemap là phù hợp. Số lượng cụ thể tùy trường hợp.
Có nên gửi sitemap cho trang không muốn lập chỉ mục (như trang đăng nhập, thanh toán)?
Không. Chỉ đưa vào sitemap những trang bạn muốn người dùng tìm thấy qua Google. Trang nhạy cảm hoặc không có giá trị tìm kiếm nên bị loại trừ — đồng thời chặn bằng robots.txt hoặc thẻ noindex.