international sitemap
Sitemap mở rộng chứa các URL kèm thuộc tính hreflang, giúp công cụ tìm kiếm hiểu cấu trúc đa ngôn ngữ.
international sitemap là gì?
International sitemap (bản đồ trang quốc tế) là một tập tin XML mở rộng của sitemap chuẩn, chứa danh sách các URL của website kèm theo các thuộc tính hreflang — giúp công cụ tìm kiếm hiểu rõ mối quan hệ ngôn ngữ và khu vực địa lý giữa các phiên bản trang. Khác với sitemap thông thường chỉ liệt kê URL, international sitemap còn khai báo rõ phiên bản nào dành cho người dùng tiếng Anh tại Mỹ (en-US), phiên bản nào dành cho tiếng Việt tại Việt Nam (vi-VN), hoặc tiếng Tây Ban Nha tại Mexico (es-MX)…
Tập tin này không thay thế sitemap gốc mà bổ sung thông tin định hướng quốc tế, thường được gửi riêng qua Google Search Console hoặc liên kết trong robots.txt.
Tại sao quan trọng trong SEO?
Khi một website phục vụ nhiều quốc gia/ngôn ngữ, việc thiếu cấu trúc rõ ràng dễ khiến công cụ tìm kiếm:
- Hiểu sai phiên bản nào là chính — dẫn đến hiển thị kết quả không phù hợp cho người dùng;
- Đánh đồng các trang giống nhau (ví dụ: trang tiếng Anh Mỹ và tiếng Anh Anh) thành nội dung trùng lặp;
- Bỏ sót khả năng xếp hạng ở thị trường mục tiêu do thiếu tín hiệu địa phương.
International sitemap cung cấp tín hiệu rõ ràng, đáng tin cậy cho Google và Bing về cách phân biệt các phiên bản — từ đó cải thiện độ chính xác trong việc phân phối kết quả tìm kiếm theo ngôn ngữ và vị trí người dùng. Đây là yếu tố hỗ trợ trực tiếp cho chiến lược International SEO, đặc biệt khi kết hợp với thẻ hreflang trong HTML và cấu hình khu vực trong Search Console.
Cách hoạt động
International sitemap hoạt động như một bản “danh bạ đa ngôn ngữ” gửi tới công cụ tìm kiếm. Khi thu thập dữ liệu (crawling), bot của Google đọc tập tin và so sánh các thuộc tính hreflang trong sitemap với những gì đã thấy trên trang (thẻ <link rel="alternate" hreflang="...">) và cấu hình miền (ví dụ: .vn, .de). Nếu các tín hiệu nhất quán, Google sẽ ưu tiên hiển thị phiên bản phù hợp với ngôn ngữ và vị trí của người tìm kiếm.
Lưu ý: International sitemap không phải là yếu tố xếp hạng — nhưng là công cụ hỗ trợ kỹ thuật giúp Google hiểu đúng cấu trúc, giảm rủi ro nhầm lẫn và tăng tốc độ nhận diện phiên bản quốc tế.
Hướng dẫn thực hiện
Dưới đây là các bước triển khai international sitemap đúng kỹ thuật:
- Xác định đầy đủ các phiên bản quốc tế: Liệt kê từng cặp ngôn ngữ – khu vực (ví dụ:
vi-VN,en-GB,ja-JP), đảm bảo mỗi phiên bản có URL riêng biệt (không dùng tham số như?lang=vi). - Tạo sitemap XML mở rộng: Mỗi URL trong sitemap cần có ít nhất một thẻ
<url>con chứa<loc>và các thẻ<xhtml:link rel="alternate" hreflang="..." href="..." />tương ứng với tất cả phiên bản liên quan. - Đảm bảo tính nhất quán: Tất cả phiên bản phải liên kết chéo đầy đủ — nếu trang A có hreflang trỏ tới B và C, thì B và C cũng phải trỏ lại A và nhau.
- Upload và thông báo: Đặt sitemap tại thư mục gốc (ví dụ:
/sitemap-intl.xml), thêm dòng vàorobots.txt:Sitemap: https://example.com/sitemap-intl.xml, rồi gửi thủ công qua Google Search Console. - Giám sát định kỳ: Kiểm tra báo cáo “International targeting” trong Search Console để phát hiện cảnh báo hreflang bị thiếu hoặc mâu thuẫn.
Lỗi thường gặp
Dưới đây là những sai lầm phổ biến và cách khắc phục:
| Lỗi | Hệ quả | Cách sửa |
|---|---|---|
| Thiếu hreflang tự tham chiếu (self-reference) | Google không xác định được phiên bản mặc định | Thêm thẻ <xhtml:link rel="alternate" hreflang="vi-VN" href="https://example.com/vi/" /> trong chính trang vi-VN |
Dùng mã ngôn ngữ không chuẩn (ví dụ: vn thay vì vi-VN) |
Hreflang bị bỏ qua hoàn toàn | Dùng mã theo chuẩn BCP 47: ngôn ngữ + vùng (2 chữ cái + 2 chữ cái), ví dụ fr-FR, pt-BR |
| URL trong hreflang trả về mã trạng thái 404 hoặc chuyển hướng | Tín hiệu bị coi là không đáng tin cậy | Kiểm tra toàn bộ URL bằng công cụ như Screaming Frog; đảm bảo mọi đường dẫn trả về 200 và không redirect vòng |
Ví dụ thực tế
Dưới đây là đoạn mã international sitemap mẫu cho trang chủ của một thương hiệu có 3 phiên bản:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml">
<url>
<loc>https://example.com/vi/</loc>
<xhtml:link rel="alternate" hreflang="vi-VN" href="https://example.com/vi/" />
<xhtml:link rel="alternate" hreflang="en-US" href="https://example.com/en/" />
<xhtml:link rel="alternate" hreflang="ja-JP" href="https://example.com/ja/" />
</url>
<url>
<loc>https://example.com/en/</loc>
<xhtml:link rel="alternate" hreflang="vi-VN" href="https://example.com/vi/" />
<xhtml:link rel="alternate" hreflang="en-US" href="https://example.com/en/" />
<xhtml:link rel="alternate" hreflang="ja-JP" href="https://example.com/ja/" />
</url>
</urlset>
Mỗi <url> đại diện cho một phiên bản, và tất cả đều liên kết chéo đầy đủ — đảm bảo Google hiểu đây là ba phiên bản khác nhau của cùng nội dung cốt lõi.
Câu hỏi thường gặp
international sitemap có bắt buộc phải dùng không?
Không bắt buộc — nhưng rất khuyến khích nếu website có từ 2 phiên bản ngôn ngữ/khu vực trở lên. Khi kết hợp với thẻ hreflang trong HTML và cấu hình Search Console, nó tạo ra lớp tín hiệu mạnh và ổn định hơn so với dùng riêng lẻ một phương pháp.
Có thể gộp international sitemap vào sitemap chính không?
Có thể, nhưng không nên. Việc tách riêng giúp dễ quản lý, kiểm tra và cập nhật. Google hỗ trợ nhiều sitemap — miễn là chúng được khai báo đúng trong robots.txt hoặc Search Console. Nếu gộp chung, kích thước sitemap có thể vượt quá giới hạn 50MB hoặc 50.000 URL — tùy trường hợp.
Cần cập nhật international sitemap khi nào?
Mỗi khi thêm, xóa hoặc thay đổi URL của bất kỳ phiên bản quốc tế nào — ví dụ: ra mắt thị trường mới (tiếng Thái tại Thái Lan), đổi cấu trúc URL (từ /fr/ sang /fr-fr/), hoặc ngừng hỗ trợ một ngôn ngữ. Thời gian cập nhật nên diễn ra đồng thời với việc triển khai thay đổi trên website.