international canonicalization
Áp dụng rel="canonical" giữa các phiên bản quốc tế để chỉ định phiên bản gốc khi có nội dung tương tự nhưng khác ngôn ngữ/khu vực.
international canonicalization là gì?
International canonicalization (chuẩn hóa liên quốc gia) là việc dùng thẻ rel="canonical" để chỉ rõ phiên bản gốc của một trang khi có nhiều phiên bản tương tự nhau về nội dung nhưng khác ngôn ngữ hoặc khu vực địa lý — ví dụ: trang tiếng Anh cho Mỹ, tiếng Anh cho Anh Quốc, tiếng Tây Ban Nha cho Tây Ban Nha và Mexico.
Khác với hreflang (dùng để báo với Google rằng các trang là bản dịch/nội dung dành riêng cho nhóm người dùng cụ thể), international canonicalization chỉ nên áp dụng khi các trang thực sự có nội dung gần như giống hệt nhau, chỉ khác chút về đơn vị tiền tệ, cách viết ngày tháng, hay tên sản phẩm địa phương — chứ không phải khi nội dung đã được dịch đầy đủ và điều chỉnh theo văn hóa.
Tại sao quan trọng trong SEO?
Khi nhiều trang có nội dung trùng lặp hoặc gần trùng lặp giữa các quốc gia, công cụ tìm kiếm có thể:
- Không biết trang nào nên xếp hạng — dẫn đến phân tán tín hiệu liên kết và lượt click;
- Chọn sai phiên bản làm đại diện — ví dụ: hiển thị trang tiếng Đức cho người dùng ở Việt Nam;
- Giảm độ tin cậy của toàn bộ cấu trúc quốc tế do xung đột tín hiệu.
Việc dùng rel="canonical" đúng giúp tập trung toàn bộ giá trị SEO (backlink, thời gian ở trang, tỷ lệ thoát…) vào một phiên bản duy nhất — thường là phiên bản tiếng Anh chuẩn (US) hoặc phiên bản có độ phủ và uy tín cao nhất. Điều này đặc biệt hữu ích khi doanh nghiệp chưa đủ nguồn lực để tối ưu từng phiên bản riêng biệt.
Cách hoạt động
Thẻ <link rel="canonical" href="https://example.com/en-us/product" /> gửi tín hiệu rõ ràng tới Google rằng: "Dù bạn đang xem trang /es-mx/product hay /fr-fr/product, thì phiên bản /en-us/product mới là phiên bản chính".
Lưu ý quan trọng:
- Google không bắt buộc tuân theo thẻ canonical — đây chỉ là gợi ý. Nhưng nếu cấu trúc rõ ràng và nhất quán, xác suất Google tuân thủ rất cao.
- Thẻ canonical không thay thế hreflang. Hai thẻ này bổ trợ nhau:
hreflangnói "đây là bản cho ai", còncanonicalnói "đây là bản gốc". - Không được đặt
canonicaltrỏ về một trang khác ngôn ngữ mà lại không có thẻhreflangngược lại — sẽ gây mâu thuẫn tín hiệu.
Hướng dẫn thực hiện
- Xác định phiên bản gốc: Chọn một phiên bản làm chuẩn — thường là tiếng Anh (US), hoặc phiên bản có lượng traffic, backlink và độ phủ cao nhất. Không chọn phiên bản có nội dung thiếu, chưa hoàn thiện.
- Kiểm tra mức độ trùng lặp: Dùng công cụ như Screaming Frog hoặc DeepCrawl để so sánh nội dung giữa các phiên bản. Nếu độ tương đồng nội dung >90% (ngoại trừ yếu tố địa phương), có thể cân nhắc canonical.
- Thêm thẻ canonical vào <head>: Mỗi trang quốc tế (trừ phiên bản gốc) phải trỏ về URL gốc. Ví dụ:
<link rel="canonical" href="https://example.com/en-us/shoes" /> - Bổ sung hreflang đầy đủ: Tất cả phiên bản phải có thẻ
hreflanghai chiều. Ví dụ: trang/en-us/phải khai báohreflang="es-mx", và trang/es-mx/phải khai báohreflang="en-us". - Kiểm thử bằng công cụ: Dùng URL Inspection Tool trong Google Search Console để xác nhận Google nhận đúng tín hiệu.
Lỗi thường gặp
| Lỗi | Hệ quả | Cách khắc phục |
|---|---|---|
| Đặt canonical trỏ về phiên bản khác ngôn ngữ nhưng thiếu hreflang | Google bỏ qua cả canonical và hreflang — coi các trang là trùng lặp không kiểm soát | Bổ sung đầy đủ thẻ hreflang trên mọi phiên bản, đảm bảo tính hai chiều và đầy đủ tất cả biến thể |
| Dùng canonical cho nội dung đã dịch kỹ và khác biệt rõ ràng | Mất cơ hội xếp hạng ở thị trường mục tiêu — Google không hiển thị phiên bản địa phương | Ngừng dùng canonical; thay vào đó, tối ưu riêng từng phiên bản + hreflang |
| Canonical vòng tròn (A → B → A) | Google từ chối xử lý cả hai thẻ — dẫn đến trùng lặp nghiêm trọng | Kiểm tra toàn bộ cấu trúc bằng crawler; đảm bảo mọi canonical đều trỏ về một URL duy nhất, không có chuỗi vòng |
Ví dụ thực tế
Một thương hiệu phần mềm SaaS có 4 phiên bản trang giới thiệu tính năng:
https://app.com/en-us/features— tiếng Anh (Mỹ) — phiên bản gốchttps://app.com/en-gb/features— tiếng Anh (Anh) — chỉ đổi £ thay vì $, ngày tháng dạng DD/MM/YYYYhttps://app.com/de-de/features— tiếng Đức — nội dung gần như dịch máy, chưa điều chỉnh văn phonghttps://app.com/es-es/features— tiếng Tây Ban Nha — cũng tương tự, chưa tối ưu địa phương
Cả ba phiên bản sau đều thêm thẻ:
<link rel="canonical" href="https://app.com/en-us/features" />
<link rel="alternate" hreflang="en-us" href="https://app.com/en-us/features" />
<link rel="alternate" hreflang="en-gb" href="https://app.com/en-gb/features" />
<link rel="alternate" hreflang="de-de" href="https://app.com/de-de/features" />
<link rel="alternate" hreflang="es-es" href="https://app.com/es-es/features" />
→ Kết quả: Google tập trung xếp hạng /en-us/features, đồng thời vẫn hiển thị đúng phiên bản địa phương khi người dùng tìm kiếm bằng tiếng Đức hoặc tiếng Tây Ban Nha — nhờ hreflang.
Câu hỏi thường gặp
Có nên dùng international canonicalization cho mọi trang quốc tế?
Không. Chỉ áp dụng khi nội dung giữa các phiên bản gần như giống nhau — ví dụ: dịch máy chưa hiệu chỉnh, hoặc chỉ thay đổi yếu tố địa phương nhỏ. Nếu nội dung đã được viết lại, tối ưu theo văn hóa và hành vi người dùng, bạn nên dùng hreflang mà không cần canonical.
Nếu tôi dùng canonical, liệu người dùng ở Đức vẫn thấy trang tiếng Đức?
Có. Thẻ canonical không ảnh hưởng đến trải nghiệm người dùng. Người dùng vẫn truy cập đúng trang tiếng Đức, nhưng Google hiểu rằng phiên bản tiếng Anh là “gốc” để tính điểm SEO. Việc hiển thị trang nào cho ai vẫn do hreflang quyết định.
Có thể kết hợp canonical với noindex không?
Không nên. Việc kết hợp rel="canonical" và noindex trên cùng một trang tạo mâu thuẫn tín hiệu. Google khuyến cáo tránh điều này. Nếu muốn loại một phiên bản ra khỏi chỉ mục, hãy dùng noindex riêng — nhưng lúc đó không nên đặt canonical trỏ tới nó.