SEO Cơ Bản

Canonicalization

Quá trình chọn một URL duy nhất làm phiên bản chính khi có nhiều URL dẫn đến cùng nội dung.

5 lượt xem Cập nhật: 28/05/2026

Canonicalization là gì?

Canonicalization (tạm dịch: chuẩn hóa URL) là quá trình chọn một URL duy nhất làm phiên bản chính — còn gọi là URL canonical — khi nhiều URL khác nhau dẫn đến cùng một nội dung. Đây không phải là việc xóa hay chuyển hướng các URL phụ, mà là cách báo cho công cụ tìm kiếm biết: "Đây là phiên bản gốc mà bạn nên lập chỉ mục và xếp hạng".

Ví dụ: trang sản phẩm có thể truy cập qua nhiều đường dẫn như:
https://example.com/san-pham?utm_source=fb
https://example.com/san-pham?sort=price
https://www.example.com/san-pham/
https://example.com/san-pham/
Tất cả đều hiển thị nội dung giống nhau — nhưng nếu không chuẩn hóa, Google có thể coi đây là các trang riêng biệt, gây phân tán tín hiệu SEO.

Tại sao quan trọng trong SEO?

Canonicalization giúp giải quyết ba vấn đề cốt lõi:

  • Tránh nội dung trùng lặp: Khi nhiều URL chứa nội dung giống nhau, công cụ tìm kiếm có thể không biết nên lập chỉ mục trang nào — dẫn đến giảm khả năng xuất hiện trên kết quả tìm kiếm.
  • Bảo toàn tín hiệu liên kết: Các backlink trỏ vào các URL phụ sẽ không tập trung về một trang duy nhất nếu thiếu thẻ canonical — làm suy yếu sức mạnh xếp hạng.
  • Tối ưu hóa ngân sách thu thập (crawl budget): Googlebot dành giới hạn thời gian và tài nguyên để thu thập trang. Nếu phát hiện hàng chục biến thể của cùng nội dung, nó có thể bỏ sót các trang quan trọng hơn.

Theo tài liệu chính thức của Google, canonicalization là một trong những yếu tố nền tảng để kiểm soát cách lập chỉ mục — đặc biệt với website thương mại điện tử, blog có bộ lọc hoặc hệ thống CMS tự sinh URL.

Cách hoạt động

Google và các công cụ tìm kiếm khác sử dụng thẻ <link rel="canonical"> trong phần <head> của trang để xác định phiên bản ưu tiên. Khi gặp thẻ này, công cụ tìm kiếm sẽ:

  1. So sánh nội dung giữa trang hiện tại và URL được khai báo trong thẻ canonical.
  2. Nếu nội dung tương đồng cao (thường >95%), nó sẽ gộp tín hiệu (backlink, click, thời gian ở lại…) về URL canonical.
  3. Chỉ lập chỉ mục và xếp hạng URL canonical — các URL khác vẫn có thể được truy cập nhưng không xuất hiện độc lập trên kết quả tìm kiếm.

Lưu ý: Thẻ canonical là tín hiệu gợi ý, không phải lệnh bắt buộc. Google có thể bỏ qua nếu phát hiện mâu thuẫn rõ ràng (ví dụ: trang A đặt canonical trỏ về B, nhưng B lại trỏ ngược về A).

Hướng dẫn thực hiện

Dưới đây là các phương pháp phổ biến, sắp xếp theo mức độ ưu tiên:

  1. Sử dụng thẻ <link rel="canonical"> trong <head>
    Thêm vào HTML của mỗi trang cần chuẩn hóa:
    <link rel="canonical" href="https://example.com/san-pham/" />
    → Áp dụng cho trang có nhiều biến thể (bộ lọc, tham số UTM, phiên bản mobile/desktop).
  2. Thiết lập 301 Redirect
    Dùng khi các URL phụ không cần tồn tại độc lập (ví dụ: loại bỏ www hoặc chuyển từ HTTP sang HTTPS). Đây là cách mạnh nhất vì vừa hợp nhất tín hiệu, vừa cải thiện trải nghiệm người dùng.
  3. Khởi tạo sitemap chỉ chứa URL canonical
    Đưa vào file sitemap.xml chỉ những URL bạn muốn lập chỉ mục — giúp Google dễ nhận diện phiên bản ưu tiên.
  4. Cấu hình trong Google Search Console
    Phần Settings > Crawl > URL Parameters cho phép khai báo tham số nào không ảnh hưởng đến nội dung (ví dụ: utm_source, sessionid) — giúp Google bỏ qua chúng khi thu thập.

Lỗi thường gặp

Lỗi Hệ quả Cách khắc phục
Canonical trỏ tới URL trả mã lỗi (404, 500) Google bỏ qua thẻ, có thể lập chỉ mục sai trang Kiểm tra bằng URL Inspection Tool trong Search Console; sửa thành URL tồn tại và trả mã 200
Thẻ canonical tự trỏ về chính nó trên mọi biến thể Không giải quyết được trùng lặp — từng URL vẫn bị coi là riêng biệt Đảm bảo mỗi biến thể trỏ về cùng một URL canonical (không phải URL của chính nó)
Dùng cả rel="canonical"noindex trên cùng trang Mâu thuẫn tín hiệu — Google thường ưu tiên noindex Loại bỏ noindex nếu muốn trang đó được lập chỉ mục qua canonical

Ví dụ thực tế

Một website bán hàng có trang danh mục sản phẩm có thể truy cập qua:

  • https://shop.vn/danh-muc/noi-that?sort=popular&page=2
  • https://shop.vn/danh-muc/noi-that?ref=google
  • https://www.shop.vn/danh-muc/noi-that/

Giải pháp đúng:

  • Dùng 301 redirect từ www.shop.vnshop.vn (để thống nhất tên miền).
  • Thêm thẻ canonical trên tất cả biến thể: <link rel="canonical" href="https://shop.vn/danh-muc/noi-that/" />.
  • Khởi tạo sitemap chỉ chứa https://shop.vn/danh-muc/noi-that/, không đưa các URL có tham số.

Sau 1–4 tuần, Google sẽ gộp tín hiệu từ các biến thể về URL canonical — tăng khả năng xuất hiện ở vị trí cao hơn cho từ khóa "nội thất".

Câu hỏi thường gặp

Thẻ canonical có ảnh hưởng đến người dùng không?

Không. Người dùng vẫn truy cập được vào đúng URL họ nhấp — thẻ canonical chỉ tác động đến cách công cụ tìm kiếm xử lý nội dung. Không thay đổi giao diện, tốc độ hay hành vi điều hướng.

Có nên dùng canonical cho trang gần giống nhau (ví dụ: mô tả sản phẩm khác nhau 10%)?

Không. Canonical chỉ áp dụng khi nội dung gần như giống hệt. Với nội dung khác biệt dù nhỏ (giá, thông số kỹ thuật, mô tả), nên để Google lập chỉ mục riêng — hoặc dùng hreflang nếu phân biệt ngôn ngữ/vùng.

Có thể đặt canonical trỏ tới trang ngoài domain không?

Có thể về mặt kỹ thuật, nhưng Google không công nhận canonical ngoại bộ (cross-domain) trừ trường hợp đặc biệt như báo chí được phép tái bản có ghi nguồn. Việc này không truyền tín hiệu SEO và thường bị bỏ qua.