Technical SEO

URL Canonicalization

Quá trình chọn một URL chuẩn duy nhất trong số nhiều phiên bản tương đương (ví dụ: www/non-www, http/https, trailing slash) để tránh phân tán tín hiệu SEO.

4 lượt xem Cập nhật: 26/05/2026

URL Canonicalization là gì?

URL Canonicalization (chuẩn hóa URL) là quá trình chọn một phiên bản duy nhất — gọi là URL chuẩn (canonical URL) — trong số nhiều URL khác nhau nhưng dẫn đến cùng một nội dung. Ví dụ: https://example.com, https://www.example.com, https://example.com/http://example.com có thể hiển thị trang chủ giống nhau, nhưng với công cụ tìm kiếm, đây là những địa chỉ riêng biệt. Nếu không xử lý, chúng bị coi là nội dung trùng lặp — gây hại cho SEO.

Tại sao quan trọng trong SEO?

Khi nhiều URL chứa nội dung giống nhau tồn tại song song, Google và các công cụ tìm kiếm gặp khó khăn trong việc xác định:

  • URL nào nên xếp hạng trong kết quả tìm kiếm,
  • URL nào được gán tín hiệu liên kết (backlink), lượt chia sẻ, thời gian ở lại trang,
  • Cách phân bổ ngân sách thu thập (crawl budget) hợp lý.

Hệ quả trực tiếp là: tín hiệu SEO bị chia nhỏ, giảm khả năng xếp hạng, tăng rủi ro bị đánh giá là nội dung trùng lặp (duplicate content), và lãng phí tài nguyên thu thập của bot.

Theo hướng dẫn chính thức của Google, việc thiếu canonical rõ ràng có thể khiến công cụ tìm kiếm tự chọn URL chuẩn — nhưng lựa chọn đó thường không phải là phiên bản bạn muốn tối ưu.

Cách hoạt động

URL Canonicalization hoạt động dựa trên tín hiệu do chủ sở hữu trang chủ động cung cấp hoặc hệ thống tự suy luận. Công cụ tìm kiếm ưu tiên các tín hiệu sau (theo thứ tự ưu tiên giảm dần):

  1. Thẻ <link rel="canonical"> trong phần <head> của trang,
  2. Chính sách chuyển hướng 301 (redirect) từ các URL không chuẩn về URL chuẩn,
  3. Cấu hình miền trong Google Search Console (ví dụ: chọn www hoặc non-www),
  4. Tín hiệu nội bộ như liên kết nội bộ nhất quán (internal links) trỏ về một phiên bản duy nhất.

Lưu ý: thẻ canonical không phải là lệnh bắt buộc, mà là đề xuất. Tuy nhiên, Google tuân thủ hơn 95% trường hợp khi thẻ được triển khai đúng cách và không mâu thuẫn với các tín hiệu khác.

Hướng dẫn thực hiện

Dưới đây là các bước triển khai URL Canonicalization đúng kỹ thuật:

  1. Xác định URL chuẩn mong muốn: Chọn một phiên bản duy nhất cho mỗi trang — ví dụ: luôn dùng https://www.example.com/blog/ thay vì http://example.com/blog hay https://example.com/blog.
  2. Triển khai redirect 301: Chuyển hướng tất cả các biến thể không chuẩn về URL chuẩn. Ví dụ:
    • http://example.comhttps://www.example.com
    • https://example.comhttps://www.example.com
    • https://www.example.com/pagehttps://www.example.com/page/ (nếu dùng trailing slash)
  3. Thêm thẻ canonical: Trên mọi trang có nguy cơ trùng lặp (bao gồm cả trang danh mục, sản phẩm, bài viết có tham số lọc), đặt thẻ sau trong phần <head>:
    <link rel="canonical" href="https://www.example.com/trang-chuan/" />
  4. Đảm bảo liên kết nội bộ nhất quán: Tất cả liên kết trong website (menu, footer, bài viết, breadcrumbs) phải trỏ về URL chuẩn — không hỗn hợp www/non-www, http/https hay thiếu/thừa dấu gạch chéo cuối.
  5. Cấu hình trong Google Search Console: Đăng ký và xác minh cả hai phiên bản (www và non-www), sau đó chọn phiên bản ưu tiên trong mục Settings > Preferred domain. Lưu ý: tính năng này chỉ áp dụng cho giao thức HTTP/HTTPS giống nhau và đã bị giới hạn chức năng từ năm 2019 — hiện chỉ còn hiệu lực với một số trường hợp cũ; khuyến nghị dùng redirect + canonical thay thế.

Lỗi thường gặp

Lỗi Hệ quả Cách khắc phục
Thẻ canonical trỏ đến URL 404 hoặc redirect vòng Google bỏ qua thẻ, có thể chọn sai URL chuẩn Kiểm tra HTTP status của URL trong thẻ bằng công cụ như Screaming Frog hoặc curl; đảm bảo URL trả về 200 và không redirect
Thẻ canonical tự trỏ vào chính nó trên mọi biến thể Không giải quyết được vấn đề trùng lặp Chỉ để thẻ canonical trên trang không chuẩn trỏ về URL chuẩn — không đặt trên cả hai phiên bản
Dùng cả redirect 301 và thẻ canonical mâu thuẫn Gây nhầm lẫn cho bot, giảm độ tin cậy tín hiệu Ưu tiên redirect 301 cho các biến thể toàn cục (ví dụ: non-www → www); dùng thẻ canonical cho các trường hợp phức tạp hơn (tham số UTM, phân trang, phiên bản in)
Bỏ qua canonical cho trang danh mục có tham số lọc (ví dụ: ?sort=price) Google lập chỉ mục hàng chục URL gần giống nhau Dùng thẻ canonical tĩnh trỏ về URL gốc (không tham số), hoặc chặn index bằng noindex + rel="canonical" nếu cần giữ khả năng thu thập

Ví dụ thực tế

Một cửa hàng điện máy có trang sản phẩm có thể truy cập qua nhiều đường dẫn:

  • https://dienmayabc.vn/may-giat
  • https://www.dienmayabc.vn/may-giat
  • https://dienmayabc.vn/may-giat/
  • https://www.dienmayabc.vn/may-giat/?ref=home

Cách xử lý đúng:

  • Redirect 301 toàn bộ non-wwwwww/may-giat/may-giat/,
  • Trên trang /may-giat/?ref=home, đặt thẻ: <link rel="canonical" href="https://www.dienmayabc.vn/may-giat/" />,
  • Liên kết nội bộ từ trang chủ, danh mục, bài blog đều trỏ về https://www.dienmayabc.vn/may-giat/.

Kết quả: toàn bộ tín hiệu từ 4 URL trên được gộp về một URL chuẩn — tăng sức mạnh xếp hạng và kiểm soát trải nghiệm người dùng.

Câu hỏi thường gặp

URL canonical có ảnh hưởng đến người dùng không?

Không. Thẻ canonical hoàn toàn vô hình với người dùng — chỉ tác động đến cách công cụ tìm kiếm hiểu và lập chỉ mục trang. Người dùng vẫn truy cập bình thường vào bất kỳ URL nào, kể cả khi nó không phải là canonical.

Có nên dùng canonical cho trang phân trang (page 2, page 3)?

Tùy trường hợp. Với trang danh mục dài, Google khuyến nghị: trang đầu tiên (page 1) nên là canonical cho toàn bộ chuỗi, còn các trang sau nên dùng rel="next"rel="prev" (mặc dù tín hiệu này hiện ít được sử dụng). Một số chuyên gia khuyên dùng noindex, follow cho page 2 trở đi và giữ canonical về page 1 — nhằm tập trung tín hiệu và tránh phân tán crawl budget.

Thẻ canonical có thể trỏ đến URL trên tên miền khác không?

Có thể, nhưng chỉ trong một số tình huống đặc biệt như nội dung được cấp phép chia sẻ (cross-domain canonical). Tuy nhiên, Google yêu cầu xác minh cả hai tên miền trong Search Console và đảm bảo quyền sở hữu nội dung. Việc này hiếm khi áp dụng cho website thông thường và dễ gây lỗi nếu không cấu hình đúng.