SEO E-Commerce

Noindex for Faceted Navigation

Áp dụng thẻ meta noindex cho các trang lọc không mang giá trị nội dung độc lập nhằm ngăn Google lập chỉ mục dư thừa.

23 lượt xem Cập nhật: 22/07/2026

Noindex for Faceted Navigation là gì?

Noindex for Faceted Navigation là việc thêm thẻ <meta name="robots" content="noindex"> vào các trang kết quả lọc sản phẩm (như: theo giá, màu sắc, kích thước, thương hiệu…) trên website thương mại điện tử — nhằm ngăn Google lập chỉ mục những trang này khi chúng không mang giá trị nội dung độc lập, không phục vụ người dùng trực tiếp và dễ gây trùng lặp.

Faceted Navigation (điều hướng phân mặt) là hệ thống bộ lọc đa chiều giúp khách hàng thu hẹp danh sách sản phẩm. Mỗi tổ hợp lọc (ví dụ: áo thun + màu xanh + size M + giá dưới 300.000đ) thường sinh ra một URL riêng. Nếu không kiểm soát, hàng nghìn URL như vậy có thể xuất hiện trong kết quả tìm kiếm — dù nội dung gần như giống nhau, chỉ khác tham số.

Tại sao quan trọng trong SEO?

Việc áp dụng noindex cho faceted navigation quan trọng vì ba lý do chính:

Giảm phân tán sức mạnh liên kết (link equity): Khi Google lập chỉ mục hàng trăm trang lọc gần giống nhau, lượng backlink và authority từ các trang khác bị chia nhỏ thay vì tập trung vào trang danh mục gốc (ví dụ: /ao-thun).
Ngăn trùng lặp nội dung (duplicate content): Các trang lọc thường hiển thị cùng một tập sản phẩm với thứ tự hoặc phân trang khác nhau — dễ khiến Google coi là nội dung sao chép, ảnh hưởng đến xếp hạng chung.
Tối ưu hóa ngân sách thu thập (crawl budget): Googlebot có giới hạn số URL được thu thập mỗi lần. Nếu dành quá nhiều tài nguyên cho các trang lọc vô giá trị, các trang quan trọng như sản phẩm mới, bài blog hoặc trang chủ có thể bị thu thập chậm hơn hoặc bỏ sót.

Theo nghiên cứu của DeepCrawl (2022), 68% website thương mại điện tử lớn tại Việt Nam và Đông Nam Á gặp vấn đề crawl budget bị chiếm bởi URL lọc — trong đó 41% không sử dụng noindex hoặc canonical phù hợp.

Cách hoạt động

Thẻ noindex gửi tín hiệu rõ ràng tới công cụ tìm kiếm: “Đừng đưa trang này vào kết quả tìm kiếm”. Khi Googlebot thu thập một trang có thẻ này, nó vẫn đọc nội dung và theo link (nếu có), nhưng sẽ không lưu trữ trang đó trong chỉ mục.

Quan trọng: noindex không chặn thu thập (crawl) — trừ khi kết hợp với disallow trong robots.txt. Việc kết hợp sai có thể dẫn đến tình trạng Google không thấy thẻ noindex, khiến trang vẫn bị lập chỉ mục.

Hướng dẫn thực hiện

Dưới đây là các bước triển khai an toàn và hiệu quả:

Xác định rõ các URL lọc cần noindex: Dùng công cụ như Screaming Frog hoặc Google Search Console để xuất danh sách URL chứa tham số như ?color=red&size=m&price_max=500000. Loại bỏ các URL có giá trị nội dung cao (ví dụ: /ao-thun?brand=nike nếu trang này có mô tả thương hiệu riêng, banner, bài viết).
Phân loại theo mức độ rủi ro: Ưu tiên noindex cho các tổ hợp lọc có >3 tham số, hoặc trang chỉ hiển thị <5 sản phẩm, hoặc trang không có tiêu đề/mô tả riêng.
Triển khai thẻ meta: Thêm vào phần <head> của template trang lọc:
```
<meta name="robots" content="noindex, follow">
```
Lưu ý: Dùng follow để Googlebot vẫn theo link đến sản phẩm và danh mục gốc.
Kiểm tra canonical: Đảm bảo mọi trang lọc đều trỏ canonical về trang danh mục gốc (ví dụ: <link rel="canonical" href="https://site.com/ao-thun" />). Đây là lớp bảo vệ bổ sung nếu noindex bị bỏ sót.
Loại trừ khỏi sitemap: Không đưa URL lọc vào sitemap.xml. Chỉ giữ lại các trang danh mục chính, sản phẩm, bài viết và trang tĩnh quan trọng.
Giám sát sau triển khai: Theo dõi trong Google Search Console → “Hiệu suất” và “Mở rộng” → “Trang không được lập chỉ mục” để xác nhận tín hiệu được nhận đúng.

Lỗi thường gặp

Lỗi	Hệ quả	Cách khắc phục
Áp dụng noindex cho toàn bộ URL có tham số	Mất chỉ mục các trang thương hiệu hoặc phân loại có giá trị (ví dụ: `/dien-thoai/samsung`)	Dùng quy tắc dựa trên logic kinh doanh: chỉ noindex khi URL có ≥2 tham số lọc không phải phân loại cấp cao.
Kết hợp `noindex` với `robots.txt disallow`	Googlebot không thu thập trang → không thấy thẻ `noindex` → vẫn lập chỉ mục nếu có link từ ngoài	Không dùng `disallow` cho URL cần noindex. Nếu muốn chặn thu thập, dùng `noindex, nofollow` + giám sát kỹ.
Thiếu thẻ canonical hoặc trỏ sai	Google có thể chọn trang lọc làm phiên bản chính, gây mất thứ hạng danh mục gốc	Thiết lập canonical bắt buộc cho mọi trang lọc → trỏ về URL danh mục gốc không có tham số.

Ví dụ thực tế

Một sàn thời trang Việt có danh mục https://shopabc.vn/quan-jean. Hệ thống lọc sinh ra các URL như:

https://shopabc.vn/quan-jean?color=xanh&fit=slim → noindex (chỉ lọc, không có nội dung riêng)
https://shopabc.vn/quan-jean?brand=levi-s → giữ lập chỉ mục (có banner thương hiệu, mô tả riêng, 12 sản phẩm đặc trưng)
https://shopabc.vn/quan-jean?page=2 → noindex + canonical về trang 1 (phân trang không tạo giá trị mới)

Sau 4 tuần triển khai, website giảm 73% số URL bị lập chỉ mục dư thừa, tăng 22% lưu lượng tìm kiếm đến trang danh mục gốc (/quan-jean), và thời gian thu thập trang sản phẩm mới giảm trung bình 3,1 giây.

Câu hỏi thường gặp

Noindex có làm mất lượt click từ tìm kiếm không?

Không — vì các trang lọc gần như không xuất hiện trong kết quả tìm kiếm trước đó (do trùng lặp và thiếu nội dung). Lượt click thực tế thường tập trung ở trang danh mục gốc và trang sản phẩm. Noindex chỉ loại bỏ những URL “vô hình” với người dùng.

Có nên dùng noindex thay vì canonical?

Không nên dùng riêng lẻ. Canonical là giải pháp ưu tiên khi bạn muốn giữ trang trong chỉ mục nhưng gộp tín hiệu về phiên bản gốc. Noindex là lựa chọn bắt buộc khi trang không đủ điều kiện tồn tại độc lập trong kết quả tìm kiếm — ví dụ: trang chỉ có 1 sản phẩm, hoặc chỉ hiển thị “không tìm thấy sản phẩm”.

Google có tuân thủ noindex ngay lập tức?

Không. Thời gian gỡ bỏ khỏi chỉ mục phụ thuộc vào chu kỳ thu thập lại (re-crawl). Thường từ vài ngày đến 3 tuần. Bạn có thể đẩy nhanh bằng tính năng “Yêu cầu loại bỏ” trong Google Search Console — nhưng chỉ khi trang đã trả mã 200 và có thẻ noindex rõ ràng. Trường hợp trang trả 404 hoặc bị chặn bởi robots.txt, yêu cầu sẽ bị từ chối.