Noindex
Chỉ thị (meta tag hoặc HTTP header) yêu cầu Google không đưa trang vào chỉ mục tìm kiếm.
Noindex là gì?
Noindex là một chỉ thị do chủ sở hữu trang web gửi đến công cụ tìm kiếm (như Google), yêu cầu không lập chỉ mục (không lưu trữ và hiển thị trong kết quả tìm kiếm) trang đó. Đây không phải là lệnh cấm, mà là lời đề nghị — Google có thể chọn tuân theo hoặc bỏ qua, dù trong thực tế gần như luôn tôn trọng nếu chỉ thị được triển khai đúng cách.
Noindex tồn tại dưới hai dạng chính: thẻ meta HTML (<meta name="robots" content="noindex">) và tiêu đề HTTP (X-Robots-Tag: noindex). Cả hai đều có hiệu lực tương đương khi Googlebot thu thập dữ liệu.
Tại sao quan trọng trong SEO?
Noindex giúp kiểm soát chất lượng chỉ mục của website — tránh tình trạng các trang trùng lặp, chưa hoàn thiện, nội dung nhạy cảm hoặc không mang giá trị tìm kiếm làm loãng tín hiệu SEO tổng thể. Nếu Google lập chỉ mục quá nhiều trang kém chất lượng, nó có thể:
- Giảm tỷ lệ click vào các trang quan trọng (do kết quả tìm kiếm bị loãng)
- Làm chậm tốc độ thu thập (crawl budget) cho các trang đáng giá
- Gây nhầm lẫn cho người dùng khi họ thấy trang lỗi, bản nháp hoặc trang quản trị trong kết quả tìm kiếm
Việc sử dụng noindex hợp lý còn hỗ trợ chiến lược nội dung: ví dụ, loại bỏ phiên bản in (print version), trang so sánh nội bộ, hay trang xác nhận đơn hàng khỏi chỉ mục — giữ tập trung vào những trang tạo chuyển đổi.
Cách hoạt động
Khi Googlebot thu thập một trang, nó kiểm tra cả thẻ <meta name="robots"> trong phần <head> lẫn tiêu đề X-Robots-Tag trong phản hồi HTTP. Nếu phát hiện noindex, Google sẽ:
- Không thêm trang vào cơ sở dữ liệu chỉ mục
- Vẫn có thể tiếp tục thu thập các liên kết trên trang (nếu không có
nofollow) - Không hiển thị trang trong kết quả tìm kiếm — kể cả khi có liên kết ngoài mạnh
Lưu ý: Noindex không ngăn Googlebot thu thập trang. Để chặn thu thập, cần dùng robots.txt hoặc noindex + nofollow kết hợp. Cũng không ảnh hưởng đến việc đo lường bằng Google Analytics hay Google Tag Manager.
Hướng dẫn thực hiện
Dưới đây là các cách triển khai noindex chuẩn xác:
1. Dùng thẻ meta trong HTML
Đặt trong phần <head> của trang:
<meta name="robots" content="noindex">
Hoặc nếu chỉ muốn ảnh hưởng tới Google (không phải tất cả công cụ tìm kiếm):
<meta name="googlebot" content="noindex">
2. Dùng tiêu đề HTTP (X-Robots-Tag)
Phù hợp với trang động, file PDF, hoặc khi không thể chỉnh mã HTML. Ví dụ phản hồi HTTP:
X-Robots-Tag: noindex
Có thể kết hợp nhiều chỉ thị: X-Robots-Tag: noindex, noarchive, nosnippet.
3. Kiểm tra sau khi triển khai
- Dùng Google Search Console → Công cụ kiểm tra URL → Nhập URL → Xem phần "Crawl" để xác nhận trạng thái chỉ mục
- Dùng lệnh
site:example.com/page-urltrên Google — nếu không xuất hiện, khả năng cao đã được noindex - Kiểm tra mã nguồn trang (Ctrl+U) hoặc tab "Coverage" trong GSC để xem ghi chú "Excluded by 'noindex' tag"
Lỗi thường gặp
Dưới đây là những sai lầm phổ biến và cách khắc phục:
| Lỗi | Dấu hiệu nhận biết | Cách khắc phục |
|---|---|---|
| Thẻ noindex đặt sai vị trí (ngoài <head>) | Google bỏ qua chỉ thị, trang vẫn xuất hiện trong kết quả | Di chuyển thẻ vào trong khối <head>, kiểm tra lại bằng View Source |
| Dùng noindex trên toàn bộ trang nhưng quên rằng trang con kế thừa | Trang danh mục bị noindex, nhưng trang sản phẩm vẫn bị ảnh hưởng do cấu trúc CMS | Kiểm tra từng URL riêng lẻ; dùng X-Robots-Tag cho linh hoạt hơn nếu cần phân biệt cấp độ |
| Triển khai noindex rồi xóa ngay sau đó | Trang mất vài ngày đến vài tuần để quay lại chỉ mục | Chờ ít nhất 7–14 ngày; dùng "Yêu cầu lập chỉ mục" trong GSC chỉ sau khi xác nhận noindex đã bị gỡ |
Ví dụ thực tế
Ví dụ 1: Một website thương mại điện tử có trang so sánh sản phẩm tạm thời (/compare?id=123&id=456). Trang này sinh tự động, không có nội dung độc nhất, dễ gây trùng lặp. Giải pháp: thêm <meta name="robots" content="noindex, nofollow"> vào thẻ <head> của mọi trang so sánh.
Ví dụ 2: Trang xác nhận đơn hàng thành công (/order-confirmed/12345). Nội dung cá nhân, không có giá trị chung với người tìm kiếm. Triển khai X-Robots-Tag: noindex qua máy chủ (Apache/Nginx) hoặc framework (PHP header(), Next.js getServerSideProps).
Ví dụ 3: Trang bản nháp đang thử nghiệm A/B (/landing-test-v2). Đội ngũ marketing muốn kiểm tra hiệu suất trước khi ra mắt. Dùng noindex để tránh rò rỉ nội dung và nhiễu dữ liệu báo cáo.
Câu hỏi thường gặp
Noindex có làm mất PageRank của trang không?
Không. Noindex không ảnh hưởng đến việc truyền PageRank. Nếu trang có liên kết nội bộ và không dùng nofollow, PageRank vẫn được chuyển đi bình thường — chỉ đơn giản là trang đó không xuất hiện trong kết quả tìm kiếm.
Có thể kết hợp noindex với canonical không?
Có thể, nhưng không nên. Nếu một trang có rel="canonical" trỏ tới trang khác và đồng thời dùng noindex, Google có thể hiểu nhầm là bạn muốn loại bỏ cả hai. Nguyên tắc tốt nhất: dùng noindex khi muốn loại bỏ trang hiện tại; dùng canonical khi muốn gộp tín hiệu về một phiên bản ưu tiên — không dùng cùng lúc trừ trường hợp đặc biệt (ví dụ: trang bản in có canonical về trang gốc và noindex riêng).
Noindex có tác dụng tức thì không?
Không. Sau khi triển khai, Google cần thời gian để thu thập lại trang (tùy tần suất crawl). Thời gian gỡ khỏi chỉ mục thường từ vài ngày đến 3 tuần. Không có cách nào ép Google xoá ngay — trừ khi dùng tính năng "Loại bỏ tạm thời" trong Google Search Console (chỉ áp dụng ngắn hạn, tối đa 6 tháng).