Noindex Directive
Chỉ thị (qua robots meta tag hoặc HTTP header) yêu cầu công cụ tìm kiếm không lập chỉ mục trang đó.
Noindex Directive là gì?
Noindex Directive là chỉ thị yêu cầu công cụ tìm kiếm (như Google, Bing) không đưa một trang cụ thể vào cơ sở dữ liệu kết quả tìm kiếm — tức là không lập chỉ mục (index) trang đó. Đây không phải lệnh cấm thu thập (crawl), mà chỉ ngăn việc hiển thị trang trong kết quả tìm kiếm.
Chỉ thị này được gửi qua hai kênh chính: robots meta tag trong phần <head> của trang HTML hoặc HTTP header khi máy chủ trả về phản hồi. Cả hai đều có hiệu lực như nhau nếu được cấu hình đúng.
Tại sao quan trọng trong SEO?
Noindex Directive giúp kiểm soát chất lượng và hiệu quả của việc lập chỉ mục trên website. Khi nhiều trang trùng lặp, nội dung mỏng, trang thử nghiệm hoặc trang dành riêng cho thành viên xuất hiện trong kết quả tìm kiếm, chúng làm loãng tín hiệu SEO, chia sẻ quyền lực liên kết (link equity), và làm giảm tỷ lệ nhấp (CTR) trung bình.
Một website có 5.000 trang nhưng chỉ 1.200 trang hữu ích với người dùng thì việc noindex 3.800 trang còn lại giúp Google tập trung tài nguyên thu thập vào nội dung giá trị — từ đó cải thiện tốc độ lập chỉ mục, độ chính xác của xếp hạng và trải nghiệm người dùng tổng thể.
Cách hoạt động
Khi bot tìm kiếm truy cập một trang, nó đọc cả HTTP header lẫn thẻ meta trước khi quyết định xử lý tiếp. Nếu phát hiện chỉ thị noindex, bot sẽ bỏ qua việc thêm trang vào cơ sở dữ liệu chỉ mục — ngay cả khi trang đã được thu thập (crawl) thành công.
Lưu ý: Noindex không ảnh hưởng đến khả năng thu thập. Trang vẫn có thể bị crawl nếu không bị chặn bởi robots.txt hoặc các yếu tố khác. Đồng thời, noindex cũng không ngăn liên kết từ trang khác truyền quyền lực — trừ khi dùng kèm nofollow.
Hướng dẫn thực hiện
1. Dùng robots meta tag
Thêm vào phần <head> của trang HTML:
<meta name="robots" content="noindex">
Có thể kết hợp với các chỉ thị khác:
noindex, nofollow: Không lập chỉ mục + không theo liên kếtnoindex, follow: Không lập chỉ mục nhưng vẫn truyền quyền lực qua liên kết (mặc định)
2. Dùng HTTP header
Thiết lập trên máy chủ (Apache, Nginx, hoặc qua CMS như WordPress bằng plugin hỗ trợ header). Ví dụ header trả về:
X-Robots-Tag: noindex
Có thể áp dụng cho toàn bộ loại file (PDF, hình ảnh, API response) — điều mà thẻ meta không làm được.
3. Kiểm tra hiệu lực
- Dùng Google Search Console → Nhập URL → chọn "Kiểm tra URL" → xem phần "Lập chỉ mục"
- Dùng công cụ View Page Source để kiểm tra thẻ meta
- Dùng curl -I [URL] hoặc trình mở rộng như "Redirect Path" để kiểm tra HTTP header
Lỗi thường gặp
Lỗi 1: Dùng noindex cùng lúc với robots.txt chặn crawl
Nếu trang bị chặn bởi robots.txt, bot không thể đọc thẻ meta hay header → không biết có noindex → có thể vẫn lập chỉ mục nếu phát hiện qua liên kết bên ngoài. Cách khắc phục: Chỉ dùng robots.txt để chặn crawl những trang không cần thu thập; dùng noindex để chặn lập chỉ mục — không dùng song song cho cùng một trang.
Lỗi 2: Đặt noindex trên trang chủ hoặc trang quan trọng
Do nhầm lẫn hoặc lỗi cấu hình CMS, trang chủ hoặc danh mục sản phẩm bị gắn noindex. Hệ quả: website biến mất khỏi kết quả tìm kiếm. Cách khắc phục: Kiểm tra định kỳ bằng báo cáo "Coverage" trong Google Search Console, lọc theo trạng thái "Excluded" → nguyên nhân "Noindex tag".
Lỗi 3: Noindex trên trang có canonical trỏ tới chính nó
Không sai về mặt kỹ thuật, nhưng gây mâu thuẫn tín hiệu: trang tự nhận là phiên bản gốc nhưng lại yêu cầu không lập chỉ mục. Cách khắc phục: Nếu muốn noindex, nên cân nhắc xóa canonical hoặc đặt canonical trỏ tới trang thay thế (nếu có).
Ví dụ thực tế
Một cửa hàng điện máy có trang so sánh sản phẩm tạo tự động: https://maylanh.com/so-sanh?model=A&model=B. Trang này không có nội dung độc lập, dễ sinh trùng lặp và không mang giá trị tìm kiếm. Giải pháp:
- Thêm thẻ:
<meta name="robots" content="noindex, nofollow"> - Đảm bảo không bị chặn bởi
robots.txt - Không đặt canonical trỏ tới chính nó
Sau 3–7 ngày, trang biến mất khỏi kết quả tìm kiếm, không còn cạnh tranh với trang sản phẩm thật.
Câu hỏi thường gặp
Noindex có làm mất PageRank của trang không?
Không. Trang noindex vẫn nhận và truyền PageRank nếu có liên kết vào và không dùng nofollow. Tuy nhiên, vì không nằm trong chỉ mục nên giá trị truyền đi không được tính trực tiếp vào xếp hạng — tác động gián tiếp qua các trang được index liên quan.
Có thể noindex một phần trang không?
Không. Noindex là chỉ thị toàn trang. Không tồn tại cách noindex riêng tiêu đề, đoạn văn hay khối nội dung. Nếu cần ẩn một phần nội dung khỏi lập chỉ mục, nên dùng JavaScript tải sau hoặc phân quyền truy cập (login wall), nhưng lưu ý: Google có thể vẫn thu thập nội dung JS nếu khả dụng.
Noindex có ảnh hưởng đến quảng cáo hoặc phân tích không?
Không. Noindex chỉ ảnh hưởng đến hành vi của bot tìm kiếm. Công cụ phân tích (GA4, GTM), hệ thống quảng cáo (Google Ads, Meta Pixel) và backend đều hoạt động bình thường — miễn là mã vẫn được chạy ở phía client hoặc server.
Bảng so sánh phương thức áp dụng Noindex Directive
| Phương thức | Ưu điểm | Hạn chế | Phù hợp với |
|---|---|---|---|
Meta tag robots |
Dễ triển khai, kiểm soát theo trang, hỗ trợ CMS | Chỉ áp dụng cho HTML; không dùng được cho PDF, ảnh, API | Trang web tĩnh/dynamic, blog, landing page |
HTTP header X-Robots-Tag |
Áp dụng cho mọi loại file; kiểm soát tập trung ở máy chủ | Cần truy cập cấu hình server hoặc hosting; khó kiểm soát theo trang đơn lẻ | Tài liệu PDF, ảnh, trang admin, API, file tải về |