On-Page SEO

Noindex Tag

Thuộc tính meta hoặc HTTP header ngăn công cụ tìm kiếm lập chỉ mục trang.

3 lượt xem Cập nhật: 27/05/2026

Noindex Tag là gì?

Noindex tag là một chỉ thị kỹ thuật dùng để yêu cầu công cụ tìm kiếm (như Google, Bing) không lập chỉ mục một trang web cụ thể. Nó không ngăn bot truy cập trang (crawl), mà chỉ ngăn trang đó xuất hiện trong kết quả tìm kiếm. Noindex có thể được triển khai dưới hai dạng chính: thẻ meta HTML (<meta name="robots" content="noindex">) hoặc header HTTP (X-Robots-Tag: noindex). Đây là công cụ kiểm soát nội dung cơ bản nhưng cực kỳ quan trọng trong chiến lược On-Page SEO.

Tại sao quan trọng trong SEO?

Noindex giúp chủ sở hữu website bảo vệ tài nguyên lập chỉ mục — một giới hạn hữu hạn. Khi Google lập chỉ mục quá nhiều trang trùng lặp, không liên quan hoặc nội dung yếu (ví dụ: trang thanh toán, trang đăng nhập, phiên bản in, trang lọc sản phẩm), nó làm loãng hiệu quả phân bổ crawl budget và giảm khả năng các trang quan trọng được ưu tiên thu thập dữ liệu. Dùng noindex đúng cách giúp:

  • Tập trung sức mạnh lập chỉ mục vào các trang có giá trị cao
  • Tránh vấn đề nội dung trùng lặp (duplicate content)
  • Bảo mật thông tin nhạy cảm không nên xuất hiện trên tìm kiếm
  • Hỗ trợ chiến lược nội dung khi thử nghiệm hoặc phát hành bản nháp
Không dùng noindex khi cần thiết có thể dẫn đến tổn thất thứ hạng gián tiếp do phân tán tín hiệu liên kết và trải nghiệm người dùng bị ảnh hưởng.

Cách hoạt động

Khi bot của công cụ tìm kiếm tải một trang, nó đọc cả nội dung HTML lẫn header HTTP. Nếu phát hiện chỉ thị noindex hợp lệ và không bị mâu thuẫn với các chỉ thị khác (ví dụ: noindex + follow vẫn cho phép bot theo link nhưng không lập chỉ mục trang hiện tại), bot sẽ bỏ qua việc thêm trang đó vào cơ sở dữ liệu tìm kiếm. Lưu ý: noindex không phải lệnh bắt buộc — đây là yêu cầu mang tính đề nghị. Tuy nhiên, Google và các công cụ lớn đều tuân thủ nghiêm ngặt nếu không có xung đột với robots.txt hay các yếu tố khác.

Hướng dẫn thực hiện

Dưới đây là các cách triển khai noindex chuẩn xác:

  1. Thẻ meta trong <head> (HTML):
    <meta name="robots" content="noindex">
    Hoặc dành riêng cho Google: <meta name="googlebot" content="noindex">
  2. Header HTTP (server-side):
    Gửi cùng phản hồi HTTP khi trang được tải:
    X-Robots-Tag: noindex
    Có thể kết hợp: X-Robots-Tag: noindex, noarchive
  3. Trong file robots.txt — KHÔNG hỗ trợ noindex:
    Lưu ý quan trọng: robots.txt chỉ điều khiển việc crawl, không thể yêu cầu noindex. Việc chặn crawl bằng robots.txt đồng thời đặt noindex trên trang sẽ khiến công cụ không đọc được thẻ noindex — dẫn đến rủi ro ngược: trang vẫn có thể được lập chỉ mục nếu có link từ bên ngoài.

✅ Kiểm tra hiệu lực: Dùng công cụ URL Inspection Tool trong Google Search Console để xác minh trạng thái “Crawled – currently not indexed” và phần “Robots.txt test” hoặc “Coverage report”.

Lỗi thường gặp

Dưới đây là những sai lầm phổ biến và cách khắc phục:

  • Lỗi 1: Đặt noindex trên toàn bộ trang chủ hoặc trang danh mục chính
    → Hậu quả: Website biến mất hoàn toàn khỏi tìm kiếm.
    Khắc phục: Kiểm tra lại template CMS, plugin SEO (như Yoast, Rank Math) — đảm bảo không bật noindex mặc định cho các loại trang hệ thống.
  • Lỗi 2: Kết hợp noindex với disallow trong robots.txt
    → Bot không crawl → không thấy thẻ noindex → có thể lập chỉ mục nếu có backlink.
    Khắc phục: Nếu muốn noindex, hãy cho phép crawl (bỏ disallow) và dùng thẻ meta hoặc header.
  • Lỗi 3: Dùng noindex trên trang có canonical trỏ tới chính nó
    → Không sai về mặt kỹ thuật, nhưng gây nhầm lẫn nếu canonical trỏ sai hoặc bị lặp.
    Khắc phục: Luôn kiểm tra tính nhất quán giữa canonical, noindex và cấu trúc internal link.
  • Lỗi 4: Quên gỡ noindex sau khi hoàn tất A/B test hoặc staging
    → Trang thử nghiệm bị giữ mãi trong trạng thái “ẩn”.
    Khắc phục: Thiết lập checklist kiểm tra noindex trước khi chuyển môi trường production.

Ví dụ thực tế

Dưới đây là bảng so sánh cách triển khai noindex cho các tình huống phổ biến:

Tình huống Cách triển khai Ghi chú
Trang đăng nhập (login.php) <meta name="robots" content="noindex, nofollow"> Nên dùng nofollow kèm theo để tránh lan truyền quyền lực liên kết
Trang in (print version) Header HTTP: X-Robots-Tag: noindex Ưu tiên header nếu trang được sinh động bởi server, tránh can thiệp HTML
Trang kết quả tìm kiếm nội bộ (search.php) Thẻ meta + kiểm tra tham số URL (ví dụ: ?s=) trong CMS Một số CMS như WordPress tự động thêm noindex cho trang tìm kiếm — cần xác minh
Trang sản phẩm tạm ngừng kinh doanh <meta name="robots" content="noindex, noarchive"> noarchive ngăn lưu bản cache — phù hợp khi nội dung sẽ quay lại

Câu hỏi thường gặp

Noindex có ảnh hưởng đến thứ hạng các trang khác không?

Không trực tiếp. Nhưng nếu trang noindex chứa nhiều internal link quan trọng, việc không crawl nó có thể làm chậm tốc độ khám phá các trang được liên kết — đặc biệt khi đó là trang cha hoặc hub. Tuy nhiên, Google vẫn có thể lập chỉ mục trang con nếu có backlink từ bên ngoài.

Có thể kết hợp noindex với canonical không?

Có thể, nhưng không khuyến khích. Nếu một trang A có noindex và canonical trỏ tới trang B, Google thường bỏ qua canonical và chỉ tuân theo noindex. Trường hợp ngoại lệ: nếu trang A bị chặn crawl, nhưng trang B có canonical trỏ ngược — lúc này tín hiệu có thể bị hiểu sai. Tốt nhất: không dùng canonical trên trang noindex, trừ khi có lý do kỹ thuật rõ ràng (tùy trường hợp).

Noindex có hủy bỏ giá trị backlink đến trang đó không?

Không. Backlink vẫn được tính và truyền quyền lực (PageRank) bình thường — miễn là trang không bị chặn crawl. Tuy nhiên, vì trang không xuất hiện trong tìm kiếm, nên giá trị gián tiếp (traffic từ tìm kiếm) bằng 0. Lưu ý: nếu trang bị chặn cả crawl lẫn index, backlink vẫn tồn tại nhưng không được xử lý đầy đủ — có thể thay đổi tùy công cụ tìm kiếm.