SEO Cơ Bản

Search Console Coverage Report

Báo cáo trong Google Search Console cho biết trạng thái lập chỉ mục của các URL (Submitted, Indexed, Excluded…).

4 lượt xem Cập nhật: 29/05/2026

Search Console Coverage Report là gì?

Báo cáo Coverage (Phạm vi lập chỉ mục) trong Google Search Console là một công cụ miễn phí giúp chủ sở hữu website theo dõi trạng thái của các URL trên trang web khi được Google thu thập và lập chỉ mục. Báo cáo này phân loại từng URL vào các nhóm như: Submitted (đã gửi), Indexed (đã lập chỉ mục), Excluded (bị loại trừ), Error (lỗi), hoặc Valid with warnings (hợp lệ nhưng có cảnh báo). Dữ liệu được cập nhật thường xuyên — thường sau vài ngày kể từ lần thu thập gần nhất, tùy vào tần suất bot Google truy cập trang.

Tại sao quan trọng trong SEO?

Coverage Report là cửa sổ trực tiếp để bạn hiểu Google có thấy, hiểu và sẵn sàng hiển thị nội dung của mình trên kết quả tìm kiếm hay không. Nếu nhiều URL quan trọng bị lỗi hoặc bị loại trừ, khả năng xuất hiện trên Google sẽ giảm mạnh — ngay cả khi nội dung chất lượng cao. Đây cũng là công cụ đầu tiên nên kiểm tra sau mỗi lần cập nhật cấu trúc website, chuyển đổi sang HTTPS, hoặc triển khai robots.txt mới. Không có báo cáo này, bạn sẽ SEO ‘mù’ — tối ưu nội dung mà không biết Google có nhìn thấy hay không.

Cách hoạt động

Khi Googlebot thu thập (crawl) trang web, nó ghi nhận phản hồi HTTP (như 200, 404, 503), kiểm tra thẻ meta robots, xem xét sitemap, phân tích nội dung và tuân thủ các quy tắc trong robots.txt. Sau đó, Google quyết định từng URL có đủ điều kiện để lập chỉ mục hay không. Tất cả kết quả được tổng hợp thành Coverage Report. Lưu ý: Báo cáo không cho biết tại sao một URL bị loại trừ — chỉ nêu trạng tháimã lỗi hoặc lý do chung. Việc chẩn đoán sâu cần kết hợp với các công cụ khác như URL Inspection Tool, robots.txt Tester hoặc phân tích mã nguồn.

Hướng dẫn thực hiện

  1. Đăng nhập Search Console: Truy cập search.google.com/searchconsole, chọn tài sản (property) đúng (URL-prefix hoặc Domain).
  2. Vào báo cáo Coverage: Chọn menu bên trái → IndexingCoverage.
  3. Lọc dữ liệu: Dùng bộ lọc trên đầu để xem riêng các trạng thái: Errors, Valid, Excluded, hoặc Valid with warnings. Bạn cũng có thể lọc theo loại lỗi (ví dụ: “Crawled – currently not indexed”), theo nguồn (sitemap, tự phát, internal links), hoặc theo ngày.
  4. Phân tích chi tiết: Nhấp vào bất kỳ dòng nào để xem danh sách URL mẫu. Với mỗi URL, nhấn nút Inspect URL để chạy kiểm tra tức thì — hiển thị trạng thái crawl, render, lý do không lập chỉ mục (nếu có), và đề xuất khắc phục.
  5. Theo dõi tiến độ: Báo cáo tự động lưu lịch sử 16 tháng. So sánh biểu đồ hàng tuần giúp bạn đánh giá hiệu quả sau khi sửa lỗi (ví dụ: số URL lỗi giảm sau khi fix redirect chuỗi).

Lỗi thường gặp

  • 404 Not Found: URL không tồn tại. Cách khắc phục: Xóa khỏi sitemap nếu không còn dùng; thiết lập redirect 301 đến trang thay thế nếu nội dung vẫn có giá trị; hoặc khôi phục trang nếu xóa nhầm.
  • Submitted URL blocked by robots.txt: Googlebot bị chặn truy cập URL do quy tắc trong file robots.txt. Cách khắc phục: Kiểm tra lại robots.txt bằng công cụ robots.txt Tester trong Search Console; điều chỉnh quy tắc nếu chặn nhầm (ví dụ: chặn thư mục /category/ trong khi muốn lập chỉ mục bài viết bên trong).
  • Crawled – currently not indexed: Google đã thu thập nhưng chưa lập chỉ mục. Nguyên nhân phổ biến: nội dung trùng lặp, thiếu giá trị độc đáo, hoặc trang quá mỏng (< 300 từ). Cách khắc phục: Nâng cấp nội dung, thêm liên kết nội bộ mạnh, đảm bảo có thẻ canonical rõ ràng, hoặc yêu cầu lập chỉ mục thủ công qua URL Inspection Tool (chỉ áp dụng khi đã chắc chắn trang đạt tiêu chuẩn).
  • Soft 404: Trang trả về mã HTTP 200 nhưng nội dung cho thấy “không tìm thấy” (ví dụ: trang tìm kiếm rỗng, trang danh mục không có sản phẩm). Cách khắc phục: Trả mã 404 thực hoặc 410 nếu nội dung không tồn tại; nếu là trang tạm thời, dùng 503; nếu muốn giữ, bổ sung nội dung hữu ích và hướng dẫn người dùng.
  • Discovered – currently not indexed: Google tìm thấy URL qua liên kết nhưng chưa thu thập. Cách khắc phục: Đảm bảo URL dễ thu thập (không bị chặn, có liên kết rõ ràng từ trang khác); thêm vào sitemap; tăng authority nội bộ bằng liên kết từ trang chủ hoặc danh mục chính.

Ví dụ thực tế

Một website bán hàng điện máy cập nhật toàn bộ danh mục sản phẩm sang URL mới (từ /san-pham/tivi sang /dien-may/tivi) nhưng quên thiết lập redirect 301. Sau 1 tuần, trong Coverage Report xuất hiện hơn 200 URL lỗi 404Submitted URL blocked by robots.txt (do file robots.txt cũ chặn đường dẫn cũ). Đội SEO kiểm tra kỹ, phát hiện robots.txt đang chặn Disallow: /san-pham/. Sau khi cập nhật redirect và điều chỉnh robots.txt, số URL lỗi giảm 98% trong 5 ngày — đồng thời lượng traffic từ tìm kiếm tăng 12% trong 2 tuần tiếp theo.

Câu hỏi thường gặp

Coverage Report có hiển thị tất cả URL trên website không?

Không. Báo cáo chỉ bao gồm những URL mà Google đã thu thập hoặc biết đến (qua sitemap, liên kết nội bộ, backlink…). Các trang không có liên kết nào, không nằm trong sitemap và chưa từng được Googlebot phát hiện sẽ không xuất hiện — dù bạn có upload bao nhiêu URL đi nữa.

Số liệu trong Coverage Report có cập nhật theo thời gian thực không?

Không. Dữ liệu thường chậm từ 2–7 ngày so với thực tế, tùy vào tần suất thu thập của Googlebot. Với website lớn (>100.000 URL), thời gian cập nhật có thể lâu hơn. Không nên dùng báo cáo này để kiểm tra tức thì sau khi deploy.

“Excluded” có nghĩa là trang bị phạt hay bị ảnh hưởng tiêu cực?

Không nhất thiết. Nhiều URL nằm trong nhóm Excluded là do thiết lập chủ động: ví dụ trang đăng nhập, trang giỏ hàng, hoặc trang kết quả tìm kiếm nội bộ — những trang Google khuyến cáo không nên lập chỉ mục. Chỉ khi URL quan trọng (trang sản phẩm, bài blog) bị Excluded vì lý do không mong muốn (như noindex tag vô tình, canonical sai) thì mới cần can thiệp. Việc phân biệt nguyên nhân là bước then chốt.

Trạng thái Ý nghĩa Thường gặp ở đâu? Cần xử lý?
Valid URL được thu thập và lập chỉ mục thành công Trang bài viết, trang sản phẩm, trang danh mục Không (theo dõi định kỳ)
Error Google không thể thu thập do lỗi kỹ thuật 404, server error, redirect vòng lặp Có — ưu tiên cao
Valid with warnings Thu thập thành công nhưng có vấn đề nhỏ (vd: canonical trỏ sai) Trang có thẻ rel=canonical không nhất quán Có — nên sửa để tránh rủi ro trùng lặp
Excluded Không được lập chỉ mục do lý do chủ động hoặc hệ thống noindex, duplicate, soft 404, low-value page Tùy trường hợp — cần kiểm tra thủ công từng nhóm