Google Search Console

Error URLs

URL gặp lỗi khi thu thập (crawl error), ví dụ: 404, 5xx, chuyển hướng vòng lặp, hoặc timeout.

3 lượt xem Cập nhật: 29/05/2026

Error URLs là gì?

Error URLs là những địa chỉ web mà Googlebot không thể truy cập thành công khi thu thập (crawl) trang. Đây không phải là lỗi do người dùng nhập sai URL, mà là lỗi xảy ra trong quá trình Google tìm hiểu cấu trúc và nội dung website của bạn. Các mã trạng thái HTTP phổ biến gắn với Error URLs bao gồm: 404 (Not Found), 5xx (Server Error), redirect loops (vòng lặp chuyển hướng), và timeout (kết nối chậm hoặc ngắt giữa chừng).

Google Search Console (GSC) báo cáo các Error URLs trong phần Crawl > Crawl Errors (trước đây) hoặc hiện tại ở Indexing > PagesReports > Coverage. Mỗi URL lỗi được ghi nhận kèm thời điểm phát hiện, mã lỗi cụ thể và số lần Googlebot thử truy cập.

Tại sao quan trọng trong SEO?

Error URLs ảnh hưởng trực tiếp đến khả năng lập chỉ mục (indexing) và trải nghiệm người dùng — hai yếu tố then chốt của thứ hạng tìm kiếm.

  • Mất cơ hội hiển thị: Nếu Googlebot không tải được trang, Google không thể đọc nội dung, đánh giá chất lượng hoặc thêm vào bộ chỉ mục → trang sẽ không xuất hiện trong kết quả tìm kiếm.
  • Hao tổn tài nguyên thu thập: Googlebot có giới hạn crawl budget (ngân sách thu thập) cho mỗi website. Việc dành thời gian cho URL lỗi làm giảm số trang hữu ích được thu thập trong cùng chu kỳ.
  • Tác động gián tiếp đến uy tín: Nhiều lỗi 5xx hoặc timeout liên tục có thể khiến Google tạm giảm tần suất thu thập, vì hệ thống nghi ngờ tính ổn định của máy chủ.
  • Ảnh hưởng UX & chuyển đổi: Người dùng nhấp vào liên kết hỏng (ví dụ từ kết quả tìm kiếm hoặc backlink bên ngoài) sẽ gặp trang lỗi → tăng tỷ lệ thoát, giảm thời gian ở lại, làm xấu đi chỉ số hành vi — điều Google theo dõi qua dữ liệu trải nghiệm thực tế (Core Web Vitals, Engagement).

Cách hoạt động

Khi Googlebot ghé thăm website, nó gửi yêu cầu HTTP tới từng URL đã biết (từ sitemap, liên kết nội bộ, backlink). Máy chủ phản hồi bằng một mã trạng thái HTTP. GSC phân loại các phản hồi này:

  • Mã 2xx: Thành công → trang được thu thập và xét lập chỉ mục.
  • Mã 3xx: Chuyển hướng → Googlebot theo dõi nếu hợp lệ (tối đa 5 bước), nhưng cảnh báo nếu phát hiện vòng lặp.
  • Mã 4xx: Lỗi phía client (thường là 404 hoặc 410) → trang bị coi là không tồn tại.
  • Mã 5xx: Lỗi phía server (500, 502, 503, 504…) → Googlebot tạm hoãn và thử lại sau.

GSC tổng hợp các phản hồi lỗi, nhóm theo loại và hiển thị trong báo cáo Coverage. Lưu ý: Không phải tất cả URL lỗi đều cần sửa ngay — ví dụ URL 404 từ trang đã xóa chủ động và không có backlink quan trọng thì có thể để yên.

Hướng dẫn thực hiện

  1. Truy cập Google Search Console → chọn tài sản → vào Reports > Coverage.
  2. Lọc theo trạng thái: Nhấn vào các nhóm như Errored, Excluded, hoặc Valid with warnings để xem chi tiết.
  3. Xuất danh sách lỗi: Dùng nút Export (định dạng CSV) để phân tích sâu hơn trong Excel/Google Sheets.
  4. Phân loại lỗi: Phân biệt giữa:
    • Lỗi do xóa nội dung (404/410)
    • Lỗi do cấu hình sai (redirect loop, 500)
    • Lỗi do kỹ thuật (timeout, DNS fail)
    • Lỗi do chặn thu thập (robots.txt, noindex, password protection)
  5. Ưu tiên xử lý: Tập trung vào URL có:
    • Backlink từ website uy tín
    • Lưu lượng tìm kiếm đáng kể (kiểm tra qua GSC > Performance)
    • Liên kết nội bộ nhiều lần (trên menu, footer, bài viết)
  6. Áp dụng giải pháp phù hợp:
    • Với URL 404 còn cần giữ: thiết lập 301 tới trang tương đương.
    • Với URL 404 không còn giá trị: để nguyên hoặc trả mã 410 nếu muốn xác nhận rõ việc xoá vĩnh viễn.
    • Với lỗi 5xx: kiểm tra log máy chủ, nâng cấp hosting, tối ưu plugin/theme (nếu dùng WordPress).
    • Với redirect loop: rà soát file .htaccess, plugin chuyển hướng, hoặc cài đặt CDN.
  7. Xác minh hiệu quả: Sau khi sửa, dùng công cụ URL Inspection trong GSC để yêu cầu kiểm tra lại. Google sẽ cập nhật trạng thái sau vài giờ đến vài ngày.

Lỗi thường gặp

Lỗi Nguyên nhân phổ biến Cách khắc phục
404 Not Found Xóa trang mà không chuyển hướng; liên kết nội bộ lỗi; URL gõ sai trong sitemap Thiết lập 301 tới trang liên quan; cập nhật sitemap; kiểm tra internal link bằng Screaming Frog
500 Internal Server Error Lỗi script PHP, hết bộ nhớ, xung đột plugin, cấu hình .htaccess sai Xem file error_log; tắt plugin từng cái; tăng memory_limit; khôi phục .htaccess mặc định
Redirect loop Cài 2 plugin chuyển hướng cùng lúc; cấu hình SSL + www/non-www chồng chéo; CDN thiết lập sai Rà soát toàn bộ quy tắc chuyển hướng; kiểm tra headers bằng curl hoặc Redirect Checker; vô hiệu hóa plugin gây xung đột
Timeout Máy chủ phản hồi chậm > 30 giây; hosting quá tải; trang nặng (hình, JS, CSS chưa tối ưu) Nâng cấp hosting; bật cache; nén ảnh; loại bỏ script chặn render; kiểm tra Core Web Vitals

Ví dụ thực tế

Một website bán hàng điện máy từng có trang sản phẩm https://example.com/may-giat-samsung-inverter. Sau 2 năm, sản phẩm ngừng kinh doanh và trang bị xóa. Tuy nhiên, trang vẫn xuất hiện trong kết quả tìm kiếm và nhận ~200 lượt click/tuần từ Google. Khi kiểm tra GSC, URL này nằm trong nhóm Errored > 404. Đội SEO đã tạo redirect 301 tới danh mục Máy giặt Samsung. Sau 10 ngày, lượt hiển thị (impressions) tăng 18%, và tỷ lệ nhấp (CTR) cải thiện từ 3,2% lên 5,7% — vì người dùng được đưa tới trang có nội dung liên quan thay vì trang lỗi.

Lưu ý: Việc redirect 301 không đảm bảo phục hồi 100% thứ hạng, nhưng giúp giữ lại phần lớn giá trị SEO (link equity, UX, tín hiệu hành vi).

Câu hỏi thường gặp

Error URLs có làm website bị phạt không?

Không. Google không phạt website chỉ vì có Error URLs. Tuy nhiên, nếu số lượng lỗi tăng đột biến (đặc biệt là 5xx) trong thời gian dài, Google có thể giảm tần suất thu thập — điều này gián tiếp làm chậm tốc độ lập chỉ mục các trang mới.

Có nên sửa tất cả URL lỗi 404 không?

Không bắt buộc. Chỉ cần xử lý những URL 404 có lưu lượng tìm kiếm, backlink chất lượng hoặc liên kết nội bộ mạnh. Các URL 404 không có lưu lượng và không được liên kết tới có thể để nguyên — Google sẽ tự loại khỏi chỉ mục sau vài tuần.

URL bị chặn bởi robots.txt có xuất hiện trong Error URLs không?

Không. URL bị chặn bởi robots.txt sẽ xuất hiện trong nhóm Excluded (không phải Errored) trong báo cáo Coverage. Đây không phải lỗi thu thập, mà là hành vi chủ động ngăn Googlebot truy cập — nên không ảnh hưởng đến crawl budget hay thứ hạng, trừ khi bạn vô tình chặn nhầm trang quan trọng.