Google Search Console

Not Found (404)

Lỗi HTTP khi máy chủ không tìm thấy tài nguyên tại URL được yêu cầu, hiển thị trong báo cáo Coverage.

3 lượt xem Cập nhật: 29/05/2026

Not Found (404) là gì?

Lỗi Not Found (404) là mã trạng thái HTTP do máy chủ trả về khi người dùng hoặc công cụ tìm kiếm yêu cầu truy cập một URL mà máy chủ không thể tìm thấy tài nguyên tương ứng. Đây không phải lỗi ở phía trình duyệt hay kết nối mạng, mà là thông báo rõ ràng: tài nguyên đã bị xóa, đổi tên, di chuyển mà chưa thiết lập chuyển hướng, hoặc URL bị gõ sai.

Trong Google Search Console (GSC), lỗi 404 xuất hiện trong báo cáo Coverage (Phạm vi lập chỉ mục), nằm dưới nhóm "Excluded" (Loại trừ) hoặc "Error" (Lỗi), tuỳ vào cách Google phân loại và thời điểm phát hiện. Lưu ý: Không phải tất cả URL 404 đều ảnh hưởng tiêu cực đến SEO — điều quan trọng là xác định nguồn gốcmức độ ảnh hưởng của chúng.

Tại sao quan trọng trong SEO?

Lỗi 404 có vai trò then chốt trong quản trị SEO vì:

  • Tác động đến trải nghiệm người dùng: Người truy cập gặp trang lỗi sẽ rời đi nhanh (tỷ lệ thoát cao), làm giảm thời gian ở lại và khả năng chuyển đổi.
  • Lãng phí ngân sách thu thập dữ liệu (crawl budget): Googlebot dành thời gian và tài nguyên để yêu cầu các URL trả về 404 thay vì khám phá nội dung mới hoặc quan trọng hơn.
  • Gây nhiễu báo cáo GSC: Số lượng 404 tăng đột biến có thể che khuất các vấn đề nghiêm trọng hơn như lỗi 5xx, redirect chain hoặc canonical sai.
  • Ảnh hưởng gián tiếp đến thứ hạng: Nếu nhiều trang có giá trị (ví dụ: bài viết cũ được liên kết từ bên ngoài) trả về 404 mà không có chuyển hướng phù hợp, Google có thể ngừng hiển thị chúng trong kết quả tìm kiếm — dẫn đến mất lưu lượng truy cập tự nhiên.

Lưu ý: Google không phạt trang web chỉ vì có lỗi 404. Nhưng việc bỏ mặc hàng trăm URL 404 từ các trang quan trọng (đặc biệt là những URL từng được index và có backlink) là rủi ro thực tế.

Cách hoạt động

Khi người dùng hoặc Googlebot gửi yêu cầu GET tới một URL, máy chủ web (Apache, Nginx, v.v.) kiểm tra đường dẫn trên hệ thống tệp hoặc cơ sở dữ liệu. Nếu không tìm thấy tệp, thư mục hoặc route khớp với URL đó, máy chủ trả về mã trạng thái HTTP 404 Not Found cùng một trang HTML lỗi (có thể tuỳ chỉnh hoặc mặc định). Trình duyệt hiển thị trang này cho người dùng; Googlebot ghi nhận và báo cáo trong GSC sau vài ngày — tuỳ tốc độ thu thập và tần suất kiểm tra.

Quá trình này không liên quan đến DNS, SSL hay firewall — nếu URL giải quyết được tên miền và kết nối thành công tới máy chủ, nhưng máy chủ không tìm thấy nội dung, thì 404 là kết quả chuẩn.

Hướng dẫn thực hiện

Dưới đây là quy trình xử lý lỗi 404 trong Google Search Console một cách hiệu quả:

  1. Xác định nguồn gốc: Vào Coverage > Errors > Not found (404) trong GSC. Sắp xếp theo "Pages" hoặc "Linked from" để ưu tiên các URL có backlink hoặc được internal link.
  2. Phân loại URL:
    • URL đã xóa vĩnh viễn (không còn giá trị): giữ nguyên 404 hoặc trả về 410 (Gone) nếu muốn thông báo rõ hơn.
    • URL đã di chuyển: thiết lập chuyển hướng 301 tới URL mới chính xác.
    • URL bị gõ sai / spam / bot tạo: kiểm tra referrer và user-agent; nếu không có traffic thực, không cần sửa — Google sẽ ngừng thu thập sau vài lần thất bại.
  3. Thiết lập trang 404 thân thiện: Tạo trang lỗi có nội dung rõ ràng, thanh tìm kiếm, menu điều hướng và gợi ý nội dung liên quan — giúp người dùng tiếp tục hành trình chứ không rời đi ngay.
  4. Theo dõi sau xử lý: Sau khi áp dụng chuyển hướng hoặc cập nhật nội dung, dùng công cụ URL Inspection trong GSC để yêu cầu kiểm tra lại. Google sẽ cập nhật trạng thái trong báo cáo Coverage sau 3–7 ngày.
  5. Tối ưu crawl budget: Loại bỏ các URL 404 khỏi sitemap.xml nếu chúng không còn tồn tại và không có giá trị.

Lỗi thường gặp

Dưới đây là những sai lầm phổ biến khi xử lý 404 và cách khắc phục:

Lỗi Hệ quả Cách khắc phục
Chuyển hướng 404 tới trang chủ (301 → homepage) Mất ngữ cảnh, người dùng bối rối; Google coi là chuyển hướng kém chất lượng Chỉ chuyển hướng tới trang tương đương về chủ đề và cấu trúc (ví dụ: /blog/bai-viet-cu → /blog/bai-viet-moi)
Dùng meta refresh hoặc JavaScript redirect cho 404 Google không theo dõi hoặc xử lý đúng — vẫn báo lỗi trong GSC Luôn dùng HTTP status code 301/302 ở cấp máy chủ hoặc .htaccess/Nginx config
Giữ URL 404 trong sitemap.xml Gây lãng phí crawl budget; làm chậm quá trình thu thập nội dung mới Loại bỏ ngay khỏi sitemap; kiểm tra định kỳ bằng công cụ như Screaming Frog
Không kiểm tra backlink trước khi xóa URL Mất lưu lượng từ bên ngoài, ảnh hưởng uy tín trang Dùng Ahrefs/SE Ranking để kiểm tra backlink; nếu có link chất lượng → chuyển hướng 301 hoặc tạo nội dung thay thế

Ví dụ thực tế

Một website thương mại điện tử từng có danh mục sản phẩm /danh-muc/may-tinh-bang. Sau khi tái cơ cấu, danh mục này được đổi thành /san-pham/may-tinh-bang nhưng không thiết lập chuyển hướng. Kết quả:

  • Googlebot tiếp tục thu thập URL cũ mỗi tuần → báo cáo 404 trong GSC.
  • Nhiều bài viết blog và đối tác liên kết tới URL cũ → người dùng nhấn vào link và thấy trang lỗi.
  • Do không có 301, Google dần loại bỏ URL cũ khỏi chỉ mục → lưu lượng từ từ giảm 65% trong 3 tháng.

Sau khi triển khai chuyển hướng 301 từ /danh-muc/may-tinh-bang/san-pham/may-tinh-bang, trong vòng 10 ngày:

  • Googlebot bắt đầu thu thập URL mới.
  • URL cũ biến mất khỏi báo cáo Coverage.
  • Lưu lượng phục hồi về 92% mức ban đầu sau 4 tuần.

Câu hỏi thường gặp

404 có làm giảm thứ hạng toàn trang không?

Không. Google xác nhận rằng lỗi 404 đơn lẻ hoặc số lượng nhỏ không ảnh hưởng trực tiếp đến thứ hạng chung của trang web. Tuy nhiên, nếu hàng trăm URL quan trọng (có backlink, traffic cao) trả về 404 mà không xử lý, hiệu ứng tích luỹ có thể làm giảm uy tín và khả năng hiển thị tổng thể.

Có nên đổi 404 thành 301 cho mọi URL lỗi?

Không. Chỉ chuyển hướng khi có URL đích phù hợp và liên quan. Chuyển hướng bừa bãi (ví dụ: mọi 404 → trang chủ) gây nhiễu tín hiệu cấu trúc và làm giảm trải nghiệm. Với URL không còn giá trị, giữ nguyên 404 hoặc dùng 410 là lựa chọn tốt hơn.

Google có thu thập lại URL 404 sau khi đã báo lỗi?

Có. Googlebot thường thử lại các URL 404 sau vài ngày hoặc vài tuần, tùy tần suất thu thập. Nếu URL vẫn trả về 404 sau khoảng 3–6 lần thử, Google sẽ ngừng thu thập và loại bỏ dần khỏi chỉ mục. Thời gian chính xác tùy trường hợp, phụ thuộc vào mức độ quan trọng của URL và lịch sử crawl trước đó.