404 Not Found
Mã trạng thái HTTP báo hiệu rằng máy chủ không tìm thấy tài nguyên yêu cầu, ảnh hưởng đến trải nghiệm người dùng và khả năng lập chỉ mục.
404 Not Found là gì?
Mã trạng thái HTTP 404 Not Found là phản hồi do máy chủ gửi về trình duyệt khi không tìm thấy trang hoặc tài nguyên (như hình ảnh, file CSS, API endpoint) mà người dùng hoặc công cụ tìm kiếm yêu cầu. Đây là mã lỗi phía máy chủ — nghĩa là yêu cầu đã đến đúng địa chỉ, nhưng nội dung không tồn tại ở vị trí đó.
Khác với mã 403 (Forbidden) hay 500 (Internal Server Error), 404 mang tính trung lập: không phải lỗi bảo mật, không phải sự cố hệ thống — mà là thiếu nội dung. Nó xuất hiện khi URL bị gõ sai, liên kết hỏng, trang đã xóa mà chưa chuyển hướng, hoặc đường dẫn bị thay đổi mà không cập nhật lại.
Tại sao quan trọng trong SEO?
404 ảnh hưởng trực tiếp đến hai trụ cột của Technical SEO: trải nghiệm người dùng (UX) và khả năng lập chỉ mục (crawling & indexing).
- Với người dùng: Trang 404 khiến họ bối rối, tăng tỷ lệ thoát (bounce rate), giảm thời gian ở lại và khả năng chuyển đổi — đặc biệt nếu xuất hiện trên trang chủ, sản phẩm nổi bật hoặc từ kết quả tìm kiếm.
- Với công cụ tìm kiếm: Googlebot gặp nhiều 404 liên tục sẽ tiêu tốn băng thông thu thập dữ liệu (crawl budget), làm chậm việc phát hiện nội dung mới. Nếu hàng loạt trang quan trọng trả về 404 mà không có hướng dẫn xử lý, Google có thể giảm độ tin cậy với toàn bộ miền.
- Với cấu trúc liên kết: Liên kết nội bộ trỏ tới 404 làm gián đoạn luồng phân bổ PageRank, làm yếu hiệu quả SEO tổng thể.
Cách hoạt động
Khi trình duyệt gửi yêu cầu GET tới một URL, máy chủ kiểm tra đường dẫn tương ứng trên hệ thống tập tin hoặc cơ sở dữ liệu. Nếu không tìm thấy bản ghi phù hợp — dù do xóa thủ công, cấu hình sai rewrite rule, hoặc thiếu file index — máy chủ trả về mã trạng thái 404 kèm thông báo mặc định (hoặc trang tùy chỉnh). Quá trình này diễn ra trong vài mili giây và không phụ thuộc vào thời gian tải trang.
Lưu ý: 404 không phải là “lỗi nghiêm trọng” theo nghĩa kỹ thuật — nó là phản hồi hợp lệ, được chuẩn HTTP quy định rõ ràng (RFC 7231). Vấn đề nằm ở cách quản lý và phản hồi sau đó.
Hướng dẫn thực hiện
- Phát hiện sớm: Dùng công cụ như Google Search Console (báo cáo “Crawl errors”), Screaming Frog, hoặc Ahrefs Site Audit để quét toàn bộ site, lọc các URL trả về 404.
- Phân loại nguyên nhân:
- URL cũ đã xóa → cần thiết lập 301 redirect tới trang thay thế phù hợp.
- Liên kết nội bộ sai → sửa URL gốc trong nội dung hoặc menu.
- URL bị viết hoa/ký tự đặc biệt sai → chuẩn hóa bằng canonical hoặc redirect.
- Trang tạm ngừng → dùng 503 (Service Unavailable) thay vì 404.
- Tối ưu trang 404:
- Giữ thiết kế thân thiện: hiển thị logo, thanh tìm kiếm, liên kết tới trang chủ và danh mục chính.
- Thêm văn bản rõ ràng: “Trang bạn tìm không tồn tại. Hãy kiểm tra lại URL hoặc quay lại trang chủ.”
- Không chặn index: đảm bảo thẻ
<meta name="robots" content="index,follow">hoặc không có lệnh noindex — vì Google cần biết đây là trang lỗi hợp lệ, không phải nội dung trùng lặp.
- Theo dõi định kỳ: Thiết lập cảnh báo tự động khi số lượng 404 tăng đột biến (qua Google Search Console hoặc công cụ giám sát uptime).
Lỗi thường gặp
| Lỗi | Hệ quả | Cách khắc phục |
|---|---|---|
| Redirect vòng (redirect loop) tới 404 | Googlebot dừng thu thập, người dùng thấy lỗi trình duyệt | Kiểm tra chuỗi redirect bằng Redirect Path (Chrome extension); sửa rule .htaccess hoặc Nginx config |
| Trang 404 trả mã 200 thay vì 404 | Google coi là trang nội dung bình thường → gây trùng lặp, mất uy tín | Dùng công cụ như httpstatus.io để kiểm tra mã trả về thực tế; sửa template 404 để trả đúng mã 404 |
| Không có trang 404 tùy chỉnh | Người dùng thấy giao diện trắng hoặc thông báo máy chủ mặc định → tăng bounce rate | Tạo file 404.html (hoặc 404.php), cấu hình trong .htaccess hoặc CMS (WordPress: theme hỗ trợ 404.php) |
Ví dụ thực tế
Một cửa hàng điện máy thay đổi cấu trúc URL từ https://site.com/san-pham/tu-lanh sang https://site.com/danh-muc/tu-lanh nhưng không thiết lập redirect. Kết quả:
- Người dùng click từ email marketing cũ → thấy trang 404.
- Google vẫn giữ URL cũ trong kết quả tìm kiếm → 12% lượt click dẫn tới lỗi.
- Sau 3 tuần không xử lý, Google bắt đầu giảm xếp hạng cả danh mục “tủ lạnh” do tín hiệu UX xấu.
Khi đội SEO phát hiện, họ triển khai redirect 301 từ URL cũ sang mới, đồng thời thêm liên kết “Xem tất cả tủ lạnh” trên trang 404. Sau 2 tuần, tỷ lệ click thành công tăng lên 98%, và traffic từ tìm kiếm phục hồi hoàn toàn.
Câu hỏi thường gặp
404 có ảnh hưởng đến thứ hạng website không?
Có — nhưng không trực tiếp. Google không phạt site vì có 404. Tuy nhiên, nếu 404 xuất hiện trên các trang quan trọng, gây trải nghiệm xấu hoặc làm gián đoạn crawl, thì gián tiếp làm giảm chất lượng đánh giá tổng thể và ảnh hưởng đến thứ hạng.
Có nên xóa tất cả URL 404 khỏi Google Search Console?
Không. Chỉ xóa khi bạn chắc chắn rằng URL đó đã không bao giờ tồn tại (ví dụ: URL do bot dò quét ngẫu nhiên). Còn với URL từng tồn tại rồi mất, hãy giữ lại để theo dõi — vì Google sẽ tự loại khỏi chỉ mục sau vài tuần nếu không còn liên kết trỏ tới và không có redirect.
404 và 410 khác nhau thế nào?
Mã 410 Gone cho biết tài nguyên đã bị xóa vĩnh viễn và sẽ không quay lại. Khác với 404 (có thể là tạm thời), 410 giúp Google nhanh chóng loại bỏ URL khỏi chỉ mục — hữu ích khi xóa hàng loạt trang không còn giá trị. Việc sử dụng 410 thay vì 404 là tùy trường hợp, thường áp dụng cho nội dung nhạy cảm hoặc đã xóa theo yêu cầu pháp lý.