Broken Link
Liên kết dẫn đến trang trả về mã trạng thái lỗi (thường là 404 hoặc 5xx), làm gián đoạn trải nghiệm người dùng và crawl.
Broken Link là gì?
Broken Link (liên kết hỏng) là một đường dẫn trên website trỏ đến một trang không tồn tại hoặc không thể truy cập được, thường trả về mã trạng thái HTTP lỗi như 404 Not Found, 410 Gone, 500 Internal Server Error, 503 Service Unavailable hoặc các mã 5xx khác. Đây không phải là lỗi hiển thị trên giao diện người dùng mà là phản hồi kỹ thuật từ máy chủ khi trình duyệt hoặc bot tìm kiếm yêu cầu tải trang.
Tại sao quan trọng trong SEO?
Broken Link ảnh hưởng trực tiếp đến cả trải nghiệm người dùng và hiệu quả thu thập dữ liệu (crawling) của công cụ tìm kiếm:
- Làm giảm tỷ lệ giữ chân người dùng: Người đọc bấm vào liên kết nhưng gặp trang lỗi sẽ rời đi ngay — tăng tỷ lệ thoát (bounce rate) và giảm thời gian ở lại.
- Cản trở quá trình thu thập dữ liệu: Khi bot Googlebot gặp nhiều broken link, nó có thể tiêu tốn hạn ngạch crawl (crawl budget) vào các URL vô ích thay vì ưu tiên nội dung chất lượng.
- Ảnh hưởng đến phân bổ PageRank: Liên kết nội bộ hỏng làm gián đoạn luồng truyền giá trị liên kết (link equity) giữa các trang, khiến một số trang mất tín hiệu xếp hạng tiềm năng.
- Gây tổn hại uy tín thương hiệu: Website chứa nhiều liên kết lỗi cho thấy thiếu kiểm soát chất lượng, làm giảm độ tin cậy trong mắt người dùng và đối tác.
Theo báo cáo của Ahrefs năm 2023, trung bình 6–12% liên kết nội bộ trên các website lớn bị hỏng sau 12 tháng — con số này cao hơn ở website thường xuyên cập nhật nội dung hoặc thay đổi cấu trúc URL.
Cách hoạt động
Khi người dùng hoặc bot click vào một liên kết, trình duyệt gửi yêu cầu HTTP đến máy chủ chứa URL đích. Máy chủ phản hồi bằng một mã trạng thái (HTTP status code). Nếu mã trả về nằm trong nhóm lỗi (4xx hoặc 5xx), trình duyệt hiển thị trang lỗi hoặc xử lý theo cấu hình (ví dụ: chuyển hướng 301 tới trang khác, hoặc hiện thông báo lỗi). Công cụ tìm kiếm ghi nhận mã này và đánh giá mức độ tin cậy, khả năng truy cập của trang đó.
Broken link không chỉ xuất hiện ở liên kết nội bộ — còn có thể ở liên kết ngoài (outbound) hoặc liên kết nhúng (ảnh, CSS, JS) nếu file nguồn bị xóa hoặc di chuyển mà không cập nhật đường dẫn.
Hướng dẫn thực hiện
Phát hiện và xử lý broken link là phần bắt buộc trong mọi SEO Audit. Các bước thực hiện chuẩn gồm:
- Quét toàn bộ website: Dùng công cụ như Screaming Frog SEO Spider (miễn phí đến 500 URL), Sitebulb, DeepCrawl hoặc Ahrefs Site Audit để thu thập tất cả URL và mã trạng thái.
- Lọc kết quả theo mã lỗi: Tập trung vào các nhóm:
404,410,5xx,0(URL không phản hồi), vàredirect chains dài > 3 bước. - Phân loại broken link:
- Nội bộ: Liên kết từ trang này sang trang khác trong cùng tên miền.
- Ngoại bộ: Liên kết trỏ ra ngoài — cần kiểm tra xem có nên giữ, cập nhật hay xoá.
- Liên kết tài nguyên: Hình ảnh, file PDF, script bị mất — gây lỗi hiển thị hoặc cảnh báo trong Console.
- Xác định nguyên nhân: So sánh URL lỗi với lịch sử CMS, bản sao lưu hoặc Google Cache để biết trang đã bị xóa, đổi tên, hoặc chưa bao giờ tồn tại.
- Áp dụng giải pháp phù hợp:
- Với trang nội bộ còn giá trị: tạo 301 redirect tới phiên bản mới hoặc trang tương đương.
- Với trang không còn tồn tại và không có nội dung thay thế: giữ mã 410 Gone (ưu tiên hơn 404 nếu chắc chắn không khôi phục).
- Với liên kết ngoài hỏng: cập nhật URL gốc hoặc thay bằng nguồn đáng tin cậy hơn — hoặc xoá nếu không cần thiết.
- Kiểm tra lại: Sau khi sửa, chạy lại quét để xác nhận mã trạng thái đã thay đổi thành
200 OKhoặc301.
Lỗi thường gặp
Dưới đây là những sai lầm phổ biến khi xử lý broken link và cách khắc phục:
| Lỗi | Hệ quả | Cách khắc phục |
|---|---|---|
| Dùng 302 thay vì 301 cho redirect vĩnh viễn | Google không truyền PageRank đầy đủ; coi là tạm thời → không ổn định xếp hạng | Luôn dùng 301 redirect khi thay đổi URL vĩnh viễn |
| Redirect vòng (redirect loop) | Bot không thể thu thập, người dùng thấy lỗi “ERR_TOO_MANY_REDIRECTS” | Kiểm tra chuỗi redirect bằng công cụ như Redirect Checker; đảm bảo mỗi URL chỉ redirect tối đa 1 lần |
| Bỏ qua broken link ngoại bộ | Mất cơ hội cải thiện uy tín liên kết và trải nghiệm người dùng | Đánh giá từng outbound link: cập nhật URL, thay nguồn, hoặc xoá nếu không liên quan |
| Không cập nhật sitemap sau sửa | Google vẫn crawl URL cũ hoặc bỏ sót trang mới | Cập nhật sitemap.xml, gửi lại qua Google Search Console |
Ví dụ thực tế
Một website bán hàng điện máy có bài viết “Hướng dẫn chọn điều hoà Inverter 2022”. Năm 2024, họ cập nhật lại nội dung thành “Hướng dẫn chọn điều hoà Inverter 2024” và đổi URL từ /huong-dan-chon-dieu-hoa-inverter-2022 sang /huong-dan-chon-dieu-hoa-inverter-2024. Tuy nhiên, họ quên cập nhật 17 liên kết nội bộ từ các bài blog khác — dẫn đến 17 broken link 404.
Sau khi quét bằng Screaming Frog, đội SEO phát hiện lỗi, tạo redirect 301 từ URL cũ sang mới, đồng thời cập nhật 3 liên kết nội bộ quan trọng nhất trong nội dung chính. Kết quả sau 2 tuần: tỷ lệ thoát giảm 11%, thời gian ở lại tăng 18%, và trang mới đạt top 3 Google cho từ khoá “chọn điều hoà inverter”.
Câu hỏi thường gặp
Broken link có làm website bị phạt bởi Google không?
Không. Google không phạt website chỉ vì có broken link. Tuy nhiên, nếu số lượng quá lớn (hàng nghìn) và kéo dài nhiều tháng, hệ thống có thể đánh giá thấp chất lượng tổng thể — dẫn đến giảm độ ưu tiên thu thập và xếp hạng chậm hơn. Đây là yếu tố gián tiếp, không phải hình phạt.
Có nên sửa tất cả broken link hay chỉ tập trung vào liên kết nội bộ?
Ưu tiên sửa tất cả broken link nội bộ vì chúng ảnh hưởng trực tiếp đến kiến trúc site và trải nghiệm người dùng. Với liên kết ngoài: chỉ sửa nếu là nguồn uy tín, đang được tham chiếu trong nội dung quan trọng — còn lại có thể xoá hoặc thay thế. Việc xử lý outbound link phụ thuộc vào mục tiêu chiến lược và mức độ liên quan.
Thời điểm nào nên kiểm tra broken link?
Nên kiểm tra định kỳ: mỗi quý một lần với website vừa và nhỏ; mỗi tháng với website lớn, thường xuyên đăng bài hoặc thay đổi cấu trúc. Ngoài ra, luôn kiểm tra sau mỗi đợt nâng cấp CMS, di dời hosting, hoặc cập nhật URL hàng loạt. Việc tích hợp kiểm tra tự động vào quy trình CI/CD là tốt nhất — tùy trường hợp.