SEO Tools & Software

Orphan Page Detection

Xác định các trang không có liên kết nội bộ nào trỏ tới, gây khó khăn cho việc lập chỉ mục và phân bổ authority.

4 lượt xem Cập nhật: 29/05/2026

Orphan Page Detection là gì?

Orphan Page Detection (phát hiện trang mồ côi) là quy trình xác định các trang trên website không có bất kỳ liên kết nội bộ nào trỏ tới — nghĩa là không có trang nào khác trong cùng tên miền liên kết đến chúng bằng thẻ <a href="...">. Những trang này tồn tại nhưng bị 'cô lập' với cấu trúc điều hướng và kiến trúc liên kết nội bộ của website.

Chúng không nhất thiết là trang lỗi hay trang rác: có thể là bài viết cũ, trang sản phẩm ngừng kinh doanh, trang giới thiệu dự án đã đóng, hoặc thậm chí là trang mới vừa xuất bản nhưng chưa được liên kết từ menu, sidebar, bài viết liên quan hay sitemap nội bộ.

Tại sao quan trọng trong SEO?

Công cụ tìm kiếm như Google chủ yếu khám phá trang mới thông qua liên kết — cả liên kết nội bộ lẫn liên kết từ bên ngoài. Khi một trang không có liên kết nội bộ nào, khả năng bot tìm kiếm phát hiện và lập chỉ mục nó giảm mạnh. Dẫn đến:

  • Trang không xuất hiện trong kết quả tìm kiếm dù nội dung hợp lệ;
  • Authority (trọng lượng liên kết) không được phân bổ tới trang đó, làm giảm hiệu quả tối ưu hóa tổng thể;
  • Rủi ro cao hơn về việc trang bị xem là 'không quan trọng' hoặc 'bị bỏ quên', ảnh hưởng tiêu cực đến trải nghiệm người dùng và tỷ lệ thoát;
  • Nếu trang có giá trị (ví dụ: hướng dẫn chi tiết, so sánh sản phẩm), việc để nó trở thành orphan page đồng nghĩa với việc lãng phí cơ hội chuyển đổi.

Theo báo cáo kiểm tra hàng triệu trang từ Ahrefs và Screaming Frog năm 2023–2024, khoảng 12–18% website thương mại điện tử và blog lớn có từ 5–200 trang orphan — nhiều trong số đó là trang danh mục hoặc sản phẩm đã ẩn nhưng chưa xóa.

Cách hoạt động

Orphan Page Detection dựa trên hai dữ liệu chính:

  1. Danh sách toàn bộ URL được thu thập (từ crawl site, sitemap.xml, hoặc log server);
  2. Bản đồ liên kết nội bộ — tức là tập hợp tất cả các thẻ <a> có thuộc tính href trỏ vào URL trong cùng tên miền.

Một trang được xác định là orphan khi:
– Nó xuất hiện trong danh sách URL (đã được bot thu thập hoặc khai báo trong sitemap),
– Nhưng không xuất hiện trong bất kỳ giá trị href nào của các trang khác trên cùng tên miền.

Lưu ý: Việc kiểm tra không phụ thuộc vào số lượng backlink từ bên ngoài — vì orphan page chỉ xét liên kết nội bộ. Một trang có 50 backlink từ website khác vẫn là orphan nếu không có liên kết nào từ chính website đó.

Hướng dẫn thực hiện

Dưới đây là 4 cách phổ biến để phát hiện trang mồ côi, từ thủ công đến tự động:

  1. Sử dụng công cụ crawl chuyên dụng:
    – Chạy Screaming Frog SEO Spider (phiên bản miễn phí hỗ trợ đến 500 URL; phiên bản trả phí không giới hạn).
    – Sau khi crawl xong, vào tab Response Codes → lọc mã 200, sau đó sang tab Internal Links → chọn cột Internal Links In → sắp xếp tăng dần. Các URL có giá trị 0 ở cột này là orphan page.
    – Lưu ý: Đảm bảo bật tùy chọn Follow External LinksRespect robots.txt phù hợp để tránh thiếu sót.
  2. Kết hợp Google Search Console + Excel:
    – Xuất danh sách tất cả URL đã được lập chỉ mục (từ báo cáo URL Inspection hoặc Pages trong GSC).
    – Crawl toàn bộ site để lấy danh sách tất cả URL có liên kết nội bộ (dùng Sitebulb, DeepCrawl hoặc Python + BeautifulSoup).
    – Dùng hàm =VLOOKUP hoặc =MATCH để so sánh hai danh sách — những URL có mặt trong GSC nhưng không xuất hiện trong danh sách 'internal links in' là orphan.
  3. Sử dụng sitemap.xml làm điểm chuẩn:
    – So sánh danh sách URL trong sitemap.xml với danh sách URL được trỏ tới bởi các liên kết nội bộ.
    – Trang nằm trong sitemap nhưng không có liên kết nội bộ nào trỏ tới thường là candidate cho orphan page — đặc biệt nếu trang đó không có backlink ngoài.
  4. Phân tích log server (nâng cao):
    – Kiểm tra tần suất bot Googlebot truy cập từng URL trong log server.
    – Nếu một URL xuất hiện trong log nhưng không bao giờ được truy cập qua liên kết nội bộ (chỉ qua sitemap hoặc direct request), khả năng cao là orphan — tuy nhiên phương pháp này đòi hỏi quyền truy cập server và kỹ năng phân tích log.

Lỗi thường gặp

Dưới đây là 3 sai lầm phổ biến khi xử lý orphan page — kèm giải pháp cụ thể:

  • Lỗi 1: Xóa ngay trang orphan mà không kiểm tra giá trị nội dung
    → Khắc phục: Trước khi xóa, kiểm tra: (1) Trang có đang nhận traffic từ search? (2) Có backlink ngoài chất lượng không? (3) Có thể tái sử dụng nội dung không? Nếu có giá trị, hãy thêm liên kết nội bộ thay vì xóa.
  • Lỗi 2: Thêm liên kết nội bộ 'cưỡng bức' vào trang không liên quan
    → Khắc phục: Liên kết phải mang tính ngữ cảnh và hữu ích. Ví dụ: trang hướng dẫn 'Cách thay pin laptop' nên được liên kết từ bài viết 'Sửa laptop tại nhà', không phải từ trang chủ hay menu chính trừ khi có lý do rõ ràng.
  • Lỗi 3: Bỏ qua trang orphan trong subdomain hoặc www/non-www
    → Khắc phục: Orphan page detection phải chạy riêng cho từng phiên bản (www.example.com và example.com được coi là hai hệ thống khác nhau). Cần crawl và so sánh riêng từng phiên bản — hoặc chuẩn hóa redirect trước.

Ví dụ thực tế

Một website bán phần mềm quản lý nhân sự có 1.247 trang. Sau khi crawl bằng Screaming Frog, nhóm SEO phát hiện 43 trang có mã phản hồi 200 nhưng Internal Links In = 0. Trong đó:

Loại trang Số lượng Hành động đã thực hiện Kết quả sau 30 ngày
Trang case study cũ (2020) 12 Liên kết từ bài viết 'Dự án triển khai thành công' Tăng traffic tìm kiếm +37%, giữ vị trí top 3 cho từ khóa 'phần mềm HRM cho doanh nghiệp vừa và nhỏ'
Trang sản phẩm ngừng kinh doanh 19 Chuyển hướng 301 tới danh mục tương ứng Giảm tỷ lệ thoát trang danh mục -11%, không còn cảnh báo 'soft 404' trong GSC
Trang giới thiệu đối tác (chưa hoàn thiện) 12 Xóa + chặn index bằng noindex Không còn xuất hiện trong kết quả tìm kiếm, không ảnh hưởng đến CTR chung

Câu hỏi thường gặp

Orphan page có ảnh hưởng trực tiếp đến xếp hạng toàn site không?

Không — Google không phạt toàn bộ website vì có orphan page. Tuy nhiên, nếu số lượng lớn (trên 100 trang trên site dưới 5.000 URL) và chứa nội dung trùng lặp, mỏng hoặc không liên quan, có thể làm suy giảm độ tin cậy tổng thể và phân tán crawl budget — gián tiếp ảnh hưởng đến hiệu suất SEO.

Một trang có thể là orphan nhưng vẫn được lập chỉ mục?

Có thể. Điều này xảy ra khi trang được đưa vào sitemap.xml, hoặc có backlink ngoài mạnh, hoặc được submit thủ công qua Google Search Console. Tuy nhiên, khả năng duy trì lập chỉ mục lâu dài sẽ thấp nếu không có liên kết nội bộ hỗ trợ.

Cần kiểm tra orphan page bao lâu một lần?

Với website cập nhật thường xuyên (trên 20 bài/tháng): kiểm tra mỗi quý. Với website tĩnh hoặc ít thay đổi: kiểm tra mỗi 6 tháng là đủ. Trường hợp website vừa nâng cấp hệ thống hoặc di chuyển URL, cần kiểm tra ngay sau khi triển khai.