Indexing API
Giao diện lập trình do Google cung cấp cho phép gửi yêu cầu lập chỉ mục hoặc hủy lập chỉ mục URL theo thời gian thực.
Indexing API là gì?
Indexing API là giao diện lập trình (API) do Google cung cấp, cho phép chủ sở hữu website gửi yêu cầu lập chỉ mục hoặc huỷ lập chỉ mục một URL cụ thể ngay lập tức — thay vì chờ Googlebot tự động phát hiện và xử lý theo chu kỳ thông thường.
API này hoạt động dựa trên xác thực OAuth 2.0 và chỉ hỗ trợ các loại tài nguyên thuộc quyền quản trị rõ ràng: trang web được xác minh trong Google Search Console (GSC), ứng dụng Android (qua Google Play), hoặc nội dung AMP đã được liên kết đúng cách. Indexing API không áp dụng cho tất cả URL trên web — chỉ những URL mới xuất bản, cập nhật quan trọng hoặc cần hiển thị nhanh trong kết quả tìm kiếm.
Tại sao quan trọng trong SEO?
Với các trang có tính thời sự cao (tin tức, sản phẩm ra mắt, sự kiện trực tuyến), việc chờ Google thu thập dữ liệu tự nhiên có thể mất từ vài giờ đến vài ngày — dẫn đến bỏ lỡ cơ hội tiếp cận người dùng đúng thời điểm. Indexing API giúp rút ngắn thời gian từ khi đăng tải đến khi xuất hiện trong tìm kiếm xuống còn dưới 1 phút trong nhiều trường hợp (tùy điều kiện mạng, cấu hình server và trạng thái URL).
Nó đặc biệt hữu ích với:
- Các trang động được sinh ra theo yêu cầu (ví dụ: trang sản phẩm mới tạo qua CMS)
- Website có tốc độ thu thập tự nhiên thấp (do crawl budget hạn chế hoặc cấu trúc phức tạp)
- Nội dung có vòng đời ngắn (flash sale, thông báo khẩn cấp, bài phỏng vấn độc quyền)
- Khi kiểm tra hiệu quả của tối ưu hóa kỹ thuật (A/B test meta, schema, canonical)
Lưu ý: Indexing API không đảm bảo xếp hạng, cũng không thay thế các yếu tố SEO cơ bản như chất lượng nội dung, trải nghiệm người dùng hay backlink.
Cách hoạt động
Indexing API hoạt động theo mô hình yêu cầu – phản hồi (request–response). Khi bạn gửi yêu cầu POST tới endpoint của Google với thông tin URL và hành động (URL_UPDATED hoặc URL_REMOVED), Google sẽ:
- Xác thực quyền truy cập qua token OAuth 2.0
- Kiểm tra xem URL có nằm trong danh sách tài nguyên được quản trị trong GSC hay không
- Xác minh robot.txt và thẻ
noindex(nếu có) - Gửi yêu cầu thu thập (crawl) ngay lập tức — nhưng việc lập chỉ mục thực tế vẫn phụ thuộc vào đánh giá chất lượng nội dung và chính sách của Google
Google trả về mã trạng thái HTTP và phản hồi JSON chứa thông tin chi tiết về yêu cầu — ví dụ: "urlNotificationMetadata": {"latestUpdate": {...}}. Thời gian từ gửi yêu cầu đến khi URL xuất hiện trong tìm kiếm có thể dao động từ vài phút đến vài giờ, tuỳ vào mức độ ưu tiên của trang và tình trạng crawl budget.
Hướng dẫn thực hiện
Dưới đây là quy trình chuẩn để sử dụng Indexing API:
- Đăng ký dự án trong Google Cloud Console: Tạo dự án mới → bật API “Indexing API” → cấu hình OAuth consent screen
- Xác minh quyền sở hữu website trong Google Search Console: Dùng phương pháp DNS, HTML file hoặc thẻ meta — phải khớp chính xác với URL gửi yêu cầu
- Tạo credentials: Chọn “OAuth client ID”, chọn loại “Web application”, thêm authorized redirect URIs
- Lấy access token: Sử dụng flow OAuth 2.0 (authorization code) để lấy token có scope
https://www.googleapis.com/auth/indexing - Gửi yêu cầu POST tới
https://indexing.googleapis.com/v3/urlNotifications:publishvới body JSON như sau:
{"url": "https://example.com/bai-viet-moi/", "type": "URL_UPDATED"}
Lưu ý: Mỗi tài khoản có giới hạn 200 yêu cầu/ngày (theo tài liệu chính thức của Google, cập nhật tháng 04/2024). Giới hạn này áp dụng cho toàn bộ dự án, không tính theo từng URL hay domain con.
Lỗi thường gặp
Dưới đây là các lỗi phổ biến và cách xử lý:
| Mã lỗi | Nguồn gốc | Cách khắc phục |
|---|---|---|
403 Forbidden |
Token không có quyền hoặc URL không thuộc tài nguyên được quản trị | Kiểm tra lại quyền trong GSC; đảm bảo URL trùng khớp hoàn toàn (kể cả http/https, dấu gạch chéo cuối) |
400 Bad Request |
URL sai định dạng hoặc thiếu trường bắt buộc | Đảm bảo URL hợp lệ, có schema (http:// hoặc https://), không chứa ký tự đặc biệt chưa được encode |
429 Too Many Requests |
Vượt giới hạn 200 yêu cầu/ngày | Phân bổ yêu cầu đều trong ngày; dùng hàng đợi (queue) và retry logic với backoff |
404 Not Found |
URL trả về mã 404 hoặc bị chặn bởi robot.txt / noindex | Kiểm tra URL trực tiếp; kiểm tra file robots.txt và thẻ meta robots trên trang |
Ví dụ thực tế
Một trang tin điện tử xuất bản bài viết về sự kiện công nghệ lúc 8h sáng. Nếu chỉ dựa vào thu thập tự nhiên, bài viết có thể xuất hiện trong tìm kiếm lúc 14h cùng ngày — do Googlebot quét lại site mỗi 6–8 tiếng. Sau khi tích hợp Indexing API vào hệ thống xuất bản, họ gửi yêu cầu lập chỉ mục ngay khi bài đăng live. Kết quả: bài viết xuất hiện trong kết quả tìm kiếm Google dưới 3 phút, đạt hơn 12.000 lượt hiển thị trong 2 giờ đầu — tăng 37% so với các bài không dùng API.
Một cửa hàng thương mại điện tử cũng dùng Indexing API để đẩy nhanh lập chỉ mục trang sản phẩm mới: mỗi lần thêm sản phẩm vào kho, hệ thống tự động gửi yêu cầu tới API. Thời gian trung bình từ đăng sản phẩm đến xuất hiện trên Google Shopping giảm từ 1,2 ngày xuống còn 22 phút.
Câu hỏi thường gặp
Indexing API có miễn phí không?
Có. Google cung cấp Indexing API hoàn toàn miễn phí, không tính phí theo số yêu cầu hoặc băng thông. Tuy nhiên, giới hạn 200 yêu cầu/ngày vẫn áp dụng — và có thể thay đổi tùy theo chính sách của Google.
Có thể dùng Indexing API cho trang không có SSL không?
Có thể — nhưng chỉ với URL bắt đầu bằng http:// nếu trang đó đã được xác minh trong Search Console theo phương thức phù hợp (ví dụ: HTML file upload). Tuy nhiên, Google khuyến nghị mạnh mẽ dùng HTTPS vì các trang HTTP thường bị hạn chế thu thập và không hỗ trợ một số tính năng như AMP hay rich result.
Indexing API có thay thế sitemap.xml không?
Không. Sitemap.xml giúp Google hiểu cấu trúc tổng thể và ưu tiên thu thập toàn bộ website. Indexing API chỉ xử lý từng URL riêng lẻ, mang tính phản ứng (reactive) và thời gian thực. Cả hai nên dùng song song: sitemap cho chiến lược dài hạn, Indexing API cho nhu cầu tức thì.