SEO Cơ Bản

User Agent

Chuỗi ký tự xác định trình duyệt hoặc bot (như Googlebot) khi gửi yêu cầu tới máy chủ.

2 lượt xem Cập nhật: 26/05/2026

User Agent là gì?

User Agent (UA) là một chuỗi ký tự do trình duyệt, ứng dụng hoặc bot gửi kèm trong mỗi yêu cầu HTTP khi truy cập vào một trang web. Chuỗi này cho biết loại thiết bị, hệ điều hành, tên và phiên bản trình duyệt (hoặc bot), đôi khi cả thông tin kiến trúc phần cứng. Ví dụ: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 — đây là UA của Chrome trên Windows 10.

Tại sao quan trọng trong SEO?

User Agent ảnh hưởng trực tiếp đến cách máy chủ xử lý yêu cầu và cách công cụ tìm kiếm lập chỉ mục trang. Googlebot (UA chính thức của Google) phải được nhận diện đúng để website gửi nội dung đầy đủ, không chặn nhầm bằng robots.txt hay tường lửa. Nếu UA bị giả mạo hoặc cấu hình sai, bot có thể:

  • Bị từ chối truy cập do quy tắc bảo mật (như Cloudflare chặn UA lạ)
  • Không tải được CSS/JS nếu server trả nội dung tối giản cho mobile UA
  • Không thấy nội dung động (rendered content) nếu UA không hỗ trợ JavaScript
  • Gây hiện tượng cloaking nếu server trả nội dung khác cho bot và người dùng — vi phạm nguyên tắc Google.

Do đó, kiểm soát UA là bước nền tảng để đảm bảo khả năng thu thập (crawling) và lập chỉ mục (indexing) ổn định.

Cách hoạt động

Khi trình duyệt hoặc bot gửi yêu cầu HTTP tới máy chủ, nó tự động thêm tiêu đề User-Agent vào phần header. Máy chủ đọc giá trị này để quyết định:

  1. Có cho phép truy cập hay không (qua robots.txt, firewall, hoặc cấu hình Nginx/Apache)
  2. Trả phiên bản trang phù hợp (desktop/mobile, AMP, hoặc phiên bản dành riêng cho bot)
  3. Ghi log để phân tích lưu lượng (ví dụ: phân biệt lượt truy cập thật và bot)

Lưu ý: Giá trị UA hoàn toàn do phía client đặt — nên dễ bị giả mạo. Vì vậy, máy chủ không nên dựa duy nhất vào UA để xác thực người dùng, mà cần kết hợp các yếu tố khác như IP, hành vi, hoặc chứng thực.

Hướng dẫn thực hiện

Dưới đây là các bước kiểm tra và quản lý User Agent hiệu quả cho SEO:

  1. Kiểm tra UA hiện tại: Mở DevTools (F12) → tab Network → tải lại trang → click bất kỳ yêu cầu nào → xem phần Request Headers → tìm dòng User-Agent.
  2. Xác minh UA của Googlebot: Dùng công cụ Google Search Console > Truy cập & Lập chỉ mục > Báo cáo thu thập. So sánh UA trong log server với danh sách chính thức: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) (desktop) hoặc Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.6045.105 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) (mobile).
  3. Cho phép UA hợp lệ trong robots.txt: Không chặn Googlebot bằng User-agent: Googlebot + Disallow: /. Thay vào đó, chỉ giới hạn vùng không cần lập chỉ mục (ví dụ: Disallow: /wp-admin/).
  4. Không chặn UA bằng tường lửa trừ khi có lý do rõ ràng: Một số CDN (Cloudflare, Sucuri) có tính năng “Block suspicious user agents”. Tắt tính năng này hoặc loại trừ UA của Googlebot, Bingbot, DuckDuckBot khỏi danh sách chặn.
  5. Kiểm tra phản hồi theo UA: Dùng lệnh curl -A "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" https://example.com để mô phỏng yêu cầu từ Googlebot và so sánh kết quả với yêu cầu từ Chrome.

Lỗi thường gặp

Lỗi Dấu hiệu Cách khắc phục
Googlebot bị chặn bởi robots.txt Trong Search Console xuất hiện cảnh báo “Đã chặn bot” hoặc số lần thu thập giảm mạnh Sửa file robots.txt: Xóa hoặc sửa dòng User-agent: * + Disallow: /; kiểm tra lại cú pháp bằng Công cụ kiểm tra robots.txt của Google.
UA bị thay đổi do plugin hoặc theme WordPress Log server ghi nhận UA lạ (ví dụ: WordPress/6.5; https://example.com) khi Googlebot truy cập Vô hiệu hóa plugin “SEO cloaking”, “mobile switcher”, hoặc “user agent spoofer”; kiểm tra file .htaccess hoặc functions.php có đoạn thay đổi $_SERVER['HTTP_USER_AGENT'].
Server trả nội dung khác cho bot và người dùng Googlebot thấy trang trắng, lỗi 404, hoặc nội dung tối giản trong Search Console > Báo cáo thu thập Dùng curl hoặc công cụ Fetch & Render để so sánh HTML thực tế giữa UA người dùng và bot. Sửa logic server để trả cùng nội dung — trừ khi dùng kỹ thuật hợp lệ như dynamic rendering (chỉ áp dụng khi SSR không khả thi).

Ví dụ thực tế

Một website thương mại điện tử sử dụng hệ thống phát hiện thiết bị để chuyển hướng người dùng mobile sang phiên bản nhẹ (m.example.com). Tuy nhiên, họ vô tình cấu hình Nginx chặn tất cả UA chứa từ Mobile — khiến Googlebot Mobile bị chuyển hướng sai sang trang lỗi 404. Sau khi kiểm tra log, đội SEO phát hiện hàng nghìn yêu cầu từ Googlebot/2.1 (+http://www.google.com/bot.html) bị trả mã 404. Họ cập nhật quy tắc Nginx để loại trừ UA của Googlebot và Bingbot, đồng thời chuyển sang dùng tín hiệu Vary: User-Agent thay vì chuyển hướng. Kết quả: tỷ lệ thu thập tăng 40% sau 2 tuần.

Câu hỏi thường gặp

User Agent có ảnh hưởng đến thứ hạng không?

Không trực tiếp. Google không dùng UA làm tín hiệu xếp hạng. Nhưng nếu UA gây ra vấn đề thu thập hoặc lập chỉ mục (ví dụ: bot không tải được trang), thì gián tiếp làm giảm khả năng hiển thị — từ đó ảnh hưởng đến thứ hạng.

Có nên thay đổi User Agent của website để cải thiện SEO?

Không. Việc thay đổi UA ở phía client (trình duyệt) không giúp SEO. Ở phía server, việc “giả mạo” UA để trả nội dung khác cho bot là hành vi cloaking — vi phạm chính sách Google và có thể bị phạt. Chỉ dùng UA để phân biệt và tối ưu trải nghiệm — không để che giấu nội dung.

Googlebot có nhiều User Agent không?

Có. Google sử dụng ít nhất 3 UA chính: Googlebot Desktop, Googlebot Smartphone (dùng cho lập chỉ mục phiên bản mobile-first), và Googlebot Images. Ngoài ra còn có AdsBot-Google, Storebot-Google… Danh sách đầy đủ được cập nhật tại tài liệu chính thức của Google. Việc nhận diện đúng từng loại giúp tối ưu cấu hình server và CDN.