On-Page SEO

Document Language Declaration

Thuộc tính lang trong thẻ <html> (ví dụ: lang="vi") giúp công cụ tìm kiếm xác định ngôn ngữ nội dung chính xác.

4 lượt xem Cập nhật: 27/05/2026

Document Language Declaration là gì?

Document Language Declaration (khai báo ngôn ngữ tài liệu) là việc sử dụng thuộc tính lang trong thẻ <html> để chỉ rõ ngôn ngữ chính được dùng trong toàn bộ trang web. Ví dụ: <html lang="vi"> cho trang tiếng Việt, <html lang="en-US"> cho tiếng Anh Mỹ.

Đây là tiêu chuẩn W3C bắt buộc đối với tài liệu HTML hợp lệ và là một phần thiết yếu của tiếp cận đa ngôn ngữ trên web. Thuộc tính lang không chỉ giúp trình duyệt hiển thị đúng dấu câu, khoảng cách chữ hay cách ngắt dòng — mà còn cung cấp tín hiệu rõ ràng cho công cụ tìm kiếm về ngữ cảnh ngôn ngữ của nội dung.

Tại sao quan trọng trong SEO?

Khai báo ngôn ngữ chính xác ảnh hưởng trực tiếp đến khả năng xếp hạng và phân phối nội dung đúng đối tượng người dùng:

  • Tăng độ tin cậy với công cụ tìm kiếm: Google và Bing dùng lang như một trong những yếu tố xác minh ngôn ngữ nội dung — đặc biệt khi trang không có cấu trúc hreflang rõ ràng hoặc thiếu tín hiệu địa lý khác.
  • Hỗ trợ phân tích ngữ nghĩa: Công cụ tìm kiếm dùng ngôn ngữ khai báo để chọn mô hình xử lý ngôn ngữ phù hợp (ví dụ: từ điển từ đồng nghĩa, thuật toán phân tích cảm xúc), giúp hiểu đúng ý định tìm kiếm.
  • Giảm nhiễu xếp hạng: Nếu trang tiếng Việt lại khai báo lang="en", Google có thể xếp nhầm vào kết quả tìm kiếm tiếng Anh — dẫn đến tỷ lệ thoát cao và giảm thứ hạng.
  • Hỗ trợ người dùng: Trình đọc màn hình, phần mềm hỗ trợ người khuyết tật và các công cụ dịch tự động dựa vào lang để phát âm và dịch chính xác hơn.

Cách hoạt động

Thuộc tính lang hoạt động theo cơ chế kế thừa (inheritance): giá trị được đặt ở thẻ <html> sẽ áp dụng cho toàn bộ tài liệu, trừ khi bị ghi đè bởi khai báo lang cụ thể ở các phần tử con (ví dụ: <p lang="en">English text</p>).

Google không dùng lang làm yếu tố xếp hạng độc lập, nhưng coi đây là tín hiệu bổ trợ mạnh để xác thực ngôn ngữ nội dung — đặc biệt khi nội dung có độ trùng lặp cao hoặc chứa nhiều từ vay mượn.

Hướng dẫn thực hiện

  1. Xác định ngôn ngữ chính: Chọn mã ngôn ngữ chuẩn ISO 639-1 (2 ký tự) hoặc ISO 639-1 + vùng (4 ký tự). Ví dụ:
    • Tiếng Việt: vi (chuẩn chung) hoặc vi-VN (tiếng Việt tại Việt Nam)
    • Tiếng Anh Anh: en-GB, tiếng Anh Mỹ: en-US
  2. Thêm vào thẻ <html>: Đặt thuộc tính lang ngay sau thẻ mở <html>. Không dùng dấu cách trước/sau dấu bằng, không dùng ngoặc kép đơn nếu không cần thiết.
    <html lang="vi">
  3. Kiểm tra tính nhất quán: Đảm bảo toàn bộ nội dung chính (tiêu đề, đoạn văn, mô tả hình ảnh) phù hợp với ngôn ngữ đã khai báo. Tránh pha trộn ngôn ngữ không cần thiết trong khối nội dung lớn.
  4. Với trang đa ngôn ngữ: Mỗi phiên bản ngôn ngữ phải có thẻ <html lang="..."> riêng và đi kèm thẻ hreflang trong <head>.

Lỗi thường gặp

  • Không khai báo lang nào cả: Đây là lỗi phổ biến nhất. Hệ quả: công cụ tìm kiếm phải suy đoán ngôn ngữ qua nội dung — dễ sai, đặc biệt với từ vay mượn (ví dụ: “marketing”, “startup”). Cách khắc phục: Thêm lang="vi" vào thẻ <html> ngay lập tức.
  • Khai báo sai mã ngôn ngữ: Dùng mã không tồn tại (ví dụ: lang="vie") hoặc viết hoa sai (Lang="VI"). Mã chuẩn chỉ viết thường, không dấu gạch ngang thừa. Cách khắc phục: Dùng danh sách mã chuẩn từ IANA Language Subtag Registry.
  • Mâu thuẫn giữa lang và nội dung: Trang khai báo lang="vi" nhưng 70% nội dung là tiếng Anh. Cách khắc phục: Hoặc chỉnh lại nội dung cho thống nhất, hoặc chia thành hai phiên bản riêng biệt với hreflang đầy đủ.
  • Dùng xml:lang thay vì lang trong HTML5: xml:lang chỉ dành cho XHTML. Trong HTML5, chỉ dùng lang. Cách khắc phục: Xóa xml:lang và giữ lại lang.

Ví dụ thực tế

Dưới đây là bảng so sánh cách khai báo đúng – sai cho trang tiếng Việt:

Mục đích Đúng Sai Ghi chú
Trang tiếng Việt chung <html lang="vi"> <html lang="vie"> vie là mã ISO 639-2, không dùng trong HTML
Trang tiếng Việt tại Việt Nam <html lang="vi-VN"> <html lang="vi-vn"> Mã vùng viết hoa chữ cái đầu sau dấu gạch ngang
Trang tiếng Anh Mỹ <html lang="en-US"> <html lang="en"> en được chấp nhận, nhưng en-US rõ ràng hơn về vị trí

Câu hỏi thường gặp

Google có đọc thuộc tính lang không?

Có. Google xác nhận sử dụng lang như một trong những tín hiệu phụ để xác định ngôn ngữ nội dung — đặc biệt khi nội dung không có từ khóa ngôn ngữ rõ ràng hoặc có nhiều ngôn ngữ đan xen. Tuy nhiên, đây không phải yếu tố xếp hạng độc lập.

Nên dùng vi hay vi-VN?

Cả hai đều hợp lệ. vi đủ cho hầu hết trường hợp. vi-VN nên dùng nếu trang hướng riêng đến người Việt tại Việt Nam và có nội dung gắn với đơn vị tiền tệ, ngày tháng, cách phát âm đặc thù. Với trang quốc tế (ví dụ: cộng đồng người Việt ở Mỹ), vi là lựa chọn an toàn hơn.

Có cần khai báo lang cho từng đoạn văn không?

Không bắt buộc — chỉ cần khai báo ở mức <html> là đủ cho nội dung chính. Chỉ thêm lang vào phần tử con khi có đoạn nội dung khác ngôn ngữ (ví dụ: trích dẫn tiếng Anh trong bài tiếng Việt). Việc lạm dụng khai báo con có thể gây rối tín hiệu nếu không nhất quán.