NewsArticle Schema
Schema chuyên biệt cho bài báo tin tức, thường yêu cầu ngày xuất bản, tác giả và nguồn rõ ràng.
NewsArticle Schema là gì?
NewsArticle Schema là một loại markup cấu trúc (structured data) thuộc chuẩn Schema.org, được thiết kế riêng cho các bài báo tin tức — như bài viết trên báo điện tử, trang tin tổng hợp, hoặc bản tin chính thống. Nó giúp công cụ tìm kiếm hiểu rõ nội dung là bài báo thời sự, không phải bài blog cá nhân, hướng dẫn hay đánh giá sản phẩm.
Schema này yêu cầu ít nhất ba thuộc tính bắt buộc để đạt trạng thái hợp lệ theo tiêu chuẩn Google: datePublished (ngày xuất bản), headline (tiêu đề), và articleBody (nội dung chính). Ngoài ra, các thuộc tính như author, publisher, dateModified, image và description được khuyến nghị mạnh mẽ để tăng độ tin cậy và khả năng hiển thị trong kết quả tìm kiếm.
Tại sao quan trọng trong SEO?
NewsArticle Schema không trực tiếp nâng thứ hạng từ khóa, nhưng nó hỗ trợ SEO gián tiếp và mạnh mẽ qua ba kênh:
- Tăng khả năng xuất hiện trong Rich Results: Bài báo có schema đúng thường được Google ưu tiên hiển thị dưới dạng kết quả mở rộng (rich snippet) — kèm ảnh, ngày đăng, tên tác giả, nguồn — làm tăng tỷ lệ nhấp (CTR) lên 20–35% so với kết quả thông thường (theo dữ liệu kiểm thử của Search Engine Journal, 2023).
- Cải thiện độ tin cậy với công cụ tìm kiếm: Khi Google xác định rõ bài viết là tin tức chính thống (có nguồn, tác giả, thời điểm rõ ràng), hệ thống dễ phân biệt với nội dung tự phát, spam hoặc AI không kiểm soát — điều này hỗ trợ đánh giá chất lượng trang (E-E-A-T).
- Hỗ trợ lập chỉ mục nhanh hơn: Với các trang tin cập nhật liên tục, schema giúp bot Google hiểu ngữ cảnh bài viết ngay từ lần thu thập đầu tiên — đặc biệt hữu ích với tin nóng, giảm thời gian từ đăng đến xuất hiện trên SERP.
Cách hoạt động
NewsArticle Schema hoạt động bằng cách thêm dữ liệu có cấu trúc vào mã HTML hoặc JSON-LD của trang. Công cụ tìm kiếm đọc phần dữ liệu này như một “bản tóm tắt kỹ thuật” về bài viết — thay vì chỉ dựa vào văn bản hiển thị. Ví dụ: khi Google thấy "datePublished": "2024-06-15T08:22:00+07:00", nó biết đây là bài mới, không phải nội dung cũ tái đăng — từ đó điều chỉnh ưu tiên lập chỉ mục phù hợp.
Điều quan trọng: Schema không thay thế nội dung thực tế. Nếu phần articleBody trong schema không khớp với văn bản hiển thị trên trang, Google có thể bỏ qua toàn bộ markup hoặc coi đó là dấu hiệu gian lận.
Hướng dẫn thực hiện
Dưới đây là các bước triển khai NewsArticle Schema an toàn và hiệu quả:
- Xác định định dạng phù hợp: Ưu tiên dùng JSON-LD (đặt trong thẻ
<head>), vì dễ bảo trì, ít xung đột với HTML và được Google hỗ trợ đầy đủ. Không dùng Microdata hoặc RDFa trừ khi hệ thống CMS bắt buộc. - Chuẩn bị dữ liệu bắt buộc: Đảm bảo có sẵn giá trị hợp lệ cho:
–headline(chuỗi ký tự, tối đa 110 ký tự)
–datePublished(định dạng ISO 8601, ví dụ:2024-06-15T08:22:00+07:00)
–articleBody(đoạn văn ngắn mô tả nội dung chính, không quá 500 ký tự) - Thêm thuộc tính khuyến nghị: Bao gồm
author(dạngPersonhoặcOrganization),publisher(phải làOrganizationcólogovànamerõ ràng),image(URL ảnh JPG/PNG, kích thước tối thiểu 696x400 px), vàdescription(mô tả ngắn, khác vớiarticleBody). - Kiểm tra và triển khai: Dùng Google Rich Results Test hoặc Schema Markup Validator để kiểm tra lỗi. Chỉ triển khai khi trạng thái là Valid và không có cảnh báo Missing field với thuộc tính bắt buộc.
Lỗi thường gặp
Dưới đây là 4 lỗi phổ biến và cách khắc phục:
| Lỗi | Dấu hiệu | Cách sửa |
|---|---|---|
Thiếu datePublished |
Google báo “Missing required field” | Thêm trường datePublished với định dạng chuẩn ISO 8601. Không dùng ngày dạng “15/06/2024” hoặc “hôm nay”. |
Giá trị author không đúng kiểu |
Author hiển thị là “null” hoặc “unknown” trong kết quả kiểm tra | Dùng đối tượng Person (với @type, name) hoặc Organization. Tránh ghi tên tác giả dưới dạng chuỗi đơn giản. |
| Ảnh không đáp ứng yêu cầu kích thước | Rich result không hiển thị ảnh dù schema có image |
Đảm bảo ảnh có độ phân giải tối thiểu 696x400 px, định dạng hỗ trợ (JPG, PNG), và URL truy cập công khai (không chặn bởi robots.txt hay .htaccess). |
| Ngày xuất bản và ngày sửa đổi trùng nhau | Google cảnh báo “dateModified should be after datePublished” | Nếu bài chưa chỉnh sửa, bỏ trường dateModified. Nếu có chỉnh sửa, đảm bảo giá trị sau datePublished ít nhất 1 phút. |
Ví dụ thực tế
Dưới đây là đoạn JSON-LD mẫu cho bài báo trên báo điện tử, đã kiểm tra hợp lệ:
{ "@context": "https://schema.org", "@type": "NewsArticle", "headline": "Hà Nội ghi nhận ca bệnh đậu mùa khỉ đầu tiên trong năm 2024", "datePublished": "2024-06-15T08:22:00+07:00", "dateModified": "2024-06-15T10:15:33+07:00", "articleBody": "Bệnh nhân nam, 32 tuổi, trở về từ Tây Ban Nha, có biểu hiện sốt, mệt mỏi và phát ban sau 3 ngày nhập cảnh...", "description": "Ca bệnh đậu mùa khỉ đầu tiên tại Hà Nội trong năm nay được ghi nhận tại Bệnh viện Bệnh Nhiệt đới Trung ương.", "author": { "@type": "Person", "name": "Lê Minh Anh" }, "publisher": { "@type": "Organization", "name": "Báo Sức Khỏe Việt Nam", "logo": { "@type": "ImageObject", "url": "https://baosuckhoe.vn/logo.png" } }, "image": [ "https://baosuckhoe.vn/images/benh-dau-mua-khi-ha-noi.jpg" ] }
Câu hỏi thường gặp
NewsArticle Schema có bắt buộc phải dùng JSON-LD?
Không bắt buộc, nhưng JSON-LD là định dạng được Google khuyến nghị mạnh mẽ nhất. Microdata và RDFa vẫn hoạt động nếu triển khai đúng, nhưng dễ gây xung đột với theme hoặc plugin, và khó kiểm tra hơn.
Có thể dùng NewsArticle Schema cho bài viết blog không?
Chỉ khi bài viết mang tính tin tức thời sự — có yếu tố thời gian, sự kiện cụ thể, nguồn tin rõ ràng. Blog chia sẻ kinh nghiệm, cảm nhận cá nhân hoặc hướng dẫn nên dùng BlogPosting. Dùng sai loại schema có thể khiến Google bỏ qua markup hoặc giảm độ tin cậy.
Google có phạt nếu schema sai?
Google không phạt trực tiếp, nhưng sẽ không sử dụng markup nếu phát hiện sai sót nghiêm trọng (ví dụ: ngày xuất bản giả, tác giả không tồn tại, nội dung schema không khớp trang). Trong trường hợp lặp lại nhiều lần, hệ thống có thể coi trang là thiếu minh bạch — ảnh hưởng gián tiếp đến E-E-A-T.