Named Entity – Điểm kết nối thông tin

,
Named Entity điểm kết nối thông tin

Đây là các hiểu biết và nghiên cứu của Forza, nếu có sai sót thì mong sẽ nhận được các đóng góp đa chiều từ mọi người.
Đây là bài quan trọng hỗ trợ cho chủ đề: Bài viết chuẩn SEO giúp bạn SEO chuẩn và nằm trong Seri Semantic Search: Semantic SEO (search) là gì? Những khái niệm cần biết.

ĐỊNH NGHĨA

𝑵𝒂𝒎𝒆𝒅 𝑬𝒏𝒕𝒊𝒕𝒚 (thực thể được đặt tên) đề cập đến một đối tượng hoặc khái niệm cụ thể, có thể liên kết với một biểu đồ tri thức…
Đơn giản hơn, một thực thể liên quan đến bất kỳ chủ đề nào có thể được liên kết với các biểu đồ tri thức của các công cụ tìm kiếm, ví dụ như Biểu đồ Tri thức của Google.
Chúng ta biết rằng Wikipedia đóng vai trò như một nguồn tin cậy ban đầu cho Biểu đồ Tri thức. Như vậy, nhìn chung chúng ta có thể gọi một Thực thể là bất kỳ chủ đề nào có thể được gắn liền với một trang bài trên Wikipedia, trừ các trang giải thích hoặc trang danh mục.
Taylor Swift (Named-Entity) là một entity vì cô ấy là một ca sĩ thực sự, có dữ liệu về cô ấy trên thế giới thực.
Cơ bản có gần 30 dạng thực thể định danh khác nhau.
Unnamed- Entity: Tình bạn, tình yêu, gia đình, thành phố…
Khác với từ khóa, chỉ là một tập hợp các chữ cái đặc trưng cho một ngôn ngữ, một thực thể mang theo ý nghĩa và độc lập với ngôn ngữ và các từ khóa đồng nghĩa.

THUỘC TÍNH CỦA THỰC THỂ

Trong lĩnh vực phân tích ngôn ngữ tự nhiên, “thuộc tính” của Entity (thực thể) là các đặc điểm hoặc thông tin mô tả chi tiết về thực thể đó.
Thuộc tính giúp ta hiểu rõ và chính xác hơn về thực thể đang được đề cập đến. Khi nói về một người, các thuộc tính có thể bao gồm tên, tuổi, giới tính, quốc tịch, địa chỉ, nghề nghiệp, v.v.
Đối với một sản phẩm, các thuộc tính có thể là tên, thương hiệu, mô tả, giá cả, đánh giá của người dùng, v.v.
Tuỳ vào thực thể và thuộc tính được mô tả sẽ giúp Google xác định ngữ cảnh của bài viết hay cả website.
Để hiểu tầm quan trọng của một thuộc tính đối với một thực thể, người phân tích tìm kiếm theo thực thể cần tập trung vào ngữ cảnh, mục đích và các thuộc tính chung của các thực thể cùng loại.
Ví dụ: Nếu trọng tâm chính website/bài viết của bạn liên quan đến đua xe công thức 1, các thuộc tính quan trọng của chiếc xe cần được mô tả sẽ là “tay đua, nhà sản xuất, động cơ, tốc độ tối đa, trọng lượng”.
Còn trọng tâm chính website/ bài viết của bạn liên quan lịch sử xe đua, thuộc tính chính sẽ là “khởi nguồn của ô tô” hoặc “nhà phát minh”.
Để cung cấp thông tin chính xác về các thực thể và làm tăng tính độc đáo của nguồn thông tin, ta nên định nghĩa các thực thể bằng cách xác định các chức năng, ý nghĩa, cách sử dụng, lợi ích và tác động của chúng trong lĩnh vực kiến thức cụ thể. Điều này giúp người đọc có cái nhìn tổng quan và hiểu rõ hơn về các thực thể đó.

3 dạng thuộc tính cơ bản – Thường được sử dụng xây dựng Heading các bài viết H1-H5:

• Attribute Prominence: Thuộc tính cốt lõi giúp nhận diện được Entity, thiếu nó thì Entity sẽ không thể tồn tại được.
◦ Germany League: Thiếu thuộc tính giải bóng đá (League) nước đức vẫn là nước đức.
◦ Germany Population: thiếu thuộc tính dân số sẽ không còn nước Đức.
• Attribute Popularity: Thuộc tính phổ biến thường dựa trên volume search hoặc mức độ quan tâm nhiều ít đối với 1 thuộc tính của thực thể.
◦ Ví dụ: Điện thoại thì thuộc tính giá/camera/màu sắc sẽ được quan tâm nhiều hơn là Chip,độ phân giải màn hình…
• Attribute Relevance: Liên quan với Source Context của website.
◦ Ví dụ: Website về định cư diện doanh nhân thì thuộc tính về kinh tế/ tài chính/pháp luật sẽ quan trọng hơn là thuộc tính dân số hay khí hậu.

SỰ KẾT NỐI GIỮA CÁC THỰC THỂ

Các thực thể luôn có sự liên quan đến 1 thực thể khác bởi 1 thuộc tính của nó.
Ví dụ: Taylor Swift có liên quan với Selena Gomez dựa trên thuộc tính là mối quan hệ bạn bè nhưng với Pennsylvania sẽ là thuộc tính về nơi sinh của cô ấy.
Việc xây dựng mạng lưới liên kết giúp ngữ cảnh website/bài viết chặt chẽ cũng như mở rộng mức độ bao phủ trong lĩnh vực trọng tâm.

TẠI SAO NAMED ENTITY QUAN TRỌNG?

Entity và thuộc tính của nó sẽ là yếu tố cốt lõi để xây dựng bản đồ chủ đề (rộng hơn là mạng lưới ngữ nghĩa) website.
Sau đó sẽ là xây dựng heading, thứ tự heading và cả nội dung trọng tâm của cả bài viết. Giúp nội dung được xây dựng một cách logic, trật tự rõ ràng dựa trên sự hiểu biết của tác giả đối với lĩnh vực mình đang viết.
Nội dung cũng sẽ có chiều sâu và giảm đi các nội dung dạng chung chung, khái quát không nhiều giá trị với người đọc, làm bài viết không thể vượt qua Ngưỡng Chất Lượng để được index (Tham khảo: https://bom.so/19jKWD)
Một lý do nữa rộng hơn là các Named Entity có vai trò rất quan trọng với Google là vì các thực thể này giúp kết nối tất cả thông tin trên thế giới với nhau, bất kể ngôn ngữ là gì.
Bằng cách phát hiện các thực thể có trong các trang web, Google sẽ có thể liên kết hai trang web nói về cùng một nội dung với các ngôn ngữ khác nhau.
Forza mong với bài viết trên sẽ giúp các bạn đọc hiểu hơn về các kiến thức nền tảng cốt lõi của Semantic Search cũng như hỗ trợ cho các bạn xây dựng nội dung bài viết có chiều sâu chuyên môn, tăng sự bao phủ và liên kết về mạng lưới ngữ nghĩa cũng như thông tin trong bài viết.
Vì như ở bài trước Forza có đề cập đến yếu tố về sự liên kết để tăng Topical Coverage cho website.

Chia sẻ bài viết