Reasonable Surfer Model của Google: Giá trị của Link phụ thuộc vào yếu tố nào?

Lâm Vĩ 10/12/2020

Như bạn có thể đã biết, Google Patent là một nguồn tài nguyên giá trị để chúng ta có thể hiểu hơn về công cụ tìm kiếm lớn nhất hành tinh hiện nay. Trong bài viết này, hãy cùng Đào tạo SEO Á Âu tìm hiểu qua bằng sáng chế về mô hình người lướt web thực tế của Google để khám phá xem giá trị của một liên kết có thể khác nhau ra sao dựa trên các đặc tính của liên kết và tài liệu (link & document features) và dữ liệu người dùng (user data).

Tóm lược bằng sáng chế về người lướt mạng thực tế

Trong một hệ thống xếp hạng dựa trên các liên kết (link-based ranking system), thì không phải mọi đường link từ một page đều có giá trị như nhau, và máy tìm kiếm có thể nhìn vào nhiều yếu tố khác nhau để xác định xem mỗi đường link sẽ truyền đi được bao nhiêu sức mạnh, hay giá trị trọng số của đường link đó.

(Nguồn: Google)

Một trong những tín hiệu được Google sử dụng để xếp hạng các web pages sẽ dựa vào các đường links trỏ vào và trỏ ra từ các pages này, để xem các pages nào được trỏ đến từ các pages khác. Các đường link trỏ ra từ những pages “quan trọng” sẽ nắm giữ trọng số lớn hơn những đường links từ các pages ít quan trọng hơn. Theo hệ thống này, thì một page được xem là quan trọng là page được trỏ đến bởi những pages quan trọng khác, hoặc bởi một số lượng lớn các pages ít quan trọng hơn, hoặc kết hợp cả hai. Tín hiệu này được biết đến với tên gọi PageRank, và nó là một trong số những tín hiệu Google dùng để xếp hạng các web pages và xác định vị trí xuất hiện của những trang này trong các kết quả tìm kiếm phản hồi lại truy vấn của người dùng.

Vào thời gian ban đầu, có một bài nghiên cứu từ các nhà sáng lập của Google trình bày rằng:

“PageRank có thể được hiểu như là một mô hình về hành vi người dùng. Chúng tôi giả định rằng có một “người lướt mạng ngẫu nhiên” (random surfer) truy cập vào một trang web ngẫu nhiên và liên tục nhấp vào các đường links trong đó, người này không bao giờ nhấn nút “trở lại” nhưng dần cảm thấy nhàm chán và bắt đầu truy cập một trang ngẫu nhiên khác. Khả năng mà người lướt mạng ngẫu nhiên đó ghé thăm một trang chính là PageRank của nó.”

(Nguồn: David Gleich)

Với cách tiếp cận này, thì bất kỳ đường link nào trong cùng một page đều có thể mang cùng một giá trị trọng số, hay độ quan trọng khi trỏ đến một page khác.

Có một bằng sáng chế của Google được nộp vào năm 2004 và vẫn còn được công nhận cho đến ngày hôm nay lại có cách tiếp cận khác về giá trị mà các đường links có thể truyền đi khi chúng ở trên cùng một page:

“Các hệ thống và phương pháp tuân thủ các nguyên tắc của phát minh này mang đến một mô hình về người lướt mạng thực tế [1] khi một người lướt mạng truy cập vào một tài liệu có chứa những đường links, thì một số đường links sẽ có khả năng được người đó lần theo (nhấp vào) cao hơn so với những links còn lại.

Mô hình này phản ánh thực tế rằng không phải tất cả các links chứa trong một tài liệu đều có khả năng được lần theo như nhau. Các ví dụ về những đường links có khả năng không được nhấp vào bao gồm các links “Điều khoản Dịch vụ”, các banner quảng cáo, và các links không liên quan đến tài liệu đó.

Phần mô tả chung của bằng sáng chế trình bày rằng:

Một hệ thống tạo ra một mô hình dựa trên các dữ liệu về đặc tính (feature data) liên quan đến các đặc tính khác nhau của một đường link từ tài liệu liên kết (linking document) đến tài liệu được liên kết (linked document), và dữ liệu về hành vi người dùng liên quan đến các hành động điều hướng (navigational actions) gắn liền với liên kết đó. Hệ thống cũng phân bổ một thứ hạng cho một tài liệu dựa trên mô hình này.

Trong mô hình về “người lướt mạng thực tế” này, không phải tất cả đường link trên một page đều có cùng giá trị. Các đặc tính khác nhau gắn liền với các đường link, các pages mà chúng xuất hiện trên đó và trỏ về, có thể quyết định lượng giá trị mà những đường links này có thể truyền cho các pages mà chúng liên kết đến.

Các đặc tính (features) của các liên kết và tài liệu (links & documents)

Khi một máy tìm kiếm quét qua và lập chỉ mục các trang có trên Internet, nó có thể tạo nên một mô hình được sử dụng để giúp xếp hạng những trang này bằng cách nhìn vào các đặc tính gắn liền với các trang nguồn (source pages) mà các đường links xuất hiện trên đó, các trang mục tiêu mà các đường links trỏ đến, và bản thân các đường links. Máy tìm kiếm cũng có thể thu thập các dữ liệu về cách thức mà các khách truy cập vào các pages tương tác với các pages này, chẳng hạn như họ nhấp vào những đường links nào, họ dùng các cụm từ truy vấn gì để tìm các pages và các thông tin khác có thể được thu thập từ một trình duyệt web hoặc từ một tiện ích bổ sung trong trình duyệt, chẳng hạn như một thanh công cụ toolbar.

(Nguồn: Absolute Digital Media)

Danh sách dưới đây liệt kê các ví dụ về các đặc tính, và có thể không phải tất cả các đặc tính được nêu ra đều được áp dụng. Các ví dụ về các đặc tính gắn liền với một đường link theo như mô hình về người lướt mạng thực tế có thể bao gồm:

  1. Kích thước phông chữ của anchor text được gắn liên kết;
  2. Vị trí của đường link (đo lường được, ví dụ như, trong các phần tử danh sách HTML, trong nội dung văn bản đang được trình bày, ở phía trên hay phía dưới diện tích “first screenful” (phần khu vực 350 pixel đầu tiên, ở trên cùng của một trang) trong vùng hiển thị 800×600 của trình duyệt [2], vị trí trong khu vực lề của tài liệu (trên, dưới, trái, phải), trong phần chân trang (footer), trong thanh bên (sidebar)…);
  3. Nếu đường link nằm trong một danh sách, thì vị trí của đường link trong danh sách đó;
  4. Màu sắc phông chữ và/hoặc các đặc tính khác của đường link (chẳng hạn như in nghiêng, in đậm, tô xám, màu sắc trùng với màu nền…);
  5. Số lượng từ trong anchor text của một đường link;
  6. Các từ ngữ thực (actual words) sử dụng trong anchor text của một đường link;
  7. Tính “thương mại” [3] trong anchor text của một đường link;
  8. Loại link (chẳng hạn như link văn bản, link hình ảnh…);
  9. Nếu đường link là một link hình ảnh, thì tỉ lệ khung hình (aspect ratio) của hình ảnh có thể là bao nhiêu;
  10. Ngữ cảnh của một vài từ đặc trước và/hoặc sau đường link;
  11. Cụm chủ đề (topical cluster) liên quan đến anchor text của đường link;
  12. Đường link đó có dẫn đến một nơi khác trên cùng một host hoặc domain hay không;
  13. Nếu đường link dẫn đến một nơi trên cùng một domain thì:
    • Địa chỉ URL của đường link có ngắn hơn địa chỉ URL được trỏ tới hay không; và/hoặc
    • Địa chỉ URL của đường link có “nhúng” một địa chỉ URL khác (với mục đích để chuyển hướng phía máy chủ [4] chẳng hạn) hay không

Các ví dụ về các đặc tính gắn liền với một tài liệu nguồn (source document, là tài liệu có chứa đường link trỏ đến một tài liệu khác) theo như mô hình về người lướt mạng thực tế có thể bao gồm:

  1. Địa chỉ URL của tài liệu nguồn (hoặc một phần địa chỉ URL của tài liệu nguồn);
  2. Một website chứa tài liệu nguồn;
  3. Số lượng các đường links trong tài liệu nguồn;
  4. Sự có mặt của những từ ngữ khác (other words) trong tài liệu nguồn;
  5. Sự có mặt của những từ ngữ khác trong một tiêu đề heading của tài liệu nguồn;
  6. Một cụm chủ đề mà tài liệu nguồn có liên quan; và/hoặc
  7. Mức độ mà một cụm chủ đề của tài liệu nguồn trùng khớp với cụm chủ đề mà anchor text của một đường link thể hiện.

Các ví dụ về các đặc tính gắn liền với một tài liệu mục tiêu (target document, là tài liệu được đường link chứa trong source document trỏ đến) theo như mô hình về người lướt mạng thực tế có thể bao gồm:

  1. Địa chỉ URL của tài liệu mục tiêu (hoặc một phần địa chỉ URL của tài liệu mục tiêu);
  2. Một website chứa tài liệu mục tiêu;
  3. Địa chỉ URL của tài liệu mục tiêu có nằm trên cùng một host với địa chỉ URL của tài liệu nguồn hay không;
  4. Địa chỉ URL của tài liệu mục tiêu có “gắn liền” với cùng một tên miền như địa chỉ URL của tài liệu nguồn hay không;
  5. Các từ (words) trong địa chỉ URL của tài liệu mục tiêu; và/hoặc
  6. Độ dài địa chỉ URL của tài liệu mục tiêu.

Các dữ liệu về hành vi người dùng liên quan đến các tài liệu và các đường links theo như mô hình về người lướt mạng thực tế cũng có thể được cân nhắc đến, chẳng hạn như:

  1. Các thông tin về cách mà người dùng truy cập và tương tác với các tài liệu, chẳng hạn như các hành động điều hướng (ví dụ, các đường links được lựa chọn, các địa chỉ web được nhập vào, các biểu mẫu (forms) được hoàn thành…)
  2. Ngôn ngữ mà những người dùng sử dụng,
  3. Các mối quan tâm/sở thích của người dùng,
  4. Các cụm từ truy vấn được nhập vào,
  5. Số lần một đường link được lựa chọn,
  6. Số lần các đường links không được lựa chọn khi một đường link được lựa chọn,
  7. Số lần không có đường links nào được lựa chọn trên một page…

Các dữ liệu về hành vi người dùng này có thể thu được từ một trình duyệt web hoặc từ một chương trình hỗ trợ trình duyệt như Google’s Toolbar.

Các đặc tính có thể ảnh hưởng đến trọng số của một liên kết ra sao?

Mô hình về người lướt mạng thực tế dựa trên các đặc tính được trình bày ở trên đây được dùng để xác định khả năng mà một đường link trên một trang có thể được lựa chọn dựa trên những khía cạnh tích cực và tiêu cực của những đặc tính này.

(Nguồn: Internet)

Ví dụ, một đường link có anchor text to hơn một kích cỡ nhất định nào đó có thể sẽ có khả năng được nhấp vào cao hơn các đường links sử dụng anchor text với kích thước phông chữ nhỏ. Các đường links được đặt ở vị trí gần với phần trên cùng của một page (top of a page) cũng có thể được nhấp vào nhiều hơn. Nếu chủ đề của tài liệu được trỏ đến liên quan đến chủ đề của page mà đường link đó xuất hiện, thì khả năng mà nó được người truy cập vào page đó lựa chọn cũng sẽ cao hơn. Như vậy, một đường link có phông chữ lớn, ở gần phần trên cùng của trang, dẫn tới một page trình bày về một chủ đề tương tự như page chứa đường link đó sẽ có khả năng được người dùng lựa chọn cao hơn là đường link sử dụng anchor text nhỏ, đặt ở cuối một page, trỏ về một page có chủ đề không liên quan.

Bằng sáng chế cũng đưa ra những ví dụ khác minh họa về các quy tắc có thể được áp dụng cho nhiều đặc tính khác nhau để xác định khả năng các đường links khác nhau trên một page có thể được người truy cập lựa chọn nhấp vào. Các khả năng này được sử dụng để xác định một giá trị trọng số động (dynamic weight) cho mỗi đường link, giá trị này có thể ảnh hưởng đến việc các pages được những đường links đó trỏ đến sẽ được Google xếp hạng ra sao. Các trọng số khác nhau của các đường links cũng giúp xác định xem “lượng” PageRank mà mỗi đường link có thể truyền đi sang những pages khác là bao nhiêu.

Ngoài ra, thì:

“Thứ hạng của một tài liệu có thể được hiểu như là khả năng mà một người dùng thực tế sẽ truy cập vào tài liệu đó sau khi lần theo một số lượng các đường links trước đó.”

Kết luận

Giá trị mà một đường link trên một page có thể truyền đi trong một hệ thống xếp hạng dựa trên liên kết giống như PageRank là bao nhiêu?

Theo như những nội dung được công bố trong bằng sàng chế cho đến hôm nay, thì giá trị có một đường link có thể khác nhau tùy thuộc vào một số lượng lớn các yếu tố, chẳng hạn như vị trí đặt dường link trên một page, đường link đó có màu sắc hoặc kiểu chữ (font style) khác biệt so với các đường links khác hay không, số lượng từ dùng trong anchor text của đường link, các từ ngữ sử dụng trong đường link có tính thương mại hay không, chủ đề của page trỏ link và chủ đề của page được trỏ link đến là gì, cùng nhiều yếu tố khác.

Bằng sáng chế này cũng đã cung cấp nhiều thông tin và tín hiệu có thể trở nên hữu ích cho người làm SEO. Các đường links nào có khả năng được một người lướt mạng thực tế nhấp vào nhiều nhất trên một trang – thì các đường links đó có thể nắm giữ nhiều trọng số nhất.

__________________________

Chú giải:

[1] Reasonable surfer model (thuật ngữ gốc), chỉ một mô hình mà trong đó, người dùng lướt qua các trang một cách thực tế và chỉ nhấp vào những đường links mà họ thấy hợp lý và hữu ích đối với họ, không phải nhấp vào tất cả các đường links có trong một tài liệu hoặc một trang.

[2] Kích thước trang tiêu chuẩn thường được áp dụng là 800 x 600 pixels. Nếu một phần trên trang rơi ra khỏi vùng hiển thị mà người dùng có thể nhìn thấy trên web (viewable browsing area), thì một thanh cuộn chuột (scroll bar) sẽ xuất hiện. Ngoài ra, nếu một trang được xem trên một màn hình có độ phân giải nhỏ hơn kích thước này thì trải nghiệm người dùng sẽ không được tối ưu. Lí do cho việc lựa chọn độ phân giải 800 x 600 làm tiêu chuẩn là vì nó có thể đáp ứng được độ phân giải trung bình của các màn hình mà người dùng sử dụng để lướt web.

[3] Có hai khái niệm cần phân biệt ở đây: Anchor text thương hiệu (Brand anchor text) là một trong số các tín hiệu Google cân nhắc khi quyết định xem một website có được tin tưởng hay không; trong khi anchor text thương mại (Commercial anchor text) cho Google biết rằng một website có thể đang quan tâm đến việc xếp hạng những từ khóa nào. Anchor text thương mại còn được biết đến với tên gọi Money anchor text hoặc SEO anchor text, là những anchor text có chứa từ khóa mà người làm SEO muốn xếp hạng. Việc lạm dụng các từ khóa thương mại trong anchor text rất dễ bị Google phạt vì một người bình thường sẽ hiếm khi trỏ link bằng các anchor text này, vì sẽ không tự nhiên khi liên kết một sản phẩm hoặc một website bằng một anchor text có chứa từ khóa muốn SEO (trừ khi website đó có tên miền trùng khớp chính xác (EMD hay exact match domain) hoặc trùng khớp một phần với một từ khóa thương mại, mà từ khóa đó cũng giải thích cho ý nghĩa của EMD ở một mức độ nhất định).

[4] Chuyển hướng phía máy chủ, hay server-side redirection (thuật ngữ gốc): thường thì các chuyển hướng sẽ được xếp vào loại 301 (chuyển hướng vĩnh viễn) hoặc 302 (chuyển hướng tạm thời), và cả hai loại này đều là chuyển hướng phía máy chủ. Hệ thống sẽ sử dụng giao thức HTTP để giải trình rằng một nguồn hoặc một trang nào đó đã được chuyển sang một địa chỉ khác. Ưu điểm của hình thức này chính là tốc độ xử lý của các trình duyệt web nhanh (so với chuyển hướng phía máy khách) và có thể lưu địa chỉ chính xác của file vào trong bộ nhớ cache.

Điểm: 4.7 (15 bình chọn)

Chủ đề: Google Patent, Link, PageRank, Reasonable Surfer Model

Đăng Ký Để Được Tư Vấn Miễn Phí

Tác giả: Lâm Vĩ

Tôi là một Marketer, hiện đang công tác tại Hướng Nghiệp Á Âu với vai trò nghiên cứu, sáng tạo và phát triển các giải pháp tiếp thị hiệu quả trong thế giới Digital Marketing.

Ý kiến của bạn