Trong số hàng loạt thay đổi đối với tìm kiếm mà Google công bố trong tháng này, chúng tôi muốn nghiên cứu sâu hơn về thông báo lập chỉ mục dựa trên đoạn văn.
Cập nhật lập chỉ mục dựa trên đoạn. Google cho biết: “Các tìm kiếm rất cụ thể có thể khó đi đúng hướng nhất, vì đôi khi câu trả lời cho câu hỏi của bạn có thể bị chôn sâu trong một trang web. Gần đây, chúng tôi đã tạo ra một bước đột phá trong xếp hạng và hiện có thể không chỉ lập chỉ mục các trang web mà còn có thể lập chỉ mục các đoạn riêng lẻ từ các trang. Bằng cách hiểu rõ hơn về mức độ liên quan của các đoạn văn cụ thể, không chỉ trang tổng thể, chúng tôi có thể tìm thấy thông tin sâu sắc mà bạn đang tìm kiếm. ”
Google cho biết lập chỉ mục dựa trên đoạn văn sẽ ảnh hưởng đến 7% các truy vấn tìm kiếm trên tất cả các ngôn ngữ khi được triển khai toàn cầu
Nó trông như thế nào khi tìm kiếm. Google đã cung cấp những hình ảnh này để chứng minh sự thay đổi:
Với khả năng hiểu đoạn văn mới, Google có thể hiểu rằng đoạn văn cụ thể (R) có liên quan nhiều hơn đến một truy vấn cụ thể hơn là một trang rộng hơn về chủ đề đó (L).
Trong một công bố của Google: “Gần đây chúng tôi đã thực hiện một bước đột phá khác và hiện có thể không chỉ lập chỉ mục các trang web mà còn có thể lập chỉ mục các đoạn riêng lẻ từ các trang đó. Điều này giúp chúng ta tìm được cái kim trong bọc bởi vì bây giờ toàn bộ đoạn văn đó đều có liên quan. Vì vậy, ví dụ, giả sử bạn tìm kiếm một thứ gì đó khá thích hợp như ‘làm cách nào để xác định xem cửa sổ nhà tôi có phải là kính UV hay không.’ Đây là một truy vấn khá phức tạp và chúng tôi nhận được rất nhiều trang web nói về kính UV và cách bạn cần một loại phim đặc biệt, nhưng không ai trong số này thực sự giúp người dân hành động. Thuật toán mới của chúng tôi có thể phóng to ngay một đoạn văn này trên một diễn đàn DIY trả lời câu hỏi. Rõ ràng, bạn có thể sử dụng hình ảnh phản chiếu của ngọn lửa để nói và bỏ qua phần còn lại của các bài đăng không hoàn toàn hữu ích trên trang. Bây giờ, bạn sẽ không nhất thiết phải thực hiện truy vấn này, nhưng tất cả chúng ta đôi khi tìm kiếm những thứ rất cụ thể. Và bắt đầu từ tháng tới, công nghệ này sẽ cải thiện 7% các truy vấn tìm kiếm trên tất cả các ngôn ngữ và đó mới chỉ là bước khởi đầu. ”
Một kết quả tìm kiếm lập chỉ mục tại Google Việt Nam
Google đang lập chỉ mục các phần hay các phần của trang?
Chúng tôi đã hỏi Google nếu Google hiện đang lập chỉ mục đoạn văn hoặc các phần của trang. Google không. Google vẫn đang lập chỉ mục các trang đầy đủ nhưng hệ thống của Google sẽ xem xét nội dung và ý nghĩa của các đoạn văn khi xác định nội dung nào phù hợp nhất so với trước đây chúng tôi chủ yếu xem xét trang tổng thể, một phát ngôn viên của Google cho chúng tôi biết.
Đó là thay đổi xếp hạng nhiều hơn là thay đổi lập chỉ mục
Lập chỉ mục thực sự không thay đổi ở đây. Đó là sự thay đổi xếp hạng, cách Google xếp hạng nội dung, dựa trên những gì nó tìm thấy trên trang web của bạn. Tôi xin nhắc lại, Google không lập chỉ mục các đoạn riêng lẻ trên trang. Tuy nhiên, việc khoanh vùng những gì trên trang sẽ tốt hơn và hiển thị những đoạn văn đó tốt hơn cho mục đích xếp hạng.
Google xem xét những tín hiệu nào ở đây?
Trước đây, các hệ thống của Google sẽ xem xét một số “tín hiệu mạnh hơn về một trang — ví dụ: tiêu đề hoặc tiêu đề trang — để hiểu kết quả nào phù hợp nhất với truy vấn. Mặc dù đó vẫn là những yếu tố quan trọng, nhưng hệ thống mới này rất hữu ích để xác định các trang có một phần riêng lẻ phù hợp đặc biệt tốt với truy vấn của bạn, ngay cả khi phần còn lại của trang nói về một chủ đề hơi khác hoặc tổng thể ít liên quan hơn “, Google nói với chúng tôi .
Thẻ tiêu đề sẽ quan trọng hơn?
Điều này có nghĩa là bây giờ các thẻ tiêu đề hoặc các thẻ tương đương quan trọng hơn? Google không có câu trả lời cho tôi về điều này. Nhưng tôi nghi ngờ rằng mặc dù thẻ tiêu đề là tín hiệu khá quan trọng, nhưng tiêu đề trong trường hợp này có thể quan trọng hơn khi nó ra mắt. Một lần nữa, Google thường không nói về các tín hiệu xếp hạng cụ thể và Google cũng không nhận xét về các tiêu đề như một tín hiệu xếp hạng.
Google nói với chúng tôi rằng họ “luôn hiểu rõ các từ khóa và cụm từ trong tài liệu, nhưng thường những thứ như tiêu đề trang là tín hiệu rất mạnh giúp chúng tôi cung cấp các trang tổng thể tốt nhất”. Giờ đây, Google có thể tìm ra “mò kim đáy bể” và đưa ra kết quả phù hợp nhất dựa trên thông tin trong các đoạn văn. Một lần nữa, rất khó để nói những tín hiệu cụ thể nào là quan trọng ở đây.
Đây không phải là đoạn trích nổi bật?
Điều này khác với đoạn trích tính năng như thế nào, trong đó Google hiển thị một đoạn nội dung của bạn dưới dạng câu trả lời ở đầu Kết quả tìm kiếm của Google. Google cho biết “hệ thống của họ xác định mức độ liên quan của bất kỳ tài liệu web nào thông qua sự hiểu biết về các đoạn văn. Mặt khác, các đoạn trích nổi bật xác định đoạn văn có liên quan nhất trong một tài liệu mà chúng tôi đã xác định chung là có liên quan đến truy vấn. ”
Thuật toán đoạn văn này hữu ích nhất ở đâu?
Google cho biết “điều này rất hữu ích cho các truy vấn trong đó bit thông tin cụ thể mà người đó đang tìm kiếm bị ẩn trong một đoạn văn trên một trang không nhất thiết phải là chủ đề chính của trang đó”.
Giả sử ai đó tìm kiếm [BERT hoạt động như thế nào trong tìm kiếm của Google], trước đây Google có thể đã trả về một loạt kết quả có vẻ có liên quan về tổng thể. Có lẽ Google sẽ trả lại một câu chuyện tin tức xung quanh việc BERT đến với Google Tìm kiếm. Câu chuyện tin tức này có thể không thực sự trả lời trực tiếp câu hỏi.
Bây giờ nếu bạn có một trang thực sự rộng, hãy nói cách Google Tìm kiếm hoạt động và trong trang rộng đó, có một đoạn BERT thực sự giải thích cách BERT hoạt động. Mặc dù phần còn lại của trang không quá liên quan và các trang BERT và Google Tìm kiếm khác có vẻ phù hợp hơn, nhưng hệ thống mới của Google có thể phóng to phần đó một chút và xếp hạng trang đó cao hơn.
Google cho biết tính năng này sẽ bắt đầu được triển khai vào cuối năm nay và sẽ bắt đầu bằng tiếng Anh ở Mỹ với nhiều ngôn ngữ / địa điểm hơn để theo dõi. Sau khi triển khai trên toàn cầu, điều này sẽ ảnh hưởng đến khoảng 7% các truy vấn trên Google Tìm kiếm.
Theo search engine land