Google thảo luận về các hệ thống chủ đề cốt lõi.

Google thảo luận về các hệ thống chủ đề cốt lõi.

0 196
cach seo tu khoa len top google 2019

Elizabeth Tucker của Google đã thảo luận về sự thiên vị, sự đa dạng của các hệ thống trong tìm kiếm và các hệ thống chủ đề cốt lõi.
Google’s Search Off the Record mới nhất đã chia sẻ rất nhiều thông tin chi tiết về cách Google Search thực sự hoạt động. John Mueller và Lizzi Sassman của Google đã trò chuyện với Elizabeth Tucker, Giám đốc Quản lý sản phẩm tại Google, người đã chia sẻ thông tin chi tiết về nhiều hệ thống hoạt động cùng nhau để xếp hạng các trang web, bao gồm cả việc đề cập đến hệ thống chủ đề.

Google và tính thời sự

Từ “topicality” có nghĩa là một cái gì đó có liên quan như thế nào trong thời điểm hiện tại. Nhưng khi được sử dụng trong tìm kiếm, từ “topicality” có nghĩa là khớp chủ đề của truy vấn tìm kiếm với nội dung trên trang web. Các mô hình học máy đóng vai trò quan trọng trong việc giúp Google hiểu ý của người dùng.
Một ví dụ mà Elizabeth Tucker đề cập đến là BERT (Bidirectional Encoder Representations from Transformers), một mô hình ngôn ngữ giúp Google hiểu một từ trong ngữ cảnh của các từ đứng trước và sau nó (nói rõ hơn, đó là lời giải thích thu nhỏ).

Elizabeth giải thích tầm quan trọng của việc kết hợp nội dung có liên quan theo chủ đề với truy vấn tìm kiếm trong bối cảnh làm hài lòng người dùng.

Chuyên gia Google Lizzi Sassman đã hỏi về mức độ hài lòng của người dùng và Tucker đề cập rằng có nhiều khía cạnh để tìm kiếm, với nhiều hệ thống, lấy ví dụ về tầm quan trọng của khái niệm liên quan đến chủ đề.
“Về khía cạnh sự hài lòng mà bạn đã đề cập, chúng ta có đang xem xét những cách chi tiết hơn không? Sự hài lòng khi bạn rời khỏi một cuộc tìm kiếm có nghĩa là gì?”
Elizabeth trả lời:

“Hoàn toàn đúng, Lizzi. Trong Search Quality, chúng tôi nghĩ về rất nhiều khía cạnh quan trọng của tìm kiếm. Chúng tôi có rất nhiều hệ thống. Rõ ràng là chúng tôi muốn hiển thị nội dung có liên quan đến chủ đề tìm kiếm của bạn. Vào những ngày đầu của Google Tìm kiếm, điều đó đôi khi là một thách thức.

Hệ thống của chúng tôi đã trở nên tốt hơn nhiều, nhưng đôi khi, đối với những tìm kiếm đặc biệt thực sự khó, chúng tôi vẫn gặp khó khăn. Mọi người tìm kiếm theo rất nhiều cách: Tất nhiên là mọi thứ, từ việc nhập từ khóa, đến việc nói chuyện với Google và sử dụng ngôn ngữ hàng ngày thông thường. Tôi đã thấy những tìm kiếm tuyệt vời. “Này Google, người đó là ai, nhiều năm trước, đã làm điều này, và tôi không nhớ nó được gọi là gì.” Bạn biết đấy, những truy vấn dài dòng rất mơ hồ. Và thật tuyệt vời khi bây giờ chúng ta có những hệ thống thậm chí có thể trả lời một số trong số đó.”

Một điều quan trọng rút ra từ cuộc trao đổi đó là có nhiều hệ thống hoạt động cùng nhau, trong đó chủ đề chỉ là một trong số đó. Nhiều người trong cộng đồng tiếp thị tìm kiếm có xu hướng tập trung vào tầm quan trọng của một thứ như Quyền hạn hoặc Sự hữu ích nhưng trên thực tế có nhiều “chiều” để tìm kiếm và việc giảm các yếu tố đi vào tìm kiếm xuống còn một, hai hoặc ba khái niệm là phản tác dụng.

Sự thiên vị trong tìm kiếm

John Mueller của Google đã hỏi Elizabeth về sự thiên vị trong tìm kiếm và liệu đó có phải là điều mà Google nghĩ đến không và cô ấy trả lời rằng có nhiều loại thiên vị mà Google chú ý và cố gắng nắm bắt. Tucker giải thích các loại kết quả tìm kiếm khác nhau có thể có liên quan đến chủ đề (chẳng hạn như thường xanh và mới) và sau đó giải thích cách Google tập trung vào việc cân bằng để đạt được sự chính xác.
John hỏi :

“Khi bạn xem xét dữ liệu, tôi cho rằng sự thiên vị sẽ xuất hiện. Đó có phải là chủ đề mà chúng ta cũng nghĩ đến không?”

Elizabeth trả lời:

“Hoàn toàn đúng. Có đủ loại thành kiến ​​mà chúng ta lo lắng khi bạn tìm kiếm thông tin. Chúng ta có đang hiển thị không cân xứng một số loại trang web nhất định không, chúng ta có đang hiển thị nhiều hơn, tôi không biết, bách khoa toàn thư và kết quả thường xanh hay chúng ta đang hiển thị nhiều kết quả mới hơn với thông tin cập nhật không, chúng ta có đang hiển thị kết quả từ các trang web của tổ chức lớn không, chúng ta có đang hiển thị kết quả từ các blog nhỏ không, chúng ta có đang hiển thị kết quả từ các nền tảng truyền thông xã hội nơi chúng ta có tiếng nói hàng ngày không?

Chúng tôi muốn đảm bảo rằng chúng tôi có sự kết hợp phù hợp để có thể đưa những nội dung tốt nhất lên web ở mọi hình dạng hoặc quy mô, với mục tiêu khiêm tốn.”

Hệ thống chủ đề cốt lõi (và nhiều hệ thống khác)

Elizabeth tiếp tục nhắc lại rằng cô ấy làm việc với nhiều loại hệ thống trong tìm kiếm. Đây là điều cần lưu ý vì cộng đồng tìm kiếm chỉ biết về một vài hệ thống trong khi thực tế còn rất nhiều hệ thống khác nữa.

Điều đó có nghĩa là điều quan trọng là không chỉ tập trung vào một, hai hoặc ba hệ thống khi cố gắng gỡ lỗi vấn đề xếp hạng mà thay vào đó phải luôn nghĩ rằng vấn đề có thể hoàn toàn khác, không chỉ là sự hữu ích hay EEAT hoặc một số lý do khác.

John Mueller đã hỏi liệu Google Search có phản hồi bằng cách hạ cấp một trang web khi người dùng phàn nàn về một số kết quả tìm kiếm nhất định hay không.

Cô ấy nói về nhiều thứ, bao gồm cả việc hầu hết các hệ thống cô ấy làm việc không liên quan gì đến việc hạ cấp các trang web. Tôi muốn nhấn mạnh cách cô ấy đề cập rằng cô ấy làm việc với nhiều hệ thống và nhiều tín hiệu (không chỉ một số ít tín hiệu mà cộng đồng tiếp thị tìm kiếm có xu hướng tập trung vào).
Một trong những hệ thống mà cô ấy đề cập đến là hệ thống chủ đề cốt lõi. Điều đó có nghĩa là gì? Cô ấy giải thích rằng đó là về việc khớp chủ đề của truy vấn tìm kiếm. Cô ấy nói “hệ thống chủ đề cốt lõi” vì vậy tôi có thể có nghĩa là nhiều hệ thống và thuật toán .

John hỏi

“Khi mọi người lên tiếng lớn tiếng, bước đầu tiên là thực hiện một số loại hạ cấp, trong đó bạn nói rằng “Ồ, đây rõ ràng là một trang web tệ mà chúng ta đã hiển thị, do đó chúng ta nên hiển thị ít hơn”? Hay làm thế nào để bạn cân bằng mặt tích cực của những thứ mà có lẽ chúng ta nên hiển thị nhiều hơn so với nội dung mà chúng ta nên hiển thị ít hơn?”

Elizabeth trả lời:

“Vâng, đó là một câu hỏi hay. Vì vậy, tôi làm việc trên nhiều hệ thống khác nhau. Đó là một phần thú vị trong công việc của tôi tại Search Quality. Chúng tôi có nhiều tín hiệu, nhiều hệ thống, tất cả đều cần phải làm việc cùng nhau để tạo ra một trang kết quả tìm kiếm tuyệt vời.

Một số hệ thống có bản chất là gây mất phương hướng, và webspam là một ví dụ tuyệt vời về điều này. Nếu chúng ta gặp vấn đề với, chẳng hạn, các trang web tải xuống độc hại, thì đó là điều chúng ta có thể muốn khắc phục bằng cách cố gắng tìm ra những trang web nào đang hoạt động không tốt và cố gắng đảm bảo người dùng không gặp phải những trang web đó.

Tuy nhiên, hầu hết các hệ thống tôi làm việc cùng thực sự đang cố gắng tìm ra điều tốt. Một ví dụ về điều này: Tôi đã làm việc với một số hệ thống chủ đề cốt lõi của chúng tôi, tức là các hệ thống cố gắng khớp với chủ đề của truy vấn.

Điều này không quá khó nếu bạn có truy vấn từ khóa, nhưng ngôn ngữ thì khó nói chung. Chúng tôi đã có những đột phá tuyệt vời trong việc hiểu ngôn ngữ tự nhiên trong những năm gần đây với
các mô hình ML, vì vậy chúng tôi muốn tận dụng nhiều công nghệ này để thực sự đảm bảo rằng chúng tôi hiểu được các tìm kiếm của mọi người để chúng tôi có thể tìm thấy nội dung phù hợp với điều đó. Đây là một vấn đề khó khăn đáng ngạc nhiên.

Và một trong những điều thú vị mà chúng tôi phát hiện ra khi làm việc về cái mà chúng tôi có thể gọi là tính thời sự, một từ khá thông dụng, là chúng tôi càng làm tốt thì mọi người sẽ càng thực hiện những tìm kiếm thú vị và khó khăn hơn.”

Google tập trung vào các chủ đề trong tìm kiếm như thế nào
Elizabeth quay lại thảo luận về Chủ đề, lần này gọi đó là “không gian chủ đề” và Google đã bỏ ra bao nhiêu công sức để làm đúng điều này. Điều đặc biệt quan trọng là bà nhấn mạnh cách Google từng rất tập trung vào từ khóa, với ngụ ý rõ ràng rằng họ không còn tập trung vào nó nữa, giải thích tầm quan trọng của chủ đề.

Cô ấy thảo luận về vấn đề này

“Vì vậy, Google từng rất tập trung vào từ khóa. Nếu bạn chỉ ghép một số từ với giới từ, chúng tôi có thể sẽ sai. Giới từ rất khó hoặc từng như vậy đối với hệ thống của chúng tôi. Ý tôi là, nhìn lại điều này, điều này thật buồn cười, phải không?

Nhưng ngày xưa, mọi người sẽ nhập một, hai, ba từ khóa. Khi tôi bắt đầu làm việc tại Google, nếu một tìm kiếm có hơn bốn từ, chúng tôi coi là dài. Ý tôi là, ngày nay tôi thường thấy các tìm kiếm dài có thể là 10-20 từ hoặc hơn. Khi chúng tôi có những tìm kiếm dài hơn, việc hiểu những từ nào là quan trọng trở nên khó khăn.

Ví dụ, điều này đã xảy ra cách đây nhiều năm, có thể là gần mười năm trước, nhưng chúng tôi từng bị thách thức bởi các tìm kiếm dạng câu hỏi. Một ví dụ kinh điển là “Barack Obama cao bao nhiêu?” Bởi vì chúng tôi muốn các trang cung cấp câu trả lời, không chỉ khớp với các từ cao bao nhiêu, đúng không?

Và, trên thực tế, khi đoạn trích nổi bật của chúng tôi lần đầu tiên xuất hiện, nó được thúc đẩy bởi loại vấn đề này. Làm thế nào chúng tôi có thể khớp câu trả lời, không chỉ khớp từ khóa trên các từ trong câu hỏi? Trong nhiều năm, chúng tôi đã thực hiện rất nhiều công việc trong, những gì chúng tôi có thể gọi là, không gian chủ đề. Đây là một không gian mà chúng tôi vẫn tiếp tục làm việc cho đến bây giờ.”

Tầm quan trọng của chủ đề và tính thời sự

Có rất nhiều điều cần hiểu trong câu trả lời của Tucker, bao gồm cả việc khi nghĩ về thuật toán xếp hạng tìm kiếm của Google, bạn cũng nên cân nhắc đến các hệ thống chủ đề cốt lõi giúp Google hiểu các chủ đề truy vấn tìm kiếm và khớp chúng với nội dung trang web vì điều này nhấn mạnh tầm quan trọng của việc suy nghĩ theo chủ đề thay vì tập trung quá nhiều vào thứ hạng cho từ khóa.

Một lỗi phổ biến mà tôi thấy là những người đang vật lộn với thứ hạng là họ tập trung quá nhiều vào từ khóa. Tôi đã khuyến khích một cách tiếp cận thay thế trong nhiều năm qua, nhấn mạnh tầm quan trọng của việc suy nghĩ theo Chủ đề. Đó là cách đa chiều để nghĩ về SEO. Tối ưu hóa cho từ khóa là một chiều. Tối ưu hóa cho một chủ đề là đa chiều và phù hợp với cách Google Tìm kiếm xếp hạng các trang web theo chủ đề là một phần quan trọng của thứ hạng.