Патент Google на рейтинг доверия показывает, что поведение пользователя является сигналом

Патент Google на доверие описывает систему, которая ранжирует веб-сайты на основе поведения пользователей и ссылок с доверенных веб-сайтов.
Поведение пользователя является сигналом

Google давно подал патент на ранжирование результатов поиска по доверию. Новаторская идея патента заключается в том, что поведение пользователя может быть использовано в качестве отправной точки для разработки сигнала ранжирования.

Основная идея патента заключается в том, что Интернет полон веб-сайтов, которые ссылаются друг на друга и комментируют друг друга. Но какие сайты заслуживают доверия? Решение Google заключается в использовании поведения пользователя для указания того, какие сайты заслуживают доверия, а затем использовании ссылок и контента на этих сайтах для выявления большего количества сайтов, заслуживающих доверия по любой заданной теме.

PageRank по сути то же самое, только начинается и заканчивается тем, что один сайт ссылается на другой. Инновация патента Google на рейтинг доверия заключается в том, чтобы поместить пользователя в начало этой цепочки доверия, например:

Пользователь доверяет X веб-сайтам > X веб-сайтов доверяют другим сайтам > Это передается в Google как сигнал ранжирования

Доверие исходит от пользователя и передается на сайты доверия, которые сами предоставляют якорный текст, списки других сайтов и комментарии о других сайтах.

Вот вкратце суть алгоритма ранжирования Google, основанного на доверии.

Более глубокое понимание заключается в том, что оно раскрывает новаторский подход Google, позволяющий пользователям быть сигналом того, что заслуживает доверия. Вы знаете, как Google постоянно говорит создавать веб-сайты для пользователей? Именно в этом и заключается суть патента на доверие, помещая пользователя на переднее сиденье алгоритма ранжирования.

Патент Google на доверие и рейтинг

По совпадению, патент был подан примерно в тот же период, когда Yahoo и Стэнфордский университет опубликовали исследовательскую работу Trust Rank, посвященную выявлению спам-страниц.

Патент Google не о поиске спама. Он нацелен на противоположное — на выявление заслуживающих доверия веб-страниц, которые удовлетворяют намерениям пользователя в отношении поискового запроса.

Как используются факторы доверия

Первая часть любого патента состоит из раздела «Аннотация», который предлагает очень общее описание изобретения, что и делает данный патент.

В аннотации к патенту утверждается:

  • Факторы доверия используются для ранжирования веб-страниц.
  • Факторы доверия генерируются из «сущностей» (которые далее описываются как сами пользователи, эксперты, экспертные веб-страницы и участники форума), которые ссылаются на другие веб-страницы или комментируют их).
  • Затем эти факторы доверия используются для повторного ранжирования веб-страниц.
  • Повторное ранжирование веб-страниц происходит после того, как обычный алгоритм ранжирования выполнил свою работу со ссылками и т. д.

Вот что говорится в аннотации:

«Поисковая система предоставляет результаты поиска, которые ранжируются в соответствии с мерой доверия, связанной с субъектами, которые предоставили метки для документов в результатах поиска.

Поисковая система получает запрос и выбирает документы, соответствующие запросу.

Поисковая система также определяет метки, связанные с выбранными документами, и рейтинги доверия субъектов, предоставивших метки.

«Рейтинги доверия используются для определения факторов доверия для соответствующих документов. Факторы доверия используются для корректировки оценок поиска информации документов. Затем результаты поиска ранжируются на основе скорректированных оценок поиска информации».

Как вы можете видеть, в Реферате не говорится, кто такие «сущности», и не говорится, каковы их метки, но это будет сказано позже.

Область изобретения

Следующая часть называется Областью изобретения. Целью является описание технической области изобретения (поиск информации) и фокуса (доверительные отношения между пользователями) для целей ранжирования веб-страниц.

Вот что там говорится:

«Настоящее изобретение относится к поисковым системам, а точнее к поисковым системам, которые используют информацию, указывающую на доверительные отношения между пользователями, для ранжирования результатов поиска».

Теперь перейдем к следующему разделу — «Предыстория», где описывается проблема, которую решает это изобретение.

Предыстория изобретения

В этом разделе описывается, почему поисковые системы не отвечают на запросы пользователей (проблема) и почему изобретение решает эту проблему.

Основные описанные проблемы:

  • Поисковые системы, по сути, угадывают (делают вывод) намерения пользователя, когда он использует только поисковый запрос.
  • Пользователи полагаются на маркированный экспертами контент с надежных сайтов (называемых вертикальными сайтами знаний), чтобы узнать, какие веб-страницы заслуживают доверия.
  • Объясняет, почему контент, помеченный как релевантный или заслуживающий доверия, важен, но игнорируется поисковыми системами.
  • Важно помнить, что этот патент появился до алгоритма BERT и других подходов к естественному языку, которые сейчас используются для лучшего понимания поисковых запросов.

Вот как это объясняется в патенте:

«Неотъемлемой проблемой при проектировании поисковых систем является то, что релевантность результатов поиска для конкретного пользователя зависит от факторов, которые в значительной степени зависят от намерения пользователя при выполнении поиска (то есть, почему он выполняет поиск), а также от обстоятельств пользователя, фактов, относящихся к потребностям пользователя в информации.

Таким образом, если два разных пользователя введут один и тот же запрос, один и тот же набор результатов поиска может оказаться релевантным для одного пользователя и нерелевантным для другого, исключительно из-за разных намерений и информационных потребностей».

Далее объясняется, что пользователи доверяют определенным веб-сайтам, предоставляющим информацию по определенным темам:

«…Отчасти из-за неспособности современных поисковых систем последовательно находить информацию, удовлетворяющую информационным потребностям пользователя, а не только условиям его запроса, пользователи часто обращаются к веб-сайтам, которые предлагают дополнительный анализ или понимание контента, доступного в Интернете».

Веб-сайты — это сущности

Остальная часть раздела «Предыстория» называет форумы, сайты обзоров, блоги и новостные сайты местами, куда пользователи обращаются за информацией, называя их вертикальными сайтами знаний. Вертикальные сайты знаний, как будет объяснено позже, могут быть любым видом веб-сайта.

В патенте объясняется, что именно доверие является причиной того, почему пользователи обращаются к этим сайтам:

«Такая степень доверия ценна для пользователей как способ оценки зачастую сбивающего с толку массива информации, доступной в Интернете».

Подводя итог, раздел «Предыстория» объясняет, что доверительные отношения между пользователями и такими сущностями, как форумы, сайты с обзорами и блоги, могут использоваться для влияния на рейтинг результатов поиска. По мере углубления в патент мы увидим, что сущности не ограничиваются указанными выше типами сайтов, это может быть любой тип сайта.

Раздел «Краткое описание патента»

Эта часть патента интересна тем, что она объединяет все концепции в одном месте, но в общей манере, а также добавляет несколько юридических параграфов, которые поясняют, что патент может применяться в более широкой области, чем указано в патенте.

Раздел «Резюме» состоит из четырех разделов:

  • В первом разделе объясняется, что поисковая система ранжирует веб-страницы, которым доверяют организации (например, форумы, новостные сайты, блоги и т. д.), и что система хранит информацию об этих метках о доверенных веб-страницах.
  • Во втором разделе дается общее описание работы субъектов (форумов, новостных сайтов, блогов и т. д.).
  • В третьей части дается общее описание того, как работает система, начиная с запроса, различных манипуляций поисковой системой в отношении меток сущностей, а затем результатов поиска.
  • Четвертая часть — это юридическое объяснение того, что патент не ограничивается описаниями и что изобретение применяется в более широкой области. Это важно. Это позволяет Google использовать несуществующую вещь, даже что-то такое безумное, как «кнопка доверия», которую пользователь выбирает для идентификации сайта как заслуживающего доверия, в качестве примера. Это позволяет примеру, такому как несуществующая «кнопка доверия», быть заменой чего-то другого, например, навигационных запросов или Navboost или чего-либо еще, что является сигналом того, что пользователь доверяет веб-сайту.

Вот краткое объяснение того, как работает эта система:

  • Пользователь посещает сайты, которым он доверяет, и нажимает «кнопку доверия», которая сообщает поисковой системе, что это надежный сайт.
  • Доверенный сайт «маркирует» другие сайты как доверенные по определенным темам (этой темой может быть, например, «симптомы»).
  • Пользователь задает вопрос в поисковой системе (запрос) и использует метку (например, «симптомы»).
  • Поисковая система ранжирует веб-сайты обычным образом, затем ищет сайты, которым доверяют пользователи, и смотрит, использовали ли какие-либо из этих сайтов ярлыки, указывающие на другие сайты.
  • Google ранжирует те сайты, которым присвоены метки доверенными сайтами.

Вот сокращенная версия третьей части Резюме, которая дает представление о внутренней работе изобретения:

«Пользователь отправляет запрос в систему… Система извлекает набор результатов поиска… Система определяет, какие метки запроса применимы к какому из документов результатов поиска. … определяет для каждого документа общий фактор доверия, который следует применить… корректирует… оценку извлечения… и переранжирует результаты».

Вот этот же раздел полностью:

  • «Пользователь отправляет запрос в систему; запрос содержит как минимум один термин запроса и, по желанию, одну или несколько меток, представляющих интерес для пользователя.
  • Система извлекает набор результатов поиска, включающий документы, соответствующие термину(ам) запроса.
  • Система определяет, какие метки запроса применимы к тем или иным документам результатов поиска.
  • Система определяет для каждого документа общий фактор доверия, применяемый к документу, на основе рейтингов доверия тех субъектов, которые предоставили метки, соответствующие меткам запроса.
  • Применение фактора доверия к документу корректирует оценку поиска информации из документа, чтобы получить оценку поиска информации, скорректированную с учетом доверия.
  • Система переоценивает документы с результатами поиска на основе оценок поиска информации с поправкой на доверие».

Вышеизложенное представляет собой общее описание изобретения.

Следующий раздел, называемый «Подробное описание», глубоко погружает в детали. На этом этапе становится все более очевидным, что патент очень тонкий и не может быть сведен к простым советам вроде: «оптимизируйте свой сайт таким образом, чтобы заслужить доверие».

Большая часть патента основана на кнопке доверия и расширенном поисковом запросе: метка:

Ни кнопка доверия, ни ярлык расширенного поискового запроса никогда не существовали. Как вы увидите, они, скорее всего, являются заменителями методов, которые Google не хочет явно раскрывать.

Подробное описание в четырех частях

Подробности этого патента находятся в четырех разделах в разделе «Подробное описание» патента. Этот патент не так прост, как говорят 99% SEO-специалистов.

Вот четыре раздела:

  1. Обзор системы.
  2. Получение и хранение информации о доверии.
  3. Получение и хранение информации на этикетках.
  4. Сгенерированные результаты поиска с рейтингом доверия.

Обзор системы — это то место, где патент глубоко погружается в детали. Ниже приведен обзор, чтобы было легче понять.

Обзор системы

  1. Объясняет, как изобретение (поисковая система) ранжирует результаты поиска на основе доверительных отношений между пользователями и доверенными пользователями субъектами, которые маркируют веб-контент.
  2. В патенте описывается «кнопка доверия», на которую пользователь может нажать, чтобы сообщить Google, что пользователь доверяет веб-сайту или доверяет веб-сайту в отношении определенной темы или тем.
  3. В патенте говорится, что рейтинг доверия присваивается веб-сайту, когда пользователь нажимает кнопку доверия на веб-сайте.
  4. Информация о кнопке доверия хранится в базе данных доверия, которая называется #190.

Вот что говорится о присвоении рейтинга доверия на основе кнопки доверия:

«Информация о доверии, предоставляемая пользователями по отношению к другим, используется для определения рейтинга доверия для каждого пользователя, который является мерой общей степени доверия пользователей к конкретной организации».

Кнопка рейтинга доверия

В патенте упоминается «рейтинг доверия» веб-сайтов, которым доверяют пользователи. Этот рейтинг доверия основан на кнопке доверия, которую пользователь нажимает, чтобы указать, что он доверяет данному веб-сайту, присваивая ему оценку рейтинга доверия.

В патенте говорится:

«…пользователь может нажать на «кнопку доверия» на веб-странице, принадлежащей субъекту, что приведет к созданию соответствующей записи о доверительных отношениях в базе данных доверия 190.

В целом, может быть использован любой тип ввода от пользователя, указывающий на существование доверительных отношений».

Кнопки доверия никогда не существовало, и патент молчаливо признает это, заявляя, что для указания на доверительные отношения может использоваться любой тип ввода.

Так что же это? Я считаю, что «кнопка доверия» — это подставная метрика для показателей поведения пользователя в целом и данных о посетителях сайта в частности. В разделе патентных претензий кнопки доверия вообще не упоминаются, но упоминаются данные о посетителях пользователя как индикатор доверия.

Вот несколько отрывков, в которых посещения сайта упоминаются как способ понять, доверяет ли пользователь веб-сайту:

«Система также может изучать шаблоны веб-посещений пользователя и делать выводы из шаблонов веб-посещений, каким сущностям доверяет пользователь. Например, система может сделать вывод, что определенный пользователь доверяет определенной сущности, когда пользователь посещает веб-страницу сущности с определенной частотой».

То же самое указано в разделе «Формула изобретения» патента, это самая первая формула изобретения:

«Метод, выполняемый устройством обработки данных, включающий:
определение на основе моделей посещения веб-сайтов пользователем одного или нескольких доверительных отношений, указывающих на то, что пользователь доверяет одному или нескольким субъектам»;

Вполне возможно, что под «кнопкой доверия» подразумеваются закономерности посещения сайтов и другие особенности поведения пользователей.

Метки, созданные надежными сайтами

В патенте доверенными организациями называются новостные сайты, блоги, форумы и сайты с обзорами, но это не ограничивается сайтами такого типа, это может быть любой другой тип веб-сайта.

Доверенные веб-сайты создают ссылки на другие сайты и в этой ссылке они маркируют эти другие сайты как имеющие отношение к определенной теме. Эта метка может быть якорным текстом. Но это может быть и что-то еще.

В патенте якорный текст упоминается явно только один раз:

«В некоторых случаях организация может просто создать ссылку со своего сайта на определенный элемент веб-контента (например, документ) и предоставить метку 107 в качестве якорного текста ссылки».

Хотя в патенте якорный текст упоминается явно только один раз, есть и другие отрывки, где якорный текст явно подразумевается. Например, в патенте предлагается общее описание меток как описывающих или категоризирующих контент, найденный на другом сайте:

«…метки — это слова, фразы, маркеры или другие признаки, которые были связаны с определенным веб-контентом (страницами, сайтами, документами, медиа и т. д.) другими лицами в качестве описательных или категориальных идентификаторов».

Метки и аннотации

Доверенные сайты ссылаются на веб-страницы с метками и ссылками. Сочетание метки и ссылки называется аннотацией.

Вот как это описывается:

«Аннотация 106 включает метку 107 и шаблон URL, связанный с меткой; шаблон URL может быть специфичным для отдельной веб-страницы или для любой части веб-сайта или страниц на нем».

Метки, используемые в поисковых запросах

Пользователи также могут искать с «метками» в своих запросах, используя несуществующий расширенный поисковый запрос «метка:». Такие типы запросов затем используются для сопоставления меток, с которыми связана страница веб-сайта.

Вот как это объясняется:

«Например, запрос «метка рака:симптомы» включает в себя термин запроса «отмена» и метку запроса «симптомы» и, таким образом, является запросом документов, имеющих отношение к раку и помеченных как относящиеся к «симптомам».

Такие метки могут быть связаны с документами любого субъекта, независимо от того, создал ли он документ или является третьей стороной. Субъект, пометивший документ, имеет определенную степень доверия, как описано ниже».

 

Что это за метка в поисковом запросе? Это могут быть просто определенные описательные ключевые слова, но нет никаких подсказок, чтобы строить предположения дальше этого.

В патенте все это изложено следующим образом:

«Используя информацию аннотаций и информацию о доверии из базы данных доверия 190, поисковая система 180 определяет фактор доверия для каждого документа».

Выводы

Доверие пользователя к веб-сайту. Этот веб-сайт, которому доверяет пользователь, не обязательно тот, который ранжируется, это веб-сайт, который ссылается/доверяет другой релевантной веб-странице. Веб-страница, которая ранжируется, может быть той, которую доверенный сайт пометил как релевантную для определенной темы, и это может быть веб-страница на самом доверенном сайте. Цель сигналов пользователя — предоставить отправную точку, так сказать, для определения заслуживающих доверия сайтов.

Экспертам доверяют

Вертикальные сайты знаний, сайты, которым доверяют пользователи, могут размещать комментарии экспертов. Эксперт может быть также издателем доверенного сайта. Эксперты важны, поскольку ссылки с сайтов экспертов используются как часть процесса ранжирования.

Эксперты определяются как авторы глубокого контента по теме:

«Эти и другие вертикальные сайты знаний могут также размещать анализ и комментарии экспертов или других лиц, обладающих знаниями, опытом или точкой зрения в определенных областях, которые, в свою очередь, могут комментировать контент, найденный в Интернете.

Например, веб-сайт, созданный экспертом по цифровым камерам и посвященный цифровым камерам, обычно содержит обзоры продукции, рекомендации по ее приобретению, а также ссылки на сайты производителей камер, анонсы новых продуктов, технические статьи, дополнительные обзоры или другие источники контента.

Чтобы помочь пользователю, эксперт может включить комментарии к связанному контенту, например, обозначить определенную техническую статью как «уровень эксперта», или определенный обзор как «отрицательный профессиональный обзор», или анонс нового продукта как «новый 10-мегапиксельный цифровой зеркальный фотоаппарат».

Ссылки с сайтов экспертов

Ссылки и аннотации с проверенных пользователями экспертных сайтов описываются как источники надежной информации:

«Например, эксперт может создать аннотацию 106, включающую метку 107 «Профессиональный обзор» для обзора 114 цифровой зеркальной камеры Canon на веб-сайте «www.digitalcameraworld.com», метку 107 «Джазовая музыка» для компакт-диска 115 на сайте «www.jazzworld.com», метку 107 «Классическая драма» для фильма 116 «К северу через северо-запад», представленного на веб-сайте «www.movierental.com», и метку 107 «Симптомы» для группы страниц, описывающих симптомы рака толстой кишки на веб-сайте 117 «www.yourhealth.com».

Обратите внимание, что метки 107 могут также включать числовые значения (не показаны), указывающие рейтинг или степень значимости, которую субъект придает помеченному документу.

Веб-сайт эксперта 105 также может включать информацию о доверии. Более конкретно, веб-сайт эксперта 105 может включать список доверия 109 субъектов, которым эксперт доверяет. Этот список может быть в форме списка имен субъектов, URL-адресов веб-страниц таких субъектов или другой идентифицирующей информации. Веб-сайт эксперта 105 может также включать список тщеславия 111, перечисляющий субъектов, которые доверяют эксперту; опять же, это может быть в форме списка имен субъектов, URL-адресов или другой идентифицирующей информации.

Предполагаемое доверие

Патент описывает дополнительные сигналы, которые могут использоваться для сигнализации (вывода) доверия. Это более традиционные сигналы типа ссылок, списка доверенных веб-страниц (возможно, страницы ресурсов?) и списка сайтов, которые доверяют веб-сайту.

Вот предполагаемые сигналы доверия:

«(1) ссылки с веб-страницы пользователя на веб-страницы, принадлежащие доверенным организациям;
(2) список доверия, который идентифицирует организации, которым доверяет пользователь; или
(3) список секретности, который идентифицирует пользователей, доверяющих владельцу страницы секретности».

Еще один вид сигнала доверия, который можно вывести, — это определение сайтов, которые пользователь склонен посещать.

В патенте поясняется:

«Система также может изучать шаблоны веб-посещений пользователя и делать выводы из шаблонов веб-посещений, каким сущностям доверяет пользователь. Например, система может сделать вывод, что определенный пользователь доверяет определенной сущности, когда пользователь посещает веб-страницу сущности с определенной частотой».

Выводы

Это довольно большой сигнал, и я считаю, что он предполагает, что рекламные мероприятия, которые побуждают потенциальных посетителей сайта открывать сайт и затем становиться лояльными посетителями сайта, могут быть полезны. Например, такой сигнал можно отслеживать с помощью брендовых поисковых запросов . Возможно, Google смотрит только на информацию о посещении сайта, но я думаю, что брендовые запросы являются столь же заслуживающим доверия сигналом, особенно когда эти запросы сопровождаются метками... динь, динь, динь!

В патенте также перечислены некоторые примеры предполагаемого доверия, например, данные списка контактов/чатов. Там не говорится о социальных сетях, а только о списках контактов/чатов.

Доверие может ослабевать или усиливаться

Еще одной интересной особенностью рейтинга доверия является то, что он может уменьшаться или увеличиваться с течением времени.

В патенте эта часть изложена прямолинейно:

«Обратите внимание, что доверительные отношения могут меняться. Например, система может увеличить (или уменьшить) прочность доверительных отношений для доверенного субъекта. Поисковая система 100 также может привести к снижению прочности доверительных отношений с течением времени, если доверительные отношения не подтверждены пользователем, например, посетив веб-сайт субъекта и активировав кнопку доверия 112».

Пользовательский интерфейс редактора доверительных отношений

Сразу после абзаца выше идет раздел о том, как разрешить пользователям редактировать свои доверительные отношения через пользовательский интерфейс. Такого никогда не было, как и несуществующей кнопки доверия.

Это, возможно, замена для чего-то другого. Может ли эта панель доверенных сайтов быть закладками браузера Chrome или сайтами, которые отслеживаются в Discover? Это вопрос для размышлений.

Вот что говорится в патенте:

«Поисковая система 100 может также предоставлять пользовательский интерфейс к базе данных доверия 190, с помощью которого пользователь может редактировать доверительные отношения пользователя, включая добавление или удаление доверительных отношений с выбранными сущностями.

Информация о доверии в базе данных доверия 190 также периодически обновляется путем сканирования веб-сайтов, включая сайты субъектов с информацией о доверии (например, списки доверия, списки тщеславия); рейтинги доверия пересчитываются на основе обновленной информации о доверии».

Что такое патент Google Trust

Патент Google Search Result Ranking Based On Trust  описывает способ использования сигналов поведения пользователя для понимания того, какие сайты заслуживают доверия. Затем система определяет сайты, которым доверяют сайты, которым доверяют пользователи, и использует эту информацию в качестве сигнала ранжирования. Фактической метрики ранга доверия нет, но есть сигналы ранжирования, связанные с тем, чему доверяют пользователи. Эти сигналы могут ослабевать или усиливаться в зависимости от таких факторов, как то, посещает ли пользователь эти сайты по-прежнему.

Более важный вывод заключается в том, что этот патент является примером того, как Google фокусируется на сигналах пользователей как на источнике ранжирования, чтобы они могли направить их обратно в ранжирующие сайты, которые соответствуют их потребностям. Это означает, что вместо того, чтобы делать что-то, потому что «это нравится Google», лучше пойти еще глубже и делать что-то, потому что это нравится пользователям. Это даст обратную связь Google через эти виды алгоритмов, которые измеряют модели поведения пользователей, что, как мы все знаем, использует Google.

Комментарии