Семантическое SEO

Книга: Справочник по SEO, онлайн-торговле и интернету
Автор: Иван Захаров

Что такое семантический поиск: глубокое погружение в поиск на основе сущностей. Семантика это теория значения, однако большинство определяют семантический поиск с акцентом на намерении. «Смысл» — это не то же самое, что «намерение». Узнать больше.

автор: Олаф Копп

С 2013 года Google постепенно превращается в 100% семантическую поисковую систему. Что такое семантический поиск? Вы можете найти множество объяснений, когда будете искать в Google ответ на этот вопрос, но большинство из них неточны и создают недопонимание.

Эта глава поможет вам комплексно понять, что такое семантический поиск.

Путь Google к становлению семантической поисковой системы

Усилия Google по разработке семантической поисковой системы стали видны с появлением Knowledge Graph / Граф Знаний в 2012 году и фундаментальным изменением в его алгоритме ранжирования в 2013 году (широко известном как Hummingbird / Колибри). Остальные крупные инновации, такие как RankBrain, EAT, BERT и MUM, прямо или косвенно поддерживали цель стать полностью семантической поисковой системой.

Внедряя в поиск обработку естественного языка (NLP), Google движется к этой цели с экспоненциальной скоростью.

Hummingbird / Колибри: «Не строки, а вещи» = сущности

Hummingbird — это стартовый сигнал эволюции Google в семантическую поисковую систему. Это было крупнейшее изменение в обработке поисковых запросов и ранжировании, когда-либо сделанное Google. Оно затронуло более 90% всех поисковых запросов уже в 2013 году.

Hummingbird фундаментально заменил большую часть существующих алгоритмов ранжирования. С помощью Hummingbird Google сразу же смог включить объекты, записанные в Knowledge Graph, для обработки запросов, ранжирования и вывода результатов поиска.

Сущность описывает сущность или идентичность конкретного или абстрактного объекта бытия. Сущности идентифицируются однозначно и имеют уникальное значение. По сути, можно провести различие между именованными сущностями и абстрактными понятиями.

Именованные сущности — это объекты реального мира, такие как люди, места, организации, продукты и события.
Абстрактные понятия имеют физическую, психологическую или социальную природу, такие как расстояние, количество, эмоции, права человека, мир и т. д.

До появления Hummingbird Google в основном сопоставлял документы по ключевым словам для ранжирования и не мог распознать значение поискового запроса или контента.

Что такое семантическая поисковая система?

Семантическая поисковая система учитывает семантический контекст поисковых запросов и контента, чтобы лучше понять смысл. Семантические поисковые системы также учитывают отношения между сущностями для возврата результатов поиска.

Поисковые системы, напротив, основан исключительно на ключевых словах и работают только на основе соответствия ключевого слова тексту.

Что такое семантический поиск?

Многие определения семантического поиска сосредоточены на интерпретации намерения поиска как его сущности. Но в первую очередь семантический поиск заключается в распознавании значения поисковых запросов и контента на основе встречающихся сущностей.

Считается, что семантика есть теория значения. Но «значение поиска» является не тем же самым, что «намерение поиска». Намерение описывает, какой результат пользователь хочет получить от поиска. Как видите, смыслы немног разные. Определение «значения поиска» может помочь распознать цель поиска, но это скорее дополнительное преимущество семантического поиска.

Роль Knowledge Graph в семантическом поиске Google

Ранжирование на основе сущностей требует такой же индексации на основе сущностей. Граф знаний — это индекс сущностей Google, который учитывает связи между ними. Классические индексы организованы в табличной форме и, следовательно, не позволяют отображать связи между наборами данных.

Граф знаний — это семантическая база данных, в которой информация структурирована таким образом, что из информации создаются знания. Здесь сущности (узлы) связаны друг с другом через ребра, снабжены атрибутами и другой информацией и помещены в тематический контекст или онтологии.

Сущности являются центральным организационным элементом в семантических базах данных, таких как Knowledge Graph Google. Помимо связей между сущностями, Google использует интеллектуальный анализ данных для сбора атрибутов и другой информации об этих сущностях и систематизирует их вокруг сущностей.

Вы получаете представление о том, какие источники и какую информацию Google рассматривает для объекта при его поиске. Предпочтительные источники, атрибуты и информация различаются в зависимости от типа объекта.

сточники сущности-физического лица отличаются от источников сущности-события или организационной сущности. Это влияет на информацию, отображаемую на панели знаний .

В основе Графа знаний лежат три уровня:

Каталог объектов : здесь хранятся все объекты, которые были идентифицированы с течением времени.
Хранилище знаний : сущности объединяются в хранилище знаний с информацией или атрибутами из различных источников. Речь идет прежде всего о слиянии и хранении описаний и создании семантических классов или групп в виде типов сущностей. Google генерирует данные через хранилище знаний, где осуществляет интеллектуальный анализ данных из неструктурированных источников.
Граф знаний : сущности связаны с атрибутами, и между сущностями устанавливаются отношения.

Google может использовать различные источники для идентификации объектов и связанной с ними информации.

Не все объекты, зафиксированные в хранилище знаний, включены в сеть знаний. Следующие критерии могут повлиять на включение в Сеть знаний:

Устойчивая социальная значимость.
Достаточное количество результатов поиска для объекта в индексе Google.
Устойчивое общественное мнение.
Записи в признанном словаре или энциклопедии или в специализированном справочном издании.

Можно предположить, что Google записал значительно больше объектов с длинным хвостом в хранилище знаний, такое как Knowledge Vault, чем в Knowledge Graph, и использует его для семантического поиска.

Сканируя открытый Интернет и обрабатывая естественный язык, Google может выполнять масштабируемый анализ объектов и данных независимо от структурированных и полуструктурированных баз данных. Это предоставляет Хранилищу Знаний все больше и больше информации, в том числе об объектах с длинным хвостом.

Google работает как семантическая поисковая система

Google использует семантический поиск в следующих областях:

Понимание поисковых запросов или сущностей при обработке поисковых запросов.
Понимание контента об объектах для ранжирования.
Понимание контента и сущностей для интеллектуального анализа данных.
Контекстная классификация объектов для последующей оценки EAT.

Поиск Google теперь основан на процессоре поисковых запросов для интерпретации поисковых запросов и составления корпусов документов, соответствующих поисковому запросу. Именно здесь вступают в игру BERT, MUM и RankBrain.

При обработке поисковых запросов условия поиска сравниваются с объектами, записанными в семантических базах данных, и при необходимости уточняются или переписываются. На следующем этапе определяется цель поиска и определяется подходящий корпус контента X. Google использует классический поисковый индекс, а также собственную семантическую базу данных в виде Knowledge Graph. Вероятно, обмен между этими двумя базами данных происходит через интерфейс.

Существует механизм оценки, состоящий из различных алгоритмов, основанных на основном алгоритме Hummingbird. Он отвечает за оценку контента, а затем упорядочивает его на основе оценок. Оценка связана с релевантностью контента по отношению к поисковому запросу или цели поиска.

Поскольку Google помимо релевантности также хочет оценивать качество контента, необходимо также проводить оценку по критериям E-E-A-T. Для оценки E-E-A-T Google должен оценить опыт, авторитет и надежность домена, издателя и/или автора. Базы данных семантических сущностей могут быть основой для этого.

Затем результаты поиска очищаются от дубликатов с помощью механизма очистки, и любые штрафы принимаются во внимание.

Что это значит для семантического SEO?

Некоторые гугловские патенты касаются сравнения внутренних графов знаний документов с графом знаний Google. Теория заключается в том, что высокий уровень соответствия между объектами, используемыми в тексте, и структурами отношений основного объекта в семантической базе данных Google приводит к более высокому рейтингу.

Это звучит логично. Но давайте будем честными: в конечном итоге оптимизация на основе ключевых слов не отличается существенно от оптимизации контента на основе сущностей.

Структура тематических миров также имеет смысл, хотя надо сказать, что при ранжировании времени прохождения следует учитывать следующее:

В какой степени тема разбита на различные подтемы?
Создается ли отдельный контент для каждой подтемы?
Создается ли только целостный контент-актив?

И структурированные данные…

Да, структурированные данные могут помочь Google понять семантические связи, но только до тех пор, пока они перестанут быть нужными. И это случится очень скоро.

На мой взгляд, Google настолько хорош в машинном обучении, что использует структурированные данные для более быстрого обучения алгоритмов.

В качестве примера возьмем разметку для профилей в социальных сетях. Прошло всего около года с того момента, как Google рекомендовал его использование, до того, как они объявили, что могут автоматически просматривать социальные профили без структурированных данных .

Это всего лишь вопрос времени, когда Google перестанет нуждаться в структурированных данных. Структурированные данные не являются хорошей основой для оценки. Они либо есть, либо нет.

Вы можете отнести все это и к семантическому SEO. Однако чего мне часто не хватает, так это глобального взгляда на организации как на издателей и авторов. Здесь играют роль больше внестраничные, чем внутристраничные сигналы. Основываясь на отношениях между авторитетными и заслуживающими доверия организациями, Google хочет определить, какие домены и авторы являются источниками наилучшего качества по теме согласно E-E-A-T.

Кто с кем связан?
Кто кого рекомендует?
Кто с кем тусуется?

Ссылки и совпадения с Google могут использоваться в качестве факторов близости между авторитетными организациями. Под семантическим SEO я также подразумеваю их оптимизацию.

Раз уж мы заговорили о сосуществовании, вам следует подумать о том, как работает НЛП при оптимизации контента. Google использует НЛП для идентификации сущностей и их контекста. Это работает через грамматические структуры предложений, тройки и кортежи, состоящие из существительных и глаголов.

Вот почему следует обратить внимание на грамматическую простую структуру предложений в семантическом SEO. Используйте короткие предложения без личных местоимений и вложений.

Будущее семантического поиска: когда можно будет достичь 100% поиска в Google на основе сущностей?

Я думаю, что в будущем обмен между классическим поисковым индексом Google и Графом знаний будет расширяться через интерфейс.

Чем больше объектов записано в Графе знаний, тем больше их влияние на результаты поиска. Тем не менее, Google по-прежнему сталкивается с серьезными проблемами совмещения полноты и точности.

Для фактической оценки сущности на уровне документа не играют важной роли. Скорее, они являются важным организационным элементом для создания невзвешенных корпусов документов на стороне поискового индекса.

Фактический анализ документов производится по классическим правилам информационного поиска. Однако на уровне домена существует большое влияние сущностей на рейтинг. ЕEАТ решает!.

В ближайшие годы мы увидим растущее влияние сущностей в поиске Google. Новый внешний вид поиска по объектам ясно показывает, как Google постепенно организует индексацию информации и контента вокруг объекта. Это показывает, насколько сильно такие инновации, как MUM, следуют идее семантического поиска.