Как поисковые системы ранжируют страницы

Узнайте, как поисковые системы ранжируют веб-страницы – от классификации запроса до присвоения контекста и определения наиболее важных сигналов.

Как профессионалы в области SEO, мы обычно фокусируемся на вопросе: "Как я могу поднять свою страницу в рейтинге?"

Вопрос, который, возможно, также важен или даже более важен, – "Как поисковые системы ранжируют страницы?"

Почему поисковые системы ранжируют веб-страницы

Прежде чем мы поглубже вникнем в то, как поисковые системы ранжируют веб-страницы, давайте на мгновение остановимся и подумаем, почему они это делают.

В конце концов, для них было бы дешевле и проще просто отображать страницы случайным образом, по количеству слов, по свежести или по любой из различных систем простой сортировки.

Очевидно, почему они этого не делают. Вы бы не пользовались этим.

Таким образом, когда всплывает вопрос о рейтингах, мы должны помнить, что пользователь, которого пытаемся удовлетворить, не принадлежит нам. Пользователь принадлежит поисковой системе, и поисковые системы временно предоставляют его нам.

Если мы неправильно используем этого пользователя, он может не вернуться к поисковой системе, и, следовательно, у поисковой системы уменьшится объем рекламного дохода.

Мне нравится представлять себе этот сценарий как некоторые из страниц наших ресурсов.

Если мы рекомендуем инструмент или услугу, это основано на нашем опыте, и мы верим, что опыт также будет полезен нашим посетителям. Если мы узнаем, что это не так, мы удалим инструмент или услугу с нашего сайта.

Но каким образом?

Отказ от ответственности

У меня нет шпионских устройств в Google или Bing.

У меня есть Google на столе, и еще один, который ношу с собой, когда не сижу за столом.

Я говорю об этом, чтобы ясно дать понять, что следующий текст основан примерно на 20 годах наблюдений за эволюцией поисковых систем, на чтении патентов (или, чаще всего, на анализе патентов Билла Слоуски) и на начале каждого дня на протяжении многих лет с обзора событий в индустрии, начиная от изменений макета SERP до обновлений алгоритмов.

Принимайте то, что я говорю, как осведомленное объяснение, которое, надеюсь, верно на 90%.

Вы задаетесь вопросом, почему я думаю, что 90%? Я узнал от Фредерика Дюбю Бинга, что 90% – это отличное число для использования при грубой оценке.

Всего 5 простых шагов – Просто

Существует пять шагов в полном процессе ранжирования страницы.

Я не включаю технические сложности, такие как балансировка нагрузки, и не говорю о каждом различном вычислении сигнала.

Я говорю только о базовом процессе, через который должен пройти каждый запрос, чтобы начать свою жизнь как запрос информации и завершить ее как набор из 10 гиперссылок, утопленных в море рекламы.

Поняв этот процесс, понимая, для кого он предназначен, вы будете на пути к правильному мышлению о том, как ранжировать ваши страницы для их пользователей.

Мне также кажется необходимым отметить, что используемые мной слова для этих шагов – это мои слова и не какое-то официальное название.

Используйте их свободно, но не ожидайте, что одна из поисковых систем будет использовать ту же терминологию.

Шаг 1: Классификация

Первый шаг в процессе – классификация поступающего запроса.

Классификация запроса предоставляет системе информацию, необходимую для выполнения всех последующих шагов.

Прежде чем сложная классификация могла происходить (читайте: когда поисковые системы полагались на ключевые слова, а не на сущности), двигателям в основном приходилось применять одни и те же сигналы ко всем запросам.

Как мы далее рассмотрим, это больше не так.

Именно на этом первом этапе двигатель будет применять такие метки (опять же, не технический термин, но легкий способ думать об этом) к запросу, как:

  • YMYL (ваша жизнь, ваше здоровье)
  • Локальный
  • Невидимый
  • Для взрослых
  • Вопрос

Я не знаю, сколько различных классификаций существует, но первый шаг, который должен предпринять двигатель – определить, какие из них применимы к любому данному запросу.

Шаг 2: Контекст

Второй шаг в процессе ранжирования – присвоение контекста.

По возможности двигатель должен учитывать любую соответствующую информацию о пользователе, вводящем запрос.

Мы видим это регулярно для запросов, даже тех, которые мы не задаем. Мы видим их здесь:

присвоение контекста

И мы видим их здесь:

присвоение контекста 2

Последнее, конечно, пример того, когда я не вводил запрос явно.

По сути, второй этап процесса предназначен для того, чтобы двигатель определил, какие факторы окружающей среды и исторические факторы вступают в игру.

Они знают категорию запроса, здесь они применяют, определяют или извлекают данные, связанные с элементами, считающимися актуальными для этой категории и типа запроса.

Некоторые примеры окружающей среды и исторической информации, которая может рассматриваться:

  • Местоположение
  • Время
  • Является ли запрос вопросом
  • Устройство, используемое для запроса
  • Формат, используемый для запроса
  • Связан ли запрос с предыдущими запросами
  • Был ли ими ранее виден этот запрос


Шаг 3: Вес

Прежде чем мы начнем, позвольте мне спросить вас, насколько вы устали слышать о RankBrain?

Так что приготовьтесь, потому что мы собираемся упомянуть его снова, но только в качестве примера третьего этапа.

Прежде чем двигатель сможет определить, какие страницы следует ранжировать, ему сначала нужно определить, какие сигналы являются наиболее важными.

Для запроса [гражданская война] мы получаем результат, который выглядит так:

результат запроса [гражданская война]

Как ранжируются страницы поисковых систем

Стабильный результат. Но что, если свежесть сыграла бы важную роль? Мы бы получили результат более подобный:

Свежий результат запроса [гражданская война]Как ранжируются страницы поисковых систем

Но мы не можем исключить свежесть. Если бы запрос был [лучшие шоу на нетфликсе], меня бы мало волновал авторитет, а больше волновало, насколько недавно он был опубликован.

Мне мало интересно читать тяжело привязанный материал с 2008 года, описывающий лучшие DVD для заказа на их сервисе.

Таким образом, с типом запроса в руках, а также с извлеченными элементами контекста, двигатель теперь может полагаться на свое понимание того, какие из их сигналов применимы и с какими весами для заданных комбинаций.

Часть этого, конечно, может быть выполнено вручную множеством талантливых инженеров и компьютерных ученых, и часть будет обработана системами, такими как RankBrain, которая (в сто первый раз) является алгоритмом машинного обучения, предназначенным для корректировки весов сигналов для ранее не виденных запросов, но впоследствии введенных в общие алгоритмы Google.

С утверждением о том, что примерно 90% ее алгоритмов ранжирования зависят от машинного обучения, можно с уверенностью предположить, что у Bing есть аналогичные системы.

Шаг 4: Макет

Мы все видели это. Фактически, вы можете увидеть это в приведенном выше примере о гражданской войне. Для различных запросов макет страницы результатов поиска меняется.

Движки определят, какие форматы могут применяться к намерению запроса, пользователю, запускающему запрос, и доступным ресурсам.

Полная страница SERP для [гражданская война] выглядит так:

Полная страница SERP для [гражданская война]

Как ранжируются страницы поисковых систем

Я сделал обоснованное предположение относительно основного фактора, используемого для определения того, когда присутствует каждый элемент.

Правда в том, что это подвижная цель и зависит от знания сущностей, их взаимосвязей и их веса.

Это очень сложная тема, поэтому мы не будем вдаваться в нее здесь.

Важно понимать в контексте этой статьи, что различные элементы любой страницы результатов поиска нужно определить более или менее на лету.

Это означает, что, когда запускается запрос и завершаются первые три шага, движок будет обращаться к базе данных различных возможных элементов для вставки на страницу, возможных размещений, а затем определит, какие применять к конкретному запросу.

Между прочим: я отметил выше, что страницы результатов поиска создаются более или менее на лету.

Хотя это верно для редких запросов, для частых запросов гораздо вероятнее, что движки ведут базу данных элементов, которые они уже рассчитали на соответствие предполагаемому намерению пользователя, чтобы не обрабатывать это каждый раз.

Предполагаю, что на это установлено временное ограничение, после истечения которого она обновляется, и я подозреваю, что обновление полной записи происходит в период низкого использования.

Но двигаясь дальше, теперь двигатель знает классификацию запроса, контекст, в котором запрашивается информация, веса сигналов, применимые к такому запросу, и макет, наиболее вероятно соответствующий различным возможным намерениям для запроса.

Наконец, пришло время для ранжирования.

Шаг 5: Ранжирование

Интересно, но, вероятно, это самый простой этап процесса, хотя и не такой единообразный, как можно подумать.

Когда мы думаем о органическом ранжировании, мы представляем себе 10 синих ссылок. Итак, давайте начнем с этого и рассмотрим процесс до сих пор:

  • Пользователь вводит запрос.
  • Движок рассматривает тип запроса и классифицирует его, чтобы понять, какие ключевые критерии применяются на высоком уровне на основе аналогичных или идентичных предыдущих взаимодействий с запросами.
  • Движок рассматривает положение пользователя в пространстве и времени, чтобы оценить его предполагаемые намерения.
  • Движок принимает классификации запроса и сигналы, специфичные для пользователя, и использует их для определения того, какие сигналы должны иметь какие веса.

Движок использует вышеуказанные данные также для определения того, какие макеты, форматы и дополнительные данные могут удовлетворять или дополнять намерения пользователя.

Имея все это в руках и с уже написанным алгоритмом, двигателю просто нужно обработать числа.

Они извлекут различные сайты, которые могут рассматриваться для ранжирования, применят веса к своим алгоритмам и обработают числа, чтобы определить порядок, в котором сайты должны появляться в результатах поиска.

Конечно, они должны сделать это для каждого элемента на странице разными способами.

Видео, истории, сущности и информация все меняются, поэтому двигатели должны упорядочивать не только синие ссылки, но и все остальное на странице.

Заключение

Ранжирование сайта просто. Но настоящая работа заключается в объединении всего этого для его выполнения.

Вы можете спросить, как понимание этого может помочь вам в ваших усилиях по SEO. Это похоже на понимание основных функций работы вашего компьютера.

Я не могу построить процессор, но я знаю, что они делают, и я знаю, какие характеристики делают его более быстрым и как охлаждение на него влияет.

Знание этого позволяет мне иметь более быстрый компьютер, который мне нужно обновлять и модернизировать гораздо реже.

То же самое верно и для SEO.

Если вы понимаете основы функционирования двигателя, вы поймете свое место в этой экосистеме.

И это приведет к стратегиям, разработанным с учетом двигателя и обслуживающим реального пользователя – их пользователя.