Как работают алгоритмы поисковых систем: всё, что вам нужно знать

Поисковый алгоритм – это обширная коллекция других алгоритмов, каждый из которых имеет свою собственную цель и задачу. Вот как всё это работает.

Как работают алгоритмы поисковых систем: всё, что вам нужно знать

автор: Dave Davies

Часто я обращаю свое внимание на конкретные стратегии для выполнения определенных функций.

Как написать убедительный текст для ранжирования в голосовом поиске?

Какая структурированная информация приносит легкие победы?

Но важно не только понимать, какие тактики могут сработать для того, чтобы помочь вам подняться в рейтинге. Вам нужно понимать, как это работает.

Понимание структуры, в которой функционирует стратегия, является ключевым моментом для понимания не только того, почему эта стратегия работает, но и как и что она пытается достичь.

Ранее мы обсуждали, как поисковые системы обходят и индексируют информацию.

Эта глава рассмотрит основы того, как работают поисковые алгоритмы.

Что такое алгоритм? Рецепт

Если вы спросите Google, что такое алгоритм, вы обнаружите, что сама поисковая система (и почти все остальные) определяет его как "процесс или набор правил, которым следует при проведении вычислений или других операций по решению задач, особенно с использованием компьютера".

Что такое алгоритм

Алгоритм – не формула

Чтобы понять разницу, почему это важно и что делает каждый, представьте на мгновение блюдо, которое я могу поставить на ужин сегодня.

Давайте возьмем мое любимое:

  • Говяжий ростбиф
  • Хрен
  • Йоркширский пудинг
  • Зеленые бобы
  • Картошка пюре
  • Соус для мяса

(Верно, мы, канадцы, едим не только путин и кленовый сироп, хотя оба отличные, но, возможно, не вместе.)

Говяжий ростбиф должен быть приправлен и приготовлен идеально. Приправа в сочетании с ростбифом была бы примером формулы – сколько каждого ингредиента необходимо для производства продукта.

Вторая формула использовалась бы для определения времени и температуры, при которых следует готовить ростбиф, учитывая его вес. То же самое произошло бы для каждого пункта в списке.

На очень базовом уровне у нас было бы 12 формул (6 позиций x 2 – одна для измерений и другая для времени и продолжительности приготовления на основе объема), составляющих алгоритм, с целью создания одного из любимых блюд Дэйва.

Мы даже не включаем различные формулы и алгоритмы, необходимые для производства самих ингредиентов, таких как выращивание коровы или картошки.

Добавим еще одну формулу – формулу для учета количества различных продуктов, которые я хотел бы видеть на своем тарелке.

Так что у нас теперь есть алгоритм для выполнения очень важной задачи. Фантастически! Теперь мы просто должны настроить этот алгоритм, чтобы весь мой семейный состав тоже наслаждался своим ужином.

Нам нужно учесть, что каждый человек различен и захочет разных количеств каждого ингредиента и может захотеть разных приправ.

Итак, мы добавляем формулу для каждого человека. Вот так.

обеденное время

Алгоритм алгоритмов

Что общего у поискового алгоритма и обеденного стола?

Гораздо больше, чем вы думаете.

Давайте рассмотрим лишь несколько основных характеристик веб-сайта для сравнения.

("Несколько" означает далеко не все. Ну, совсем далеко.)

  • URL-адреса
  • Внешние ссылки
  • Контент
  • Изображения
  • Внутренние ссылки
  • Скорость

Как мы видели в нашем обеденном алгоритме, каждая из этих областей дополнительно делится с использованием различных формул и, фактически, различных подалгоритмов.

алгоритмы

Также важно помнить, что, несмотря на множество алгоритмов и бесчисленные формулы, все они подчинены одному алгоритму.

Его задача – определить, как эти другие алгоритмы взвешиваются, чтобы произвести окончательные результаты, которые мы видим на SERP.

Таким образом, абсолютно легитимно признавать, что существует некоторый вид верховного алгоритма – один алгоритм, управляющий ими всеми, так сказать. Но всегда следует признавать, что существует бесчисленное множество других алгоритмов, и обычно именно они приходят нам в голову, когда мы размышляем о том, как они влияют на результаты поиска.

Теперь вернемся к нашей аналогии.

У нас есть множество различных характеристик сайта, как и у нас есть множество элементов пищи, чтобы оказаться на нашем обеденном столе.

Чтобы получить желаемый результат, нам нужно иметь множество формул и подалгоритмов для создания каждого элемента на тарелке и основной алгоритм для определения количества и расположения каждого элемента.

Звучит знакомо?

Когда мы говорим о "алгоритме Google", мы фактически обращаемся к массивной коллекции алгоритмов и формул, каждый из которых настроен на выполнение определенной функции и собирается вместе ведущим или, осмелюсь сказать, "ядерным" алгоритмом для размещения результатов.

Так что у нас есть:

  • Алгоритмы Panda для помощи Google в фильтрации, наказании и поощрении контента на основе конкретных характеристик. Этот алгоритм вероятно включает множество других алгоритмов.
  • Алгоритм Penguin для оценки ссылок и борьбы с спамом. Но для его работы определенно требуется информация из других предварительно существующих алгоритмов, ответственных за оценку ссылок, а также, вероятно, новых алгоритмов, задача которых – понимание общих характеристик спама, чтобы большой алгоритм Penguin мог выполнять свою работу.
  • Задачи-специфические алгоритмы.
  • Алгоритмы организации данных. Таким образом, абсолютно легитимно признать, что сверху существует некий алгоритм – алгоритм, который правит ими всех, так сказать – но всегда следует помнить, что существует бесчисленное множество других алгоритмов, и, как правило, это именно те алгоритмы, о которых мы думаем, рассматривая их влияние на результаты поиска.

Современные поисковые системы сегодня используют комбинацию искусственного интеллекта, машинного обучения, анализа ссылок и страниц для ранжирования веб-сайтов.

Алгоритмы организации данных

Почему поисковые алгоритмы используют сущности

Одной из областей, которая в последнее время получает неплохое внимание, но на которую недостаточно обращают внимания, является идея сущностей.

Для контекста сущность определяется Google как:

"Вещь или концепция, которая является единственной, уникальной, четко определенной и различимой."

Каждый член моей семьи также является своей собственной сущностью.

Фактически, семейная единица – это сущность сама по себе. Жаркое и каждый ингредиент, входящий в него, также являются своими собственными сущностями.

Такова мука, которая использовалась для приготовления. Google видит мир как коллекцию сущностей.

Вот почему:

На моем обеденном столе у меня есть четыре индивидуальные сущности, которым было бы присвоено состояние "еда", и множество сущностей, которые употребляются.

Классификация нас всех таким образом имеет много преимуществ перед простым оцениванием наших действий как последовательности слов.

Теперь каждая сущность "еда" может иметь присвоенные ей сущности, находящиеся на их тарелке (говядина, хрен, зеленые бобы, пюре из картошки, йоркширский пудинг, но не соус для них – сущность xyz1234567890).

Таким образом, Google легко может классифицировать и оценивать взаимосвязанность веб-сайтов и мира в целом.

По сути, поисковые системы обязаны не только оценивать один веб-сайт – им приходится ранжировать их всех.

Сущность "Дэвис" считается связанной с "обедом с говядиной", но сущность по соседству (давайте назовем ее сущность "Робинсонс") связана с "жарким".

Теперь, если внешняя сущность по имени "Лакомка" захотела бы определить, где поесть, варианты могут быть ранжированы для Лакомки в соответствии с ее предпочтениями или запросом.

Где (на мой взгляд) реальная ценность сущностей заключается в том, что происходит на следующий день. У нас есть немного остатков.

Обработав сущность "говядина" другой формулой и добавив сущности "хлеб", "сыр" и "лук", у нас есть:

шаурма

Как поисковые алгоритмы используют сущности

Хорошо, может показаться неочевидным, насколько важно понимание этого для понимания поисковых алгоритмов и того, как сущности работают в этом контексте.

Хотя понимание того, как Google видит, о чем в целом веб-сайт, имеет очевидную ценность, вы, возможно, спрашиваете, почему важно, чтобы Google понимал, что мое жаркое и говяжий дип связаны и, фактически, извлечены из одной и той же основной сущности.

Давайте вместо этого рассмотрим, что Google понимает, что веб-страница посвящена говядине. Допустим также, что другая страница ссылается на нее, и эта страница посвящена говяжьему дипу.

В этом сценарии крайне важно, чтобы Google знал, что говядина и говяжий дип извлечены из одной и той же основной сущности.

Они могут присвоить значимость этой ссылке на основе связи этих сущностей.

Прежде чем понятие о сущностях появилось в поиске, движки оценивали значимость на основе близости по словам, плотности и других легко искажаемых и манипулируемых элементов.

Сущности гораздо сложнее манипулировать.

Либо страница посвящена сущности, либо нет.

Путем сканирования веба и создания карт общих способов взаимодействия сущностей поисковые системы могут предсказывать, какие отношения должны иметь наибольший вес.

Итак, как работают поисковые алгоритмы?

Хорошо, мы охватили много материала, и, вероятно, у вас проголодался. Вы хотите какие-то выводы.

Контекст имеет значение

Важно понимать, как функционируют алгоритмы, чтобы придать контекст тому, что вы испытываете / читаете.

Когда вы слышите о обновлении алгоритма, важно знать, что обновляется, вероятно, маленький фрагмент очень большой головоломки.

Знание этого помогает интерпретировать, какие аспекты сайта или мира корректируются в обновлении и как эта коррекция вписывается в общую цель движка.

Сущности играют огромную роль

Кроме того, важно в будущем понимать, что сущности:

Имеют огромное значение в современных поисковых алгоритмах. Имеют свои собственные алгоритмы. Будут играть все более важную роль со временем.

Знание этого поможет вам понимать не только то, какой контент ценен (насколько близки те сущности, о которых вы пишете?), но и какие ссылки, скорее всего, будут оценены более благоприятно.

И это всего лишь несколько преимуществ.

Все зависит от намерений пользователя

Поисковые алгоритмы работают как большая коллекция других алгоритмов и формул, каждый со своей целью и задачей, чтобы предоставить результаты, которые удовлетворят пользователя.

Фактически существуют алгоритмы, предназначенные исключительно для мониторинга этого аспекта результатов и внесения корректировок, если страницы ранжируются как неудовлетворяющие пользовательских намерений на основе взаимодействия пользователей с ними.

В этом также включены алгоритмы, разработанные специально для понимания сущностей и того, как они связаны друг с другом, чтобы предоставлять актуальность и контекст другим алгоритмам.