Начальный гид по SEO в мире машинного обучения

время чтения: 11мин.

Когда мы вступаем в новый мир машинного обучения, должны ли мы думать о ссылках и их создании, контенте и техническом SEO как раньше? Читайте ответы в нашем мини-гиде.

автор: Dave Davies

Когда речь идет о машинном обучении в контексте SEO, мы можем столкнуться с ситуацией неопределенности.

SEO-специалисты, логически ориентированные и работающие согласно сигналов поисковых систем и их флуктуаций, беспокоятся гораздо больше маркетологов. Маркетологи полагаются на обслуживание пользователей, изменения в мире алгоритмов их не трогают.

Как чистый технарь, я не понимал, как подход "создайте отличный контент, и они придут сами" вообще может быть осуществимым.

Гуманитарии, придерживающиеся этого подхода в SEO, беспокоятся гораздо меньше.

Тем не менее, это все еще не:

Сделайте горку, и они сами придут с санками

Сделайте горку, и они сами придут с санками

Прежде чем углубимся в дебри машинного обучения, сначала рассмотрим вопрос:

Что такое машинное обучение в контексте SEO?

Мы не будем проводить большой урок по всему, что связано с машинным обучением, и не будем рассматривать какой должна быть наша будущая стратегия SEO. Достаточно знать ответ – машинное обучение добавляет к способностям Google невероятную скорость в областях:

Накопление данных.
Интерпретация.
Реакция.

Как машинное обучение влияет на ссылки и строительство ссылок

Одним из самых простых примеров области, в которой машинное обучение увеличивает возможности Google, являются ссылки. Небольшой пример: машинное обучение играет важную роль в одном из ключевых аспектов оценки ссылок – фильтрации спама.

Google уже использовал машинное обучение в Gmail, достигая успеха на уровне 99,9% и допуская ложноположительные результаты всего лишь в 0,05% случаев. Перенесем эти цифры на оценку ссылок и получим очень успешную модель.

Ранее инженеры Google должны были:

Создавать списки сайтов низкого качества и вручную блокировать потоки ссылочной активности оттуда.
Программировать специфические характеристики плохих ссылок на основе предыдущего опыта.
Настроить функции переоценки в расчетах ссылок и надеяться, что это не приведет к слишком большому количеству ложноположительных результатов.

С машинным обучением открывается новый дивный мир. Первичная отправная точка осталась, это список известных плохих доменов и генерируемые ими отрицательные сигналы. Они стали тренировочными площадками, на которых машинная система может обучиться:

Изучению того, как применять эти сигналы к другим ссылкам.
Разработке собственных сигналов для выявления спама (или, наоборот, качественных ссылок).

Вместо того, чтобы полагаться на жесткий и строгий набор критериев, созданный программистами вручную, машины могут обучаться, наблюдая за меняющимися паттернами. Наблюдение за сайтами с предполагаемыми плохими сигналами (как в исходящих, так и входящих ссылках) будет профилировать машину.

Затем, как только будет установлено, что такое хорошо и что такое плохо, машина начнет реверс-инженерию паттернов для более быстрого их обнаружения в будущем.

К каким сайтам прикрепляются сайты-спамеры?
Какие типы ссылок получают сайты-спамеры?
Существует ли паттерн роста ссылок?
Продают ли страницы платные ссылки, которые склонны ссылаться на другие конкретные сайты?

На основе полученных результатов система усовершенствует метрики, которые она применяет.

Это затрагивает далеко не весь объем того, что машины могут делать самостоятельно. Например, Google легко снижает значение сайтов со спамовыми ссылками, благодаря машинам, переоценивающим сайты с невероятной скоростью и с минимальным количеством ложноположительных результатов. Машины также могут понимать качество и актуальность контента на странице и дополнять это понимание в уравнении как индивидуально, так и массово.

Машина может задавать вопрос: "Должна ли эта ссылка иметь высокий вес для конкретного сайта?" и далее: "Существует ли вероятность, что эта ссылка платная или проблематичная?". В контексте данных от других ссылок, найденных и проанализированных на той же странице и домене, машина может дать ответ самостоятельно.

Выше приведены ограниченные примеры того, как машинное обучение может быть применено к ссылкам. Шаблоны спама обнаруживаются все быстрее, и качественные ссылки получают больше возможностей для вознаграждения.

Это означает увеличенное внимание к качеству, актуальности и легитимности – если, конечно, вы не считаете, что можете создать системы, способные обмануть Google быстрее, чем машина сможет это выяснить.

Как машинное обучение влияет на SEO контента

Машинное обучение и СЕО

Помимо манипуляций со ссылками, упомянутыми выше, существуют другие области серого и черного SEO, которые так же пострадают от машинного обучения.

Давайте глянем на сервис Google-Переводчик. В течение 10 лет сервис использовал в работе фразовый машинный перевод, то есть переводил фразу по словарю, потом сопоставлял получившийся перевод с известными фразами и выдавал результат. Мы помним, как гугл-транслейт справлялся с задачами только в первом приближении. Замысловатые словесные обороты и фразеологизмы не переводились примерно никак.

В сентябре 2016 года Google переключился на систему машинного обучения (система машинного перевода Google Neural) и через 24 часа после внедрения система улучшила качество перевода так же, как если бы понадобилось 10 лет в прежнем режиме. По сути, машинное обучение достигает высокой эффективности в понимании языка в 3.650 раз быстрее, чем человеческое редактирование с помощью программируемого компьютера.

Что это означает для специалистов по SEO?

Святой Грааль цифрового маркетинга приближается. Настанет момент, когда единственной задачей сео-маркетолога будет создание наилучшего контента, а также широкого спектра контента в достаточном объеме и в достаточном количестве форматов, чтобы удовлетворить больше намерений и предпочтений пользователей, чем у конкурентов. И если это удастся, есть очень хороший шанс, что Google тоже это поймет.

Это не значит, что машинное обучение лишено недостатков или что специалистов по SEO повсюду заменят копирайтеры.

Отнюдь. У цифровых маркетологов появится другая роль, без "ключевых слов" и шаманских плясок с сео-бубном. Роль будет заключаться в четком и ясном формулировании того, как пользователь может быть удовлетворен.

Вил Рейнольдс дал одно из лучших предсказаний того, что предстоит. Он предлагает задаться вопросом:

"Что произойдет, если Google начнет показывать только самый лучший ответ?"

Это вопрос, который мы должны задавать сами себе снова и снова. Более интересным делает вопрос тот факт, что понятие "лучшего ответа" является субъективным и меняется от пользователя к пользователю.

Я лично не люблю видеоинструкции по выполнению большинства задач. Просто дайте мне перечень действий с поясняющими картинками, если это необходимо.

Но не все такие!

Кто-то захочет посмотреть видео. Кто-то может предпочесть загрузку PDF-файла, чтобы потом распечатать и почитать в свободное время. Кто-то с удовольствием послушает подкаст.

Кроме того, это будет зависеть от задачи. Например, мой планшет находится в машине вместе со мной. Но когда я меняю масло в гараже, лучше иметь распечатку.

Таким образом, то, что я буду считать "лучшим" в отношении результата, который может предложить Google, зависит от ряда факторов, связанных с личными предпочтениями – с конкретной задачей, которую следует выполнить, со временем и местом, с устройством, с которого задается вопрос, и т. д.

Это нельзя заранее спрограммировать человеком. В прошлом предпринимались неплохие попытки в области персонализации результатов, но они были малоуспешны, вплоть до появления машинного обучения.

Человек не может адаптировать опыт для вас. Люди не могут выделить ресурсы для понимания того, что именно вам нравится в конкретные моменты времени, в зависимости от устройства, с которого вы получаете доступ, или от вашего местоположения.

Машины могут.

Машина может отслеживать все это и учиться со временем не только тому, какие результаты вам нравятся, но и какие типы результатов соответствуют вашим намерениям в конкретное время в конкретном месте, и в конечном итоге предоставлять вам лучший результат из своего текущего индекса.

Короче говоря, теперь нам нужно думать меньше о выполнении глобальных правил и больше о выполнении намерений нашей целевой аудитории.

Кроме того, если мы хотим занимать высокие позиции для более общих запросов, таких как "ноутбуки", а не только "купить ноутбуки Dell" с нашим сайтом электронной коммерции, нам нужно удовлетворить намерения пользователей, которых интересует не только покупка. Нужно создавать контент не только с техническими характеристиками, но и с другими материалами. Возможно, мы также должны предоставить эти данные в различных форматах, чтобы быть лучшим ответом независимо от устройства.

До внедрения машинного обучения нам не приходилось об этом беспокоиться.

Все попытки понять, что такое отказ или время на сайте может означать со стороны Google, были, мягко говоря, элементарными. Теперь, с помощью машинного обучения в понимании контекста языка и того, что могут означать сигналы, созданные пользователями, это не только возможно, но и широко используется машинами.

Как машинное обучение влияет на техническую оптимизацию для поисковых систем (SEO)

При технической оптимизации для поисковых систем есть один человек, за которым стоит следить: Синди Крум (Cindy Krum, @Suzzicks). В разговоре о мобильной индексации она ввела термин, который, на мой взгляд, блестяще описывает будущее технической оптимизации для поисковых систем.

Она назвала "мобильный первым/mobile-first" неправильным термином, предложив использовать правильный термин "переносимый первым/portable-first". Идея, которую она выдвинула, заключалась в том, что контент должен легко отделяться от вашего дизайна и технической структуры (т.е. быть переносимым), чтобы к нему можно было обращаться в любом месте и в любое время.

Она абсолютно права.

Переходя в новый мир машинного обучения, цель заключается в том, чтобы предоставить пользователю информацию, которая удовлетворит его намерения. Наша задача – убедиться, что контент может быть легко понят и извлечен из конструкции, в которой он существует – либо через разметку, XML-ленты, либо через структурирование контента на странице таким образом, чтобы он ясно и легко интерпретировался.

Итак, что же делать теперь?

Что вы должны делать с этой информацией?

Мы говорим о машинном обучении и все возрастающей способности Google понимать мир вокруг нас, а также наши собственные личные потребности и желания. В этом заключается его сила, и это определяет то, что нужно делать дальше. Ваша задача заключается в следующем:

Убедитесь, что ваш контент легко переносим на любое устройство, с которого может быть доступен ваш целевой сегмент пользователей, и что он обращается к этой аудитории.
Если у вас есть несколько аудиторий с разными потребностями, вы должны удостовериться, что ваш контент применим и привлекателен для все, или что есть различный контент для каждой из них, возможно, в разных форматах.
Вам нужно рассматривать ключевые слова скорее как вопрос и намерение, которые они подразумевают, а не как тупой инструмент, чтобы включать на странице и в анкорном тексте.

Машины помогут нам понять, что хотят наши посетители, чтобы мы могли выяснить способы предоставить это.

Почему?

Потому что именно это будет искать машина – удовлетворенного пользователя. У них будут все метрики, необходимые для того, чтобы узнать, кто делает лучшую работу – вы или один из ваших конкурентов!

Обновления алгоритмов Google

Как проводить исследование ключевых слов

Оглавление Полный гид по SEO