Разбираемся с индексным вздутием (Index Bloat) — критической проблемой SEO

Иван Захаров подробно разбирает проблему индексного вздутия (Index Bloat) для средних и крупных сайтов. Узнайте, как найти страницы, которые занимают квоту в индексе, но не приносят трафика, и какие практические шаги предпринять для их консолидации или удаления.
Разбираемся с индексным вздутием (Index Bloat)

Привет, друзья. Иван Захаров на связи. Сегодня я хочу поговорить об индексном вздутии.

Это довольно распространенная проблема, которая затрагивает в основном крупные, а иногда и средние сайты. Я бы сказал, что если вы работаете над сайтом среднего или крупного размера, вам обязательно нужно с этим разобраться как минимум один раз. Это то, с чем я и многие другие SEO-специалисты видели очень хорошие результаты как в долгосрочной перспективе, так и совсем недавно. И, несмотря на это, в индустрии об этой проблеме говорят относительно мало, и она плохо систематизирована.

Что такое индексное вздутие?

Давайте я объясню на диаграмме. Представьте себе внешний квадрат — это все URL на вашем сайте, которые вообще могут существовать, включая параметры, которые никто не пробовал.

Следующий внутренний набор — это URL, которые обнаружил Google. Они могли быть не просканированы или не проиндексированы, но Google знает об их существовании. Если разница между этим синим квадратом и красным большая, это, вероятно, указывает на проблему с краулинговым бюджетом. Но сегодня не об этом.

Далее — проиндексированные URL. Это еще меньший набор. URL может быть обнаружен, но не проиндексирован по разным причинам.

И, наконец, самый важный момент — это разрыв между проиндексированными страницами (желтый квадрат) и страницами с хоть каким-то значимым трафиком (зеленый квадрат). Если этот разрыв большой, это и есть индексное вздутие, о котором мы сегодня говорим.

Чем индексное вздутие НЕ является

Прежде чем двигаться дальше, давайте проясним, чем индексное вздутие не является.

  • Это не краулинговый бюджет. Проблема краулингового бюджета — когда у вас огромное количество URL, которые Google вообще не обходит.
  • Это не каннибализация. Каннибализация — это когда страницы конкурируют друг с другом по одним и тем же запросам. Такая проблема может быть и на сайте из трех страниц. Я же говорю о проблеме большего масштаба.

Мы говорим именно о разрыве между количеством проиндексированных страниц и количеством страниц, которые получают хоть какой-то значимый трафик.

Почему индексное вздутие — это проблема?

Зачем нам волноваться? Ну и что, что у меня много проиндексированных страниц без трафика? В чем проблема?

Во-первых, мы предполагаем, что большое количество страниц без трафика посылает негативный качественный сигнал, который может отразиться на оценке всего сайта или его разделов. Если у вас много пустых или бесполезных страниц, на которые люди заходят и сразу возвращаются в поиск, это может вредить всему сайту.

Во-вторых, это может быть симптомом других технических SEO-проблем. Если думать по-старому, в терминах PageRank, то его значение «растворяется» на всех этих страницах, которые можно было бы объединить в те, что действительно могут приносить трафик.

Распространенные причины индексного вздутия

Откуда же берутся эти URL, которые проиндексированы, но не получают трафика? Есть две основные группы причин, которые я часто вижу как консультант.

1. Блоги и пользовательский контент (UGC)

Часто в блогах компании публикуют все подряд: о приеме на работу нового сотрудника, открытии нового филиала, победе в конкурсе, корпоративе. Или же размещают пресс-релизы. В итоге образуется огромное количество проиндексированных страниц, которые изначально не были предназначены для поискового трафика.

То же самое с форумами. Пользователи создают темы о чем угодно, они индексируются, и это может быть источником как трафика, так и множества малоценных страниц на похожие темы.

2. Списки и товары

Представьте сайты недвижимости, сайты по продаже б/у автомобилей, доски объявлений о вакансиях или маркетплейсы. На них постоянно создаются и удаляются страницы-листинги. Большинство из них очень специфичны, имеют низкую ценность и никогда не получают трафика.

На крупных интернет-магазинах тоже много отдельных товарных страниц, которые из-за своей узкой направленности или схожести с другими страницами трафик не получают.

Как уменьшить индексное вздутие

Что же делать, если вы обнаружили эту проблему? Вот процесс, который я сам применял в прошлом и который давал хорошие результаты.

  1. Выявите URL с почти нулевым трафиком

    Первым делом найдите страницы, которые получают практически ноль трафика. Я часто пользуюсь таким правилом: страницы, которые получают в среднем меньше 1 клика в месяц. На сайтах с серьезной проблемой вы найдете множество страниц с абсолютно нулевым трафиком.

    Важно: смотрите не только на органический трафик, чтобы случайно не удалить что-то важное для других каналов, например, email-рассылок или социальных сетей.

  2. Улучшите страницы, которые того заслуживают

    Проанализируйте найденные страницы. Возможно, некоторые из них раньше хорошо ранжировались, но устарели. Или на них есть качественный контент, но мешает какая-то техническая ошибка. Может, у страницы много внешних ссылок. Не стоит бездумно удалять весь этот массив. Найдите те страницы, с которыми можно и нужно поработать.

  3. Объедините или удалите страницы, которые улучшить не удалось

    С оставшимися страницами (которые не получают трафика и не представляют ценности) можно поступить несколькими способами, скорее всего, комбинируя их.

    • Объединение (консолидация) и редирект. Если у вас есть очень специфические страницы (например, товара, которого нет в наличии), а также категория, отвечающая на тот же запрос, рассмотрите использование канонической ссылки (canonical) или 301-го редиректа. Редирект — если страница полностью устарела и не нужна. Каноническая — если страница должна оставаться доступной.
    • Создание новой, качественной страницы. Вы можете взять лучший контент с нескольких старых малополезных страниц и создать одну новую, сильную страницу, которая будет хорошо ранжироваться по данной теме.
    • Удаление (404) или запрет индексации (noindex). Для страниц, которые абсолютно бесполезны и никогда не несли ценности, можно использовать 404-ю ошибку (если доступ к странице больше не нужен) или тег noindex (если страница должна оставаться доступной для пользователей из других каналов). Это крайняя мера. Старайтесь избегать ее, когда возможны редиректы или объединение, так как в случае с 404 и noindex вы не передаете вес страницы.

Такой подход я и многие мои коллеги применяли с хорошими результатами, особенно после обновления Helpful Content и ранее, во времена Panda.

Попробуйте и вы. Спасибо за внимание!

Комментарии

Пока нет комментариев

Будьте первым, кто оставит комментарий!

Войдите, чтобы оставить комментарий

Оставлять комментарии могут только зарегистрированные пользователи