автор: Jes Scholz
Страница пагинации – это хитрый изменчивый элемент. Его используют в различных контекстах, от отображения элементов на страницах категорий до архивов статей, слайд-шоу галерей и форумных тем.
Для специалистов по SEO вопрос не в том, если вам придется иметь дело с пагинацией, а в том, когда.
В определенный момент роста веб-сайтам необходимо разделить контент на несколько составных страниц для юзабилити (UX).
Наша задача – помочь поисковым системам сканировать и понимать взаимосвязь между этими URL-адресами, чтобы они индексировали самую релевантную страницу.
Со временем лучшие практики SEO для обработки пагинации эволюционировали. На протяжении всего пути многие мифы выдавали себя за факты. Но больше нет.
Эта глава:
- Развенчает мифы о том, как пагинация вредит SEO.
- Предложит оптимальный способ управления пагинацией.
- Рассмотрит неправильно понятые или несоответствующие методы обработки пагинации.
- Исследует, как отслеживать влияние пагинации на KPI.
Как пагинация может повредить SEO
Вы, наверное, слышали, что пагинация вредна для SEO. Однако в большинстве случаев это происходит из-за неправильной обработки пагинации, а не из-за самой пагинации.
Давайте рассмотрим предполагаемые недостатки пагинации и способы устранения SEO-проблем, которые она может вызвать.
Пагинация вызывает дублирование контента
В некоторых случаях пагинация может привести к дублированию контента, например, если у вас есть как «Смотреть все» страницу, так и пронумерованные страницы без правильного rel=canonical или если вы создали страницу=1 в дополнение к вашей корневой странице.
Однако при правильной реализации SEO-ориентированной пагинации дублирования контента не будет. Даже если ваши теги H1 и meta одинаковы, фактический контент страниц отличается.
Джон Мюллер подтверждает, что дублирование тегов title и description для пронумерованных страниц не является проблемой, если они использовались случайно на совершенно разных страницах. Это нормально и ожидается для paginated series.
Пагинация создает тонкий контент
Правильно, если вы разделили статью или фотогалерею на несколько страниц (чтобы увеличить количество показов страниц и повысить доход от рекламы), оставив слишком мало контента на каждой странице.
Неправильно, если вы ставите желания пользователя легко потреблять ваш контент выше доходов от баннерной рекламы или искусственно раздутых просмотров страниц. Поместите на каждую страницу удобное количество контента.
Пагинация снижает силу сигналов ранжирования
Верно. Пагинация приводит к тому, что внутренняя ссылка на авторитет и другие сигналы ранжирования, такие как обратные ссылки и социальные акции, распределяются по нескольким страницам.
Однако этот эффект можно минимизировать, если использовать пагинацию только в тех случаях, когда одностраничный подход к контенту может привести к плохому пользовательскому опыту (например, на страницах категорий электронной коммерции). А на таких страницах добавляйте как можно больше элементов, не замедляя страницу до заметного уровня, чтобы сократить количество пронумерованных страниц.
Пагинация тратит бюджет сканирования
Верно, если вы разрешаете Google сканировать пронумерованные страницы. И есть некоторые случаи, когда вы хотите использовать этот бюджет.
Например, для Googlebot путешествовать по пронумерованным URL-адресам, чтобы добраться до более глубоких страниц контента.
Часто неверно, когда вы устанавливаете параметр обработки параметров пагинации в Google Search Console в значение «Не сканировать» или устанавливаете запрет в robots.txt, в случае, если вы хотите сохранить свой бюджет сканирования для более важных страниц.
Управление пагинацией в соответствии с лучшими SEO-практиками
Использование индексируемых ссылок якоря
Чтобы поисковые системы могли эффективно сканировать пронумерованные страницы, на сайте должны быть ссылки якоря с атрибутами href, ведущие к этим URL-адресам пагинации.
Убедитесь, что ваш сайт использует <a href="your-paginated-url-here"> для внутренней пересылки на пронумерованные страницы. Не загружайте пронумерованные ссылки якоря или атрибут href через JavaScript.
Кроме того, вы должны указать отношение между URL-адресами компонентов в серии пагинации с помощью атрибутов rel="next" и rel="prev".
Да, даже после печально известного твита Google о том, что они больше не используют эти атрибуты ссылок.
Однако вскоре после этого Илья Григорик, инженер по поиску в Google, дал разъяснение по этому вопросу. Он сказал, что хотя Google больше не использует эти атрибуты ссылок для определения релевантности страниц, они все еще могут быть полезны для других целей, таких как навигация для пользователей и помощь поисковым системам в понимании структуры сайта.
Илья Григорик также сказал, что использование атрибутов rel="next" и rel="prev" не повредит рейтингу вашего сайта в Google. Поэтому, если вы хотите использовать эти атрибуты для улучшения навигации и взаимодействия с пользователем, вы можете это сделать без каких-либо опасений.
Google не единственный поисковый движок в городе. Вот как Bing относится к этому вопросу.
«Мы используем rel prev/next (как и большую часть разметки) в качестве подсказок для обнаружения страниц и понимания структуры сайта. На данный момент мы не объединяем страницы в индексе на основе этих ссылок, и мы не используем prev/next в модели ранжирования.»
— Frédéric Dubut (@CoperniX) 21 марта 2019 года
Дополните rel="next"/ "prev" ссылкой на себя rel="canonical". Таким образом, /category?page=4 должен ссылаться на /category?page=4.
Это правильно, так как пагинация изменяет содержимое страницы, и поэтому это основная копия этой страницы.
Если URL-адрес имеет дополнительные параметры, включите их в ссылки rel="prev" / "next", но не включайте их в rel="canonical".
Например:
<link rel="next" href="https://www.example.com/category?page=2&order=newest" />
<link rel="canonical" href="https://www.example.com/category?page=2" />
Делайте это, чтобы указать четкую взаимосвязь между страницами и предотвратить потенциальный дублированный контент.
Общие ошибки, которых следует избегать:
- Размещение атрибутов ссылки в контенте <body>. Они поддерживаются поисковыми системами только в разделе <head> вашего HTML-кода.
- Добавление атрибута rel="prev" к первой странице (также известной как корневая страница) в серии или атрибута rel="next" к последней. Для всех других страниц в цепочке должны присутствовать оба атрибута ссылки.
- Будьте осторожны с каноническим URL-адресом вашей корневой страницы. Скорее всего, на странице ?page=2 атрибут rel=prev должен ссылаться на каноническую страницу, а не на ?page=1.
Код раздела <head> четырехстраничной серии будет выглядеть примерно так:
Первая страница:
<link rel="next" href="https://www.example.com/category?page=2″>
<link rel=”canonical” href="https://www.example.com/category">
Вторая страница:
<link rel="prev" href="https://www.example.com/category">
<link rel="next" href="https://www.example.com/category?page=3″>
<link rel=”canonical” href="https://www.example.com/category?page=2">
Третья страница:
<link rel="prev" href="https://www.example.com/category?page=2″>
<link rel="next" href="https://www.example.com/category?page=4″>
<link rel=”canonical” href="https://www.example.com/category?page=3">
Четвертая страница (последняя в серии пагинации):
<link rel="prev" href="https://www.example.com/category?page=3">
<link rel=”canonical” href="https://www.example.com/category?page=4">
Изменение элементов страниц с пагинацией
John Mueller прокомментировал: «Мы не относимся к пагинации по-другому. Мы относимся к ним как к обычным страницам».
Смысл этого в том, что Google не рассматривает страницы с пагинацией как серию страниц, объединенных в один фрагмент контента, как они ранее советовали. Каждая пронумерованная страница может конкурировать с корневой страницей за ранжирование.
Чтобы побудить Google вернуть корневую страницу в SERP и предотвратить предупреждения о «дублированных мета-описаниях» или «дублированных тегах заголовка» в Google Search Console, внесите в свой код простое изменение.
Если корневая страница имеет формулу:
Эти заголовки и мета-описания страниц с пагинацией намеренно оптимизированы ниже оптимального уровня, чтобы отговорить Google от отображения этих результатов, а не корневой страницы.
Если даже с такими модификациями пронумерованные страницы ранжируются в SERP, попробуйте другие традиционные методы оптимизации на странице, такие как:
- Деоптимизация тегов H1 пронумерованных страниц.
- Добавление полезного текста на страницу, но не на пронумерованные страницы.
- Добавление изображения категории с оптимизированным именем файла и alt-тегом на корневую страницу, но не на пронумерованные страницы.
Не включайте страницы с пагинацией в XML-карты сайта.
Хотя страницы с пагинацией технически индексируются, они не являются приоритетом SEO для расходования бюджета сканирования.
Поэтому они не должны находиться в вашей XML-карте сайта.
Обработка параметров пагинации в Google Search Console
Если у вас есть выбор, используйте пагинацию с помощью параметра вместо статического URL-адреса. Например:
example.com/category?page=2
вместо
example.com/category/page-2
Хотя нет преимуществ использования одного метода над другим для целей ранжирования или индексации, исследования показали, что Googlebot, похоже, может распознавать шаблоны URL-адресов на основе динамических URL-адресов. Таким образом, увеличивается вероятность быстрой обнаружения страниц.
С другой стороны, это может потенциально привести к ловушкам для индексации, если сайт отображает пустые страницы для догадок, которые не являются частью текущей серии страниц.
Например, если серия содержит четыре страницы, URL-адрес будет выглядеть так: www.example.com/категория?страница=4.
Если Google предположит, что www.example.com/категория?страница=7 является живой, но пустой страницей, и загрузит ее, бот потратит бюджет на краулинг и потенциально заблудится в бесконечном количестве страниц.
Убедитесь, что для любых пронумерованных страниц, которые не являются частью текущей серии, отправляется код состояния HTTP 404.
Еще одно преимущество подхода с параметрами заключается в возможности настройки параметра в Google Search Console на "Paginates" и в любое время изменения сигнала Google на "Каждый URL" или "Ни один URL", в зависимости от того, как вы хотите использовать свой бюджет на краулинг. Никакой разработчик не нужен!
Никогда не отображайте содержимое пронумерованных страниц в идентификаторах фрагментов (#), поскольку они не индексируются и не подлежат краулингу, и, таким образом, не являются дружественными к поисковым системам.
Неправильные, устаревшие или просто ошибочные решения SEO для разделенного контента
Ничего не делайте
Google считает, что Googlebot достаточно умен, чтобы найти следующую страницу по ссылкам, поэтому ему не нужен никакой явный сигнал.
Сообщение для SEO-специалистов, по сути, заключается в том, что управление разбивкой на страницы сводится к простому ничего не деланию.
Хотя в этом заявлении есть доля истины, бездействие может поставить под угрозу вашу SEO.
Многие сайты заметили, что Google выбирает отсортированную страницу для ранжирования вместо корневой страницы по поисковому запросу.
Всегда есть ценность в предоставлении ясных указаний поисковым роботам о том, как вы хотите, чтобы они индексировали и отображали ваш контент.
Страница "Посмотреть все"
Страница "Посмотреть все" была задумана как содержащая весь контент каждой отдельной страницы на одном URL-адресе.
Со всеми пронумерованными страницами, имеющими атрибут rel = "canonical" на странице "Посмотреть все", чтобы объединить сигналы ранжирования.
Аргумент здесь заключается в том, что поисковые системы предпочитают отображать всю статью или список элементов категории на одной странице, если она быстро загружается и легко навигируется, при условии, что она соответствует их критериям.
Предполагается, что если у вашей серии с разбивкой на страницы есть альтернативная версия "Посмотреть все", которая обеспечивает лучшее взаимодействие пользователя, поисковые системы отдадут предпочтение этой странице перед соответствующей страницей сегмента в цепочке разбивки на страницы при включении ее в результаты поиска.
Это поднимает вопрос: зачем вам вообще нужны пронумерованные страницы?
Если вы можете предоставить свой контент на одном URL-адресе, обеспечивая хорошее взаимодействие пользователя, нет необходимости разбивать его на страницы или иметь версию "Посмотреть все".
Если вы не можете этого сделать, например, страница категории с тысячами продуктов была бы абсурдно большой и загружалась бы слишком долго. В этом случае лучше использовать разбивку на страницы. Версия "Посмотреть все" не является лучшим вариантом, поскольку она не обеспечит хорошего взаимодействия пользователя.
Использование как rel = "next" / "prev", так и версии "Посмотреть все" не дает четкого сигнала поисковым системам и может привести к путанице у поисковых роботов.
Не делайте этого.
Используйте канонический URL-адрес первой страницы
Ошибка, которую часто допускают, заключается в том, что rel = "canonical" от всех отсортированных результатов указывается на корневую страницу серии.
Некоторые недостаточно осведомленные специалисты по SEO предлагают это как способ консолидации авторитета на наборе страниц на корневую страницу, но это неправильно информировано.
Неправильная каноникализация на корневую страницу рискует ввести поисковые системы в заблуждение, заставив их думать, что у вас есть только одна страница результатов.
Googlebot затем не будет индексировать страницы, которые находятся дальше по цепочке, и не будет признавать сигналы, связанные с контентом, ссылающимся на эти страницы.
Вы не хотите, чтобы ваши подробные страницы контента исключались из индекса из-за неправильной обработки разбивки на страницы.
Каждая страница в серии с разбивкой на страницы должна иметь собственный канонический URL-адрес, если вы не используете страницу "Посмотреть все".
Используйте rel=canonical неправильно, и, вероятно, Googlebot просто проигнорирует ваш сигнал.
Пагинация с тегом Noindex
Классическим методом решения проблем с разбивкой на страницы является использование тега noindex для роботов, чтобы предотвратить индексацию отсортированного контента поисковыми системами.
Полная зависимость от тега noindex для обработки разбивки на страницы приведет к тому, что любые сигналы ранжирования от отдельных страниц будут проигнорированы.
Однако более серьезной проблемой с этим методом является то, что долгосрочный noindex на странице в конечном итоге приведет к тому, что Google перестанет следовать ссылкам на этой странице.
Это может привести к удалению из индекса контента, связанного со страницами с разбивкой на страницы.
Разделение на страницы и бесконечный скрол или нажатие "Показать больше"
Существуют новые варианты обработки пагинации:
- Непрерывная прокрутка, где контент предварительно загружается и добавляется непосредственно на текущую страницу пользователя по мере его прокрутки вниз.
- Подгрузка контента после нажатия кнопки «Показать больше».
Эти подходы ценятся пользователями, но не Googlebot.
Googlebot не имитирует поведение, такое как прокрутка до конца страницы или нажатие кнопки «Загрузить больше». Это означает, что без помощи поисковые системы не могут эффективно индексировать весь ваш контент.
Чтобы быть SEO-дружественным, преобразуйте вашу страницу со непрерывной прокруткой или загрузкой большего количества в эквивалентную серию, основанную на индексируемых ссылках с атрибутами href, которая доступна даже при отключенном JavaScript.
По мере прокрутки или щелчка пользователем используйте JavaScript, чтобы адаптировать URL-адрес в адресной строке к составной пронумерованной странице.
Кроме того, реализуйте pushState для любого действия пользователя, похожего на щелчок или активное перелистывание страницы. Вы можете проверить эту функциональность в демо, созданном Джоном Мюлером. По сути, вы все еще реализуете рекомендованную выше SEO-оптимизацию, просто добавляя на нее дополнительную функциональность для удобства пользователя.
Предотвращение или блокировка индексации пагинации
Некоторые специалисты по SEO рекомендуют вообще избегать проблемы обработки пагинации, просто запретив Google сканировать URL-адреса пагинации.
В таком случае вам понадобится хорошо оптимизированный XML-sitemap, чтобы страницы, связанные с помощью пагинации, имели шанс быть проиндексированы.
Существует три способа заблокировать сканирование:
- Небрежный способ: добавить nofollow ко всем ссылкам, ведущим на страницы пагинации.
- Более чистый способ: использовать файл robots.txt для запрета доступа к пагинации.
- Способ без необходимости в разработчике: установить значение параметра страницы пагинации в «Paginates» и указать Google для индексации «No URLs» в Google Search Console.
Используя один из этих методов для предотвращения индексации URL-адресов пагинации поисковыми системами вы:
- Прекратите распознавание поисковыми системами рейтинговых сигналов страниц пагинации.
- Предотвратите передачу внутренней ссылочной массы с страниц пагинации на целевые страницы контента.
- Помешаете Google найти ваши целевые страницы контента.
Очевидный плюс в том, что вы экономите на бюджете сканирования.
Здесь нет однозначно правильного или неправильного ответа. Вам нужно решить, что является приоритетом для вашего сайта.
Лично я, если бы хотел сосредоточиться на бюджете сканирования, сделал бы это, используя обработку пагинации в Google Search Console, так как она имеет максимальную гибкость для изменения своего решения.
Отслеживание влияния KPI на пагинацию
Теперь вы знаете, что делать, как отслеживать эффект оптимизации обработки пагинации?
Во-первых, соберите эталонные данные, чтобы понять, как ваша текущая обработка пагинации влияет на SEO.
Источники KPI могут включать:
- Журналы серверных файлов для определения количества сканирований пронумерованных страниц.
- Оператор поиска «site:» (например, site:example.com inurl:page) для понимания количества пронумерованных страниц, проиндексированных Google.
- Отчет «Аналитика поиска» Google Search Console, фильтрованный по страницам, содержащим пагинацию, для понимания количества показов.
- Отчет о посадочных страницах Google Analytics, фильтрованный по пронумерованным URL-адресам, для понимания поведения на сайте.
Если вы обнаружите проблему с индексацией поисковыми системами пагинации вашего сайта, чтобы добраться до вашего контента, вы можете изменить ссылки пагинации.
Как только вы запустите свою обработку пагинации в соответствии с наилучшими практиками, повторно посетите эти источники данных, чтобы измерить успех ваших усилий.