Как поисковые системы визуализируют страницы

Как поисковые системы визуализируют страницы в Интернете? Почему и когда они это делают? На эти вопросы и многие другие даны ответы в этом посте.

Как поисковые системы визуализируют страницы

Dave Davies

Существует интересный поворот в том, как мы мыслим об индексации – и это рендеринг.

Когда мы думаем о ранжировании страниц, обычно мы думаем об индексации.

Другими словами, обычно мы задумываемся о моменте, когда поисковая система:

  • Обнаружила страницу через карты сайта или краулинг и затем перешла на страницу для индексации.
  • Собрала весь контент через исходный код страницы.
  • Начала ранжировать страницу для запросов.

Исторически это был самый важный этап в процессе, так как это является триггером для ранжирования.

Однако индексация не является заключительным этапом процесса обнаружения.

Я бы предположил, что ее вес будет уменьшаться со временем, в то время как заключительный этап – рендеринг – вероятно, будет увеличиваться, и, по-видимому, полностью заменит проиндексированную версию.

Индексация против рендеринга: В чем разница?

В основном разницу между индексацией и рендерингом можно проиллюстрировать с помощью этих двух изображений:

Это индексация:

Исходный код страницыИсходный код страницы

Это рендеринг:

Отрендеренная страницаОтрендеренная страница

Это в основном один и тот же контент, просматриваемый во время индексации (HTML) и рендеринга (Chrome).

Почему это важно?

Рендеринг важнее, чем вы могли бы подумать.

Тот факт, что поисковые системы отображают страницы до недавнего внедрения JavaScript в веб-сайты, является хорошим подтверждением.

В основном важность заключается в том, что рендеринг предоставляет правдивую информацию.

С помощью кода поисковая система может понять, о чем страница и примерно что происходит.

С рендерингом они могут понять пользовательский опыт и гораздо больше о том, какой контент должен иметь приоритет.

С рендерингом они могут отвечать на вопросы, такие как:

  • Содержимое скрыто за кликом?
  • Заполняет ли реклама всю страницу?
  • Отображается ли содержимое, которое появляется внизу кода, на самом деле вверху или в навигации?
  • Загружается ли страница медленно?

На все эти вопросы, и многие другие, дают ответы в процессе рендеринга.

Эти ответы важны для правильного понимания страницы и того, как ее следует ранжировать.

Когда происходит рендеринг?

В 2018 году рендеринг занимал несколько недель.

Неудивительно, что сейчас это занимает гораздо меньше времени. Фактически,несколько секунд. Среднее время – 5 секунд, и в течение нескольких минут 90% проиндексированных страниц проходят через очередь рендеринга.

Следует отметить, что это очередь, а не обязательно рендеринг.

Bing работает по-другому.

Когда я спросил у их менеджера проекта по веб-рейтингу и качеству, Фредерика Дюбю, он ответил:

Тот же ответ, что и раньше, от нескольких минут до вечности, но я могу подтвердить, что мы стараемся отдавать приоритет рендерингу для URL, отправленных через API.

— Фредерик Дюбю (@CoperniX) 3 августа 2020 г.

"Раньше", на которое он ссылается – это его же твит из сентября прошлого года:

Я бы сказал то же самое – иногда это дни, могут быть недели, и в экстремальных случаях это также может быть никогда. В конечном итоге это компромисс между стоимостью рендеринга страницы и ценностью, которую мы видим в ее рендеринге.

— Фредерик Дюбю (@CoperniX) 3 сентября 2019 г.

Вероятно, и они ускорили процесс, хотя у меня нет нового подтверждения по времени.

Таким образом, краткий ответ на вопрос о том, когда происходит рендеринг, таков: "после индексации". Временная линия переменчива, но коротка, что в сущности означает, что поисковые системы будут понимать контент и контекст страницы до того, как получат полное представление о том, как следует расставлять приоритеты, но в большинстве случаев задержка несущественна.

А что насчет предварительного рендеринга?

Предварительный рендеринг – это использование библиотеки, такой как Puppeteer (с которой я больше всего знаком, поэтому используется в качестве примера), для создания кешированных HTML-копий страниц с использованием JavaScript, и предоставление этих кешей Google.

В основном это форма маскировки, при которой создается копия страницы так, как она появится в DOM, и предоставляется поисковым системам. Делается это, чтобы гарантировать, что поисковые системы видят тот же контент, который видит пользователь.

С учетом резкого снижения времени между индексацией и рендерингом, пришел в голову очевидный вопрос – нужно ли мне все еще предварительно рендерить мой JavaScript-сайт?

Ответ был:

Вам обычно это уже не нужно.

— Джон (@JohnMu) 2 августа 2020 г.

Что отличная новость для тех, кто использует Puppeteer или другую библиотеку предварительного рендеринга.

Бывали случаи, когда система предварительного рендеринга выходила из строя без уведомления об ошибке, вызывая множество проблем (читай: страницы вылетали из индекса).

Если не нужно предварительно рендерить, не нужно беспокоиться о таких вещах.

Так что если вы думаете об отключении своей системы предварительного рендеринга, я рекомендую остановить систему для работы на нескольких страницах и посмотреть, что произойдет, когда они будут кешированы заново.

Видит ли Google контент так, как он рендерится?

Если да, то, возможно, вы сможете полностью прекратить предварительный рендеринг.

Почему рендеринг?

Возможно, вы задаете себе вопрос, зачем вообще заниматься рендерингом? Если сайт не использует JavaScript или каким-либо образом не зависит от рендеринга для "видения" контента, зачем Google должен рендерить страницы?

Рендеринг дает поисковым системам возможность определять приоритет контента на основе того, как человек, вероятно, взаимодействовал бы со страницей.

Он сообщает поисковой системе, как контент расположен в браузере и насколько видимы различные элементы, чтобы при оценке или установлении приоритетов контента или оценке удобства использования они работали с тем же продуктом, что и посетитель.

Будущее — в рендеринге

Изменение времени задержки и заявление о предварительном рендеринге от Мюллера ставят точку в этом вопросе.

Индексация, как мы ее представляем, скорее всего, станет функционально неважным шагом с точки зрения SEO, а рендеринг займет передний план в отношении обнаружения веб-контента.