автор: Райан Джонс
Если вы пропустили последний выпуск подкаста Search Off the Record, Гэри Илльес из Google вызвал некоторые споры комментарием, что структура HTML не имеет большого значения для SEO. Позже он пояснил в Linkedin, что выражение «не имеет большого значения» не означает «вообще не имеет значения». В попытке прояснить несколько общих моментов и заблуждений, которые постоянно возникают, написан этот пост.
Итак, имеет ли структура HTML значение для SEO?
Ответ: Это зависит.
Когда Илльес говорил о структуре HTML, он, вероятно, имел в виду некоторые вещи, которыми любят заниматься оптимизаторы поисковой оптимизации:
- Количество тегов H1 на странице.
- Порядок тегов H.
- Окружено ли что-то тегом <b>или <strong>тегом.
- Использование таблиц вместо CSS для стилизации.
- Насколько высоко в исходном коде отображается текст.
Это все вещи, которые SEO-специалисты обсуждали на протяжении многих лет. Некоторые из них имели значение в старые времена SEO, но сейчас все работает не так. Прежде чем углубляться в то, когда HTML имеет значение для SEO, а когда нет, заметим:
Структура HTML на 100% имеет значение для доступности.
Однако доступность не является прямым фактором ранжирования, поэтому она немного выходит за рамки этой статьи.
Если ваш сайт недоступен, маловероятно, что люди будут ссылаться на него или нажимать на него в будущем, так что это потенциально влияет на ваш рейтинг SEO.
Недавно обновленное руководство Google SEO для начинающих даже конкретно упоминает теги заголовков и доступность по сравнению с SEO:
«Наличие заголовков в семантическом порядке отлично подходит для программ чтения с экрана, но с точки зрения поиска Google не имеет значения, используете ли вы их не по порядку. Интернет в целом не является валидным HTML, поэтому поиск Google редко зависит от семантического значения, скрытого в спецификации HTML.
Также не существует волшебного идеального количества заголовков, которое должно быть на данной странице. Однако, если вы думаете, что это слишком много, то, вероятно, так оно и есть».
А как насчет остальной структуры HTML?
Основной проблемой здесь является наша ментальная модель того, как работают поисковые системы. Для большинства людей эта модель не изменилась с 90-х годов, когда поисковые системы в основном осуществляли лексический поиск. То есть найти документ с наибольшим количеством упоминаний этого термина. Эти поисковые системы имели функции оценки, которые придавали дополнительный вес термину, выделенному жирным шрифтом, и учитывали тег H1 больше, чем тег H2, и т. д.
К счастью, поиск отошел от лексического подхода и приблизился к семантическому подходу.
При семантическом поиске контент преобразуется в векторы, и такие алгоритмы, как BERT, RankBrain и т. д., используются для интерпретации «значения» запроса и контента, а не просто просмотра того, какие слова он содержит. В процессе преобразования контента в векторы большая часть HTML теряется.
Здесь в игру вступают не только векторы, но и рендеринг. Раньше, когда поисковые системы не могли отображать JavaScript и проверять DOM, им приходилось полагаться на подсказки HTML. Но те времена прошли.
Точно так же, как они могут использовать такие алгоритмы, как pass-bert, для определения наиболее релевантного фрагмента на странице, так и сейчас могут использовать различные алгоритмы для определения основного заголовка, даже если его нет в теге <h1>.
Конечно, <h1> выступает хорошей подсказкой, но теперь имеют смысл размер шрифта, размещение, соответствующее содержанию, и само предложение. Мы все видели, как многие оптимизаторы по поисковой оптимизации размечали небольшую часть навигации с помощью H1, несмотря на то, что в центре экрана размещался огромный текст размером в 30 пунктов, обозначенный тегом <span>.
Раньше поисковым системам приходилось с этим бороться, но в наши дни они чаще всего могут правильно идентифицировать этот гигантский тег <span> как «заголовок» страницы.
Это совсем не значит, что вам следует забить на правильные теги H и вложенные элементы. Доступность и читаемость по-прежнему имеют значение, чтобы дать подсказку поисковым системам. Если вы это сделаете, это будет чище, проще, доступнее и в целом лучше. Я просто говорю, что поисковые системы теперь не полагаются на разметку, а просто принимают к сведению.
Еще одно заблуждение — множественные теги H1. Это одна из самых больших неприятностей.
С появлением HTML5 и различных элементов совершенно нормально, а в некоторых случаях просто необходимо, иметь на странице несколько тегов H1. Это не повлияет на ваши усилия по SEO. (Если только вы не набиваете ключевые слова и не помечаете все как H1, что может вызвать срабатывание некоторых спам-флагов.)
Итак, что же делает поисковая система? Проще говоря:
- Они распознают тег заголовка, ключевые заголовки (которые могут быть, а могут не быть обозначены тегами H1, H2 и т. д.) и основной текст.
- Затем они будут выполнять как лексические (например, BM25), так и семантические (например, косинусное сходство) меры, чтобы определить релевантность этих разделов запросу, прежде чем передать их все в алгоритм машинного обучения и ранжирование.
Вывод заключается в том, что их, скорее всего, уже не волнует, H1 это или H2. Важно, что именно алгоритм определил как «заголовок» страницы.
То же самое касается жирного текста, тегов span и div и т. д. Все зависит от того, считает ли алгоритм (например, BERT) его релевантным для запроса.
Итак, какое значение имеет структура HTML?
Структура HTML во многих случаях может улучшить или разрушить вашу стратегию SEO. Например, если вы поместите тег "canonical" внутрь <body> ... </body> вместо <head> ... <head>, его не будет видно.
Аналогично, если вы вставите <div> внутрь <head> ... <head>, версия Chrome от Googlebot предположит, что вы забыли закрыть заголовок и сделает это за вас. При этом переместит некоторые из важных тегов SEO туда, где они будут игнорироваться.
Вы не поверите, как часто я это вижу. Достаточно одного человека, чтобы случайно вставить код не в то место в Диспетчере тегов Google, и весь сайт сломается. Только по этой причине я советую клиентам убедиться, что их SEO-теги расположены выше, чем любые другие теги в <head> ... <head>.
Другие методы кодирования HTML также могут нанести вред SEO.
Например, если вместо использования тега <a> с href-атрибутом на вашем сайте есть событие от javascript <span>with onclick=,
поисковые системы не будут считать это ссылкой, даже если пользователи не заметят разницы.
Когда дело доходит до изображений, поисковым системам требуется <img>тег с src-атрибутом. Вы будете удивлены, узнав, сколько плагинов с отложенной загрузкой игнорируют srcsrc-атрибут в пользу srcset-атрибута, который работает в современных браузерах, но не рассматривается Google как «изображение» для ранжирования изображений. Не думаю, что какой-либо из этих примеров имел в виду Илльес, когда говорил о структуре HTML. Я полагаю, что он ссылался на распространенные аргументы в пользу вложенности заголовков, жирных тегов и т. д.
Резюме
Стоит ли беспокоиться об использовании H1, H2 и т. д.?
Да, всегда, но не для SEO. Размечайте материалы так, чтобы это было доступно и имело смысл для пользователей. Не беспокойтесь о принудительном использовании тега <h1>, оформленного в виде обычного текста.
Должен ли я проверять свой HTML?
Да, но не для SEO-рейтинга. Валидный HTML не является фактором ранжирования, но он поможет предотвратить технические проблемы, влияющие на SEO, и потенциально уменьшит вашу работу по обеспечению доступности. Я большой поклонник валидатора W3C.
Имеет ли структура HTML значение для SEO?
Это зависит. (Извините, не удержался!) Если из-за вашей разметки что-то становится недоступным или невидимым, да, это имеет огромное значение. Если вы надеетесь повысить рейтинг за счет изменения порядка некоторых заголовков или выделения текста жирным шрифтом, скорее всего, этого не случится.
Комментарии