Секреты поисковой системы Google: 1200 экспериментов, ИИ-агенты и сущности

Глубокое погружение в невидимые системы, лежащие в основе поиска Google, — раскрытие живых экспериментов, инфраструктуры на основе сущностей, агентов ИИ и многого другого.
Секреты поисковой системы Google: 1200 экспериментов, ИИ-агенты

В этом посте:

  • Что раскрывают около 1200 экспериментов о внутренней работе Google.
  • Сущности повсюду.
  • Граф знаний: центральная нервная система Google.
  • Внутри режима искусственного интеллекта Google: 90 проектов и целая плеяда агентов.
  • Механизм профилирования: Улыбнитесь, вас внедряют!
  • Понимание запросов: раскрыты возможности расширения запросов и оценки в реальном времени.
  • Глубокое погружение в невидимые системы, лежащие в основе поиска Google, — раскрытие живых экспериментов, инфраструктуры на основе сущностей, агентов ИИ и многого другого.

Было проведено масштабное расследование внутренней работы Google. Это привело к крупным открытиям, некоторые из которых мы здесь раскрываем. 

Хотя мы не можем раскрыть все, представленная ниже информация дает более четкое представление о том, как Google генерирует и ранжирует свои результаты.

Что раскрывают около 1200 экспериментов о внутренней работе Google

Мы получили список из почти 1200 экспериментов Google, более 800 из которых были активны по состоянию на июнь 2025 года. 

Этот набор данных подтверждает, что многие компоненты, раскрытые в утечках 2024 года — Mustang, Twiddlers, QRewrite, Tangram, QUS и другие — по-прежнему играют центральную роль в системе. 

В то же время появляется волна новых и интригующих кодовых имен: от «Harmony» и «Thor» до более вызывающих названий, таких как «Whisper», «Moonstone» и «Solar». 

Среди наиболее примечательных — DeepNow, преемник Google Now с его аналогом NowBoost, и SuperGlue, который может заменить Glue — эквивалент NavBoost для универсального поиска.

В отличие от большинства веб-сайтов, которые подвергаются серьезным обновлениям каждые три-пять лет, Google постоянно развивается. 

Не существует никакой «новой версии» с большим размахом — только постоянный поток микроизменений, которые движутся от эксперимента к запуску и полной интеграции. 

Это объясняет многоуровневую природу списка экспериментов: тесты многомесячной давности появляются рядом с совершенно новыми испытаниями, некоторые из которых уже находятся на 15-й итерации (например, MagiCotRev15Launch). 

Такой поэтапный подход снижает риск (неудачные эксперименты затрагивают лишь небольшое количество пользователей), одновременно обеспечивая темп инноваций, недостижимый при традиционных редизайнах.

Диапазон охватываемых сущностей поражает: 

  • ИИ (включая несколько вариантов Magi и AIM – или AI Mode).
  • Покупки (более 50 специальных экспериментов).
  • Такие вертикали, как спорт, финансы, погода, путешествия и многое другое. 

Прослеживается четкая закономерность: каждой вертикали назначается собственная сущность или «домен», например ShoppingOverlappingDomain, TravelOverlappingDomain или SportsOverlappingDomain. 

Эти пересекающиеся области указывают на сложную архитектуру, в которой каждая команда по продукту работает в своем собственном экспериментальном пространстве, что позволяет проводить параллельное тестирование без конфликтов.

Сущности повсюду

Сущности играют ключевую роль во всей экосистеме Google. Этот вопрос подробно рассматривался в ходе выступления под названием «Сущности повсюду», прочитанного в начале этого года в Марселе Дэмиеном Анделлом и Сильвеном Дёре из 1492.vision. 

В презентации было рассмотрено, как Knowledge Graph лежит в основе таких сервисов, как Search, Discover, YouTube, Maps и других.

Граф знаний: центральная нервная система Google

Исследования показывают, что Knowledge Graph — это гораздо больше, чем помощник на боковой панели, который видят большинство пользователей. 

Он функционирует как центральная нервная система экосистемы Google, обеспечивая работу Поиска, Discover, YouTube, Карт, Помощника, Gemini и AI Overviews.

Google считает надежность данных своим главным приоритетом. 

В основе Knowledge Graph лежит Livegraph, который присваивает весовой коэффициент уверенности каждой встреченной тройке, прежде чем решить, следует ли ее допустить. 

Эта навязчивая ориентация на проверку отражена в многоуровневой иерархии пространств имен:

  • kc: Данные из тщательно проверенных корпусов (например, официальные данные о возрасте, правительственные записи).
  • ss: «веб-факты», извлеченные из Интернета, а также несколько ok: кратких фактов (менее надежных, но более содержательных).
  • hw: Информация, вручную отобранная людьми.

Эта классификация далека от косметического эффекта — она напрямую влияет на уровень доверия к каждому факту и определяет, как этот факт используется в сервисах Google.

Призрачные сущности и адаптация в реальном времени

Среди наиболее интересных открытий — так называемые сущности-призраки — незакрепленные объекты, которые плавают в буферной зоне Графа знаний. 

В отличие от полностью проверенных объектов со стабильными MID, эти временные структуры позволяют Google реагировать на возникающие события практически в режиме реального времени. 

В то время как обычные LLM остаются привязанными к своим учебным снимкам, Google может:

  • Динамически генерировать новые сущности.
    Проверять их постепенно.
    При необходимости отображать в результатах.

Эту систему поддерживают SAFT и WebRef, которые, как выяснилось в результате утечек 2024 года, непрерывно извлекают, классифицируют и связывают сущности, помогая Google создавать комплексное семантическое представление сети.

SEO-последствия: станьте проверенным субъектом

Для специалистов по поисковой оптимизации вывод очевиден: ваш бренд должен существовать как проверенная сущность в постоянно расширяющемся Сети знаний Google. 

Утечка 2024 года показала, что Google анализирует целые сайты, вычисляя сигналы тематической согласованности, такие как siteFocusScore и NSR, которые штрафуют разрозненный или несфокусированный контент.

Данные Chrome постоянно поступают в Knowledge Graph, идентифицируя посещенные объекты, обновляя сигналы доверия и отслеживая возникающие тенденции. 

В этой новой реальности видимость зависит не столько от объема контента, сколько от того, представляет ли ваш сайт единое целое, триангулированное по нескольким источникам и глубоко встроенное в связный тематический график.

Внутри режима искусственного интеллекта Google: 90 проектов и целая плеяда агентов

Недавнее открытие предоставило доступ к тому, что, по-видимому, является внутренним меню отладки Google — видимым только внутри корпорации или через VPN. 

Хотя Том Кричлоу представил более раннюю версию еще в марте, эта новая версия, датированная 28 мая 2025 года, показывает около 90 проектов в разработке — это на 40 больше, чем в предыдущем списке.

Созвездие ультраспециализированных агентов

Сразу бросается в глаза многоагентная стратегия Google. Вместо создания единого универсального помощника компания разрабатывает целую плеяду узкоспециализированных агентов:

  • MedExplainer для здоровья.
  • Турагентства и специальные предложения по перелетам для путешествий.
  • Neural Chef, анализатор продуктов питания и умный рецепт для приготовления пищи. 
  • Новостной дайджест и ежедневный обзор новостей.
  • Shopping AI Studio для коммерции.
  • И так далее.

Project Magi: основа режима искусственного интеллекта

Многие из этих экспериментов относятся к проекту Magi (внутреннее название AI Mode в Google), в рамках которого проводится более 50 активных тестов. Развёртывание выглядит чётко структурированным:

  • MagiModelLayerDomain: Основная инфраструктура.
  • MagitV2p5Launch: совпадает с Gemini 2.5.
  • SuperglueMagiAlignment: зеркально отражает систему Glue, отслеживающую взаимодействие пользователя.

Пожалуй, самым впечатляющим является MagitCotRev15Launch, находящийся уже на 15-й стадии разработки. 

В нем реализована технология цепочки мыслей, в рамках которой ИИ проходит пять этапов рассуждений:

Размышление → Исследование → Читать → Синтезировать → Оттачивать.

AIM (режим ИИ) и новый пользовательский интерфейс

Проект AIM фокусируется на пользовательских интерфейсах с несколькими точками входа:

  • AimLhsOverlay: боковая панель ИИ.
  • SbnAimEntrypoints: повторное использование кнопки «Мне повезет» в качестве шлюза ИИ.
  • Даже сам логотип Google становится интерактивным.

Тем временем Stateful Journey и Context Bridge подтверждают революцию LLM — Google переходит от изолированных запросов к полноценным сеансам общения.

SEO-выводы

  • Гиперспециализация имеет решающее значение — контент должен соответствовать уровню экспертов.
  • Мультимодальность больше не является факультативной: текст, изображения, видео и структурированные данные — все это поступает этим агентам.
  • Персонализация достигает беспрецедентной глубины и осуществляется на основе контекста сеанса, а не отдельных запросов.
  • Механизм профилирования: Улыбнитесь, вас внедряют!

Расследование раскрывает скрытый уровень инфраструктуры Google, который преобразует каждое цифровое взаимодействие в математическое вложение: вектор, кодирующий суть вашей онлайн-идентичности.

В основе этой системы профилирования лежит Nephesh — универсальная платформа Google для интеграции пользователей. 

Nephesh генерирует векторные представления ваших предпочтений и поведения во всех продуктах Google.

Как показали утечки 2024 года, эти внедрения:

  • Производят сигналы, которые оценивают, соответствуете ли вы «типичному» или «нетипичному» профилю.
  • Оценивают вероятность того, что вы будете взаимодействовать с определенным контентом, основываясь на соответствии ваших интересов и векторных характеристик этого контента.

Пикассо и ВанГог: двойные вложения для Google Discover

Для Discover Google использует двухкомпонентную систему встраивания, названную Picasso и VanGogh:

  • Picasso: ваша долговременная память, терпеливо анализирующая месяцы взаимодействия, чтобы создать устойчивый профиль. Она использует два временных окна: STAT (недавние интересы) и LTAT (давние увлечения).
  • VanGogh: работает на устройстве, фиксируя в реальном времени сигналы — состояние устройства, последние запросы и даже расстояние прокрутки.

Эти две системы координируют работу, чтобы сбалансировать ваши непосредственные потребности с вашими более глубокими интересами.

Созвездие специализированных вложений

Помимо Picasso и VanGogh, Google поддерживает целый ряд специализированных вложений:

  • Вертикальные вложения (например, подкасты, видео, покупки, путешествия).
  • Временные внедрения (реального времени, краткосрочные, постоянные).
  • Контекстные вставки, адаптирующиеся к ситуативным сигналам.

Система HULK от Google выводит поведенческий анализ на новый уровень. 

Он определяет, находитесь ли вы в транспортном средстве, на велосипеде, на лестнице, в лифте или даже спите, — используя эти сигналы для интерпретации и прогнозирования контекста пользователя в режиме реального времени.

Он также определяет часто посещаемые места, такие как SEMANTIC_HOME и SEMANTIC_WORK, и использует эти данные для прогнозирования будущих пунктов назначения и соответствующей персонализации результатов.

Понимание запросов: раскрыты возможности расширения запросов и оценки в реальном времени

Еще один заметный прорыв касается механизма расширения запросов Google и загадочного уровня оценки в реальном времени. 

Используя метод, который мы сохраним в тайне, мы зафиксировали, как преобразуются ваши запросы:

  • Например, в «велосипедном туре по Франции» «велосипедный тур» мгновенно превращается в объединенную биграмму «cyclingtour» и разветвляется на «велосипед», «велосипед» и «поездки».
  • Появляются специальные маркеры, такие как iv;pи iv;d.
    iv;pдля дословных точных совпадений.
    iv;dдля лингвистических производных.

Географическая разведка

Для запроса типа «маникюрный салон Форт-Лодердейл 17-я улица» система:

  • Картографирует категории ( geo:ypcat:manicuring) и коды зон ( geo;88d850000000000).
  • Расширяет варианты адресов.
  • Переводит определенные термины «на лету», когда ваше местоположение предполагает наличие местных намерений, даже если это не ваш язык по умолчанию.

Эти результаты подтверждают, что архитектура 2024 года подверглась утечке.

  • GWS → Superroot → Служба понимания запросов (QUS) → QBST все еще работает.
  • Продолжающиеся эксперименты, такие как GwsLensMultimodalUnderstandingInQusUpstream и QusPreFollowM1InQResS, выполняются.

Оценка терминов в реальном времени

Та же утечка раскрывает оценочную сетку, в которой каждый термин получает от 0 до 10 баллов за URL:

  • Стоп-слова игнорируются.
  • Термины заголовка приносят бонусы.
  • Названные сущности стабильно набирают максимальные баллы.

Это соответствует документированному процессу Google Salient Terms — такие контекстно-взвешенные показатели, как virtualTf, idf и значимость, уточняют лексикон. 

Эти лексические оценки не определяют окончательный рейтинг. 

NavBoost, актуальность и другие факторы играют решающую роль, но они показывают, как запросы интерпретируются и оцениваются в режиме реального времени.

Представленная информация получена исключительно из общедоступных источников без обхода контроля доступа или взлома. Она публикуется исключительно в ознакомительных целях.

Комментарии