Что показывает наше исследование поведения пользователей в AI Mode о будущем поиска

Иван Захаров представляет исследование пользовательского поведения в Google AI Mode. Узнайте, как AI Mode удерживает внимание, сокращает клики и меняет правила SEO. Данные основаны на 250 сессиях.
Что показывает исследование поведения пользователей в AI Mode

Вот что 250 сессий пользователей в AI Mode говорят нам о будущем поиска: он тихо меняет все правила.

Наше новое исследование юзабилити с участием 37 человек, выполнявших семь конкретных поисковых задач, ясно показывает, что люди:

  • Читают ответы AI Mode
  • Редко переходят на другие сайты
  • Уходят только тогда, когда готовы совершить действие (например, покупку).

Насколько нам известно, это единственное независимое исследование юзабилити, которое изучило AI Mode так глубоко. Поскольку ни Google, ни OpenAI (да и никто другой) не предоставляют данных о пользователях своих AI-продуктов, мы заполняем пробел.

Мы записывали экраны и сессии «мышления вслух» через удаленное исследование. Собранные 250 уникальных задач обеспечили надежную базу данных для нашего анализа. 

Некоторые выводы могут вас удивить. Нас — удивили.

Пост получился длинным, так что налейте себе кофе и устраивайтесь поудобнее.

Краткая выжимка

Наше новое исследование юзабилити AI Mode от Google показывает, насколько значительно эта функция меняет поведение пользователей.

  • AI Mode удерживает внимание и оставляет пользователей внутри. Примерно в трёх четвертях всех сессий пользователи ни разу не покидали панель AI Mode — и 88% первых взаимодействий пользователей были с AI-генерируемым текстом. Вовлеченность была высокой: медианное время выполнения задачи составляло от 52 до 77 секунд.
  • Клики редки и в основном транзакционные. Медианное число внешних кликов на задачу было равно нулю. Да, вы не ослышались. Нулю. А 77.6% сессий вообще не имели внешних переходов.
  • Люди бегло просматривают, но все равно принимают решения в AI Mode. Более половины задач были классифицированы как «быстро просмотренные», когда пользователи бегло изучают AI-сводку, формируют мнение и идут дальше.
  • AI Mode выдает «типы сайтов», соответствующие интенту. Речь не только о соответствии поисковому запросу; AI Mode цитирует источники, которые подходят под определенные категории сайтов (например, маркетплейсы, сайты-обзоры, бренды).
  • Видимость, а не трафик, становится новой валютой. Участники формировали мнение о брендах прямо на основе выводов AI Mode.

Короче говоря? Вот основные выводы этого исследования:

  1. AI Mode — это липкий интерфейс.
  2. Клики зарезервированы для транзакций.
  3. AI Mode сопоставляет тип сайта с намерением.
  4. Превью товаров работают как мини-версии страниц продукта (PDP).

Игнорируйте эти данные о AI Mode на свой страх и риск

Сундар Пичаи из Google был предельно ясен: AI Mode — это не игрушка, а полигон для того, как будет выглядеть основное поисковое опытие в будущем.

В подкасте Лекса Фридмана Пичаи сказал:

«Наш текущий план — AI Mode будет там в качестве отдельной вкладки для людей, кто действительно хочет испытать это… Но по мере того, как функции будут работать, мы будем переносить их на основную страницу…» 

Google заявлял, что эти новые AI-фичи разработаны с целью направления пользователей на веб-страницы, но на практике наши данные показывают, что пользователи остаются и принимают решения без перехода. Теоретически это может повлиять не только на клики в органические результаты и цитаты, но и сократить внешние переходы по рекламе.

Прямо сейчас, согласно данным Similarweb, использование вкладки AI Mode на Google.com в США немного снизилось и составляет чуть более 1%.

AI Overviews теперь видны более чем 1.5 миллиардам пользователей в месяц, и они находятся в центре внимания. Но вовлеченность падает. Пользователи проводят меньше времени в Google и кликают реже.

Но по мере того, как Google будет шире внедрять AI Mode, это принесет с собой самое большое изменение в Поиске (крупнейшем канале привлечения клиентов) за всю историю.

Традиционное SEO остается эффективынм в новом AI-мире, но если AI Mode действительно станет поиском по умолчанию, есть шанс, что нам придется переосмыслить наш арсенал тактик.

Подготовка к будущему поиска означает отношение к AI Mode как к месту назначения (а не двери) и выяснение, как там появляться способами, которые действительно важны для реального поведения пользователей.

1. AI Mode — это липкий интерфейс

Ключевая статистика

Люди сначала читают и обычно остаются внутри AI Mode. Вот что мы обнаружили:

  • Большинство сессий не имело внешних переходов: то есть, они вообще не покидали AI Mode.
  • ~88% первых взаимодействий пользователей с функцией были с текстом AI Mode.
  • Типичная вовлеченность пользователя в AI Mode составляет примерно от 50 до 80 секунд на задачу.

Эти три статистики определяют поисковую поверхность AI Mode: она удерживает внимание и решает многие задачи без отправки трафика.

Вот что я имею в виду под «взаимодействием»:

«Взаимодействие» в рамках пользовательских задач = участник определенно взаимодействовал с AI Mode после его загрузки.

Что считается взаимодействием: Чтение или скроллинг тела AI Mode дольше, чем беглый взгляд, включая сканирование блока результатов (например, Shopping Pack или Right Pane), открытие карточки продавца, клик на inline-ссылку, иконку ссылки или image pack.

Что НЕ считается взаимодействием: Краткие перемещения взгляда, проведение курсора или колебание перед взаимодействием.

Пользователи в AI Mode, чтобы читать – не обязательно чтобы бродить или искать – ~88% сессий сначала взаимодействовали с текстовым выводом и проводили минуту или более внутри AI Mode.

Кроме того, интересно видеть, что пользователи проводят более чем в два раза больше времени в AI Mode по сравнению с AIOs.

Общая вовлеченность намного сильнее.

Почему это важно

Относитесь к панели AI Mode как к основной поверхности для чтения, а не как к анонсу для синих ссылок.

AI Mode — это самодостаточный опыт, где отправка кликов на сайты имеет низкий приоритет, а предоставление пользователям лучшего ответа — наивысший.

В результате это кардинально меняет цепочку ценности для создателей контента, компаний и издателей.

Инсайт

Почему другие источники и/или исследования AI Mode говорят, что пользователи нечасто возвращаются к функции AI Mode?

Моя теория: поскольку AI Mode — это отдельный поисковый опыт (по крайней мере, пока), он не так заметен, как AIOs.

По мере роста приспосабливаемости AI Mode, когда Google внедрит Gemini (и AI Mode) в браузер, я ожидаю, что выводы нашего исследования будут масштабироваться.

2. Клики зарезервированы для транзакций

Хотя кликов мало, намерение покупки — не уменьшается.

Участники исследования переходили по клику только тогда, когда задача этого требовала (например, «положите товар в корзину») или если они немного просматривали.

Однако кликов при просмотре было так мало, что можно с уверенностью предположить: AI Mode приводит к кликам только тогда, когда пользователи хотят совершить покупку.

Даже запросы с сравнением и информационной целью часто удерживают пользователей внутри функционала.

Запросы, связанные с покупками, такие как ["Холщовая сумка"] и ["Клипса для настольного кабеля"], приводят к наибольшему проценту выхода из режима AI.

Сравнительные запросы, такие как ["Oura против Apple Watch"], показывают наименьший процент выходов среди всех типов запросов.

Когда участникам предлагалось предпринять конкретные действия ("поместите товар в корзину" или "найдите продукт"), большинство кликов направлялось на функциональные возможности покупок, такие как наборы товаров или карточки продавцов.

18% выходов были вызваны тем, что пользователи выходили из AI Mode и переходили напрямую на другой сайт, что значительно усложняет reverse engineer того, что изначально вызвало эти визиты.

Расшифровки исследований подтверждают, что участники часто вслух говорят, что «перейдут на страницу продавца» или «найдут товар на Amazon/ebay» для продуктового поиска.

Даже при сравнении продуктов, будь то софт или физические товары, пользователи почти не кликают.

Проще говоря, AI Mode съедает все TOFU и MOFU клики. Пользователи открывают продукты и формируют о них мнение в AI Mode.

Ключевая статистика

Из 250 валидных задач медианное число внешних кликов было равно нулю!

Задача с промптом ["Холщовая сумка"] имела 44 внешних клика, а ["Клипса для настольного кабеля"], — 31 клик, что составляет две трети всех внешних кликов в этом исследовании.

Задачи на сравнение, такие как [Oura Ring против Apple Watch] или [Ramp против Brex], имели очень мало кликов (≤6 всего по всем задачам).

Почему это важно

Вот что интересно…

В исследовании юзабилити AI Overviews мы обнаружили, что пользователи десктопов кликают вовне в ~10.6% случаев по сравнению с практически 0% в AI Mode.

Однако, в AIOs под ними есть органические результаты и SERP-фичи. (Люди меньше кликают в AIOs, но они чаще кликают на органические результаты и SERP-фичи.)

Zero-Clicks

  • AI Overviews: 93%
  • AI Mode: ~100%

Имейте в виду, что участники исследования юзабилити AIO кликали на обычные органические результаты. 93% относятся к нулевым кликам внутри самого AI Overview.

На десктопе AI Mode производит примерно вдвое больше кликов внутри панели по сравнению с панелью AIO. На AIO-серпах общий уровень кликов вовне все еще может происходить через органические результаты под панелью, поэтому показатель на уровне страницы будет находиться между цифрой для AIO-панели и классическим показателем.

Важное примечание от Эрика Ван Кирка, директора этого исследования: сравнивая исследования AI Mode и AI Overview, мы сравниваем не совсем одинаковые вещи. В этом исследовании участникам давали задачи, которые побуждали их покинуть AI Mode в 2/7 вопросов, и это составляет большинство внешних кликов (которых было меньше трех). С другой стороны, самым транзакционным запросом в исследовании AIO был следующий: «Найти переносное зарядное устройство для телефонов стоимостью менее 15 долларов. Поиск осуществляйте обычным способом». Им не говорили «положить его в корзину». Тем не менее, инсайты, собранные относительно поведения пользователей в этом исследовании AI Mode – и паттерн, что пользователи не чувствуют необходимости кликать из AI Mode для принятия дополнительных решений – остаются остаются надежным выводом.

Инсайт

Более широкая картина здесь такова: AIOs похожи на информационный лист, который в конечном итоге направляет пользователей на сайты, а AI Mode — это закрытый опыт, в котором пользователи редко кликают вовне.

Что делает AI Mode (и ChatGPT, кстати) интригующим, так это когда пользователи покидают опыт и переходят напрямую на сайты. Это мешает моделям атрибуции и нашей способности понимать, что влияет на конверсии.

3. AI Mode сопоставляет тип сайта с интентом

В исследовании мы оцениваем, какие типы сайтов AI Mode показывает для наших семи задач.

Типы:

  • Бренды: Продавцы/вендоры.
  • Маркетплейсы: amazon.com, ebay.com, walmart.com, homedepot.com, bestbuy.com, target.com, rei.com.
  • Сайты-обзоры: nerdwallet.com, pcmag.com, zdnet.com, nymag.com, usatoday.com, businessinsider.com.
  • Издатели: nytimes.com, nbcnews.com, youtube.com, thespruce.com.
  • Платформа: Google.

Ключевая статистика

  • Шоппинг-промпты ведут на продуктовые страницы:
    • Холщовая сумка: 93% выходов идут на Бренд + Маркетплейс.
    • Клипса для настольного кабеля: 68% идут на Бренд + Маркетплейс, с видимой долей Издателей.
  • Сравнения ведут на обзоры:
    • Ramp vs Brex: 83% Обзоры.
    • Oura vs Apple Watch: разделение 50% Бренд и 50% Маркетплейс.
  • Когда пользователю нужно проверить репутацию, результат делится между брендами и издателями:
    • Liquid Death: 56% Бренд, 44% Издатель.
  • Сам Google появляется в шоппинг-задачах:
    • Поиск магазинов на business.google.com появляется в Холщовой сумке (7%) и Клипсе для настольного кабеля (11%).

Взгляните на самые кликаемые домены по задачам:

  • Холщовая сумка: llbean.com, ebay.com, rticoutdoors.com, business.google.com.
  • Клипса для настольного кабеля: walmart.com, amazon.com, homedepot.com.
  • Платные приложения для изучения языков vs бесплатные: pcmag.com, nytimes.com, usatoday.com.
  • Бутилированная вода (Liquid Death): reddit.com, liquiddeath.com, youtube.com.
  • Ramp vs Brex: nerdwallet.com, kruzeconsulting.com, airwallex.com.
  • Кольцо Oura Ring 3 vs Apple Watch 9: ouraring.com, zdnet.com.
  • VR аркада или умный дом: sandboxvr.com, business.google.com, yodobashi.com.

Почему это важно

Компаниям необходимо понимать игровое поле. В то время как классическое SEO позволял практически любому сайту быть видимым для любого пользовательского интента, в AI Mode есть строгие правила:

  • Бренды побеждают маркетплейсы, когда пользователи знают, какой продукт хотят.
  • Маркетплейсы предпочтительны, когда выбор широкий или универсальный.
  • Сайты-обзоры появляются для сравнений.
  • Мнения выделяют Reddit и издателей.
  • Сам Google наиболее видим для локального интента, а иногда и для шоппинга.

Инсайт

Как SEO-специалисты, мы должны учитывать, как Google классифицирует наш сайт на основе его шаблонов страниц, репутации и пользовательской вовлеченности. Но что важнее, нам нужно мониторить промпты в AI Mode и смотреть на микс сайтов, чтобы понять, где мы можем играть.

Сайты не могут и не будут видимы для всех типов запросов в теме anymore; вам нужно будет фильтровать свою стратегию по интенту, который соответствует типу вашего сайта, потому что AI Mode показывает только определенные сайты (например, сайты-обзоры или бренды) для конкретных типов интента.

4. Превью товаров работают как мини-версии PDP

Ключевая статистика

Превью товаров появляются примерно в 25% сессий AI Mode, получают ~9 секунд внимания, и люди обычно открывают только одно.

И что потом? 45% на этом останавливаются. Многие открытия — это быстрая проверка характеристик, а не клик вовне.

Вы легко заметите, как некоторые рекомендации продуктов от AI Mode и внутренние впечатления сайта довольно сильно разочаровывают пользователей.

Пост-кликовый опыт критичен: классические практики, такие как отзывы, имеют большое влияние на то, чтобы извлечь максимум из тех немногих кликов, которые у нас еще остаются.

Посмотрите на этот пример из исследования:

«Похоже, у него много положительных отзывов. Это одна вещь, на которую я бы посмотрел, если бы собирался купить эту сумку. Так что я бы выбрал именно эту.»

Почему это важно

В шоппинг-задачах мы обнаружили, что сайты брендов забирают большинство выходов.

В задачах на сравнение мы выяснили, что доминируют сайты-обзоры. Для проверки репутации (например, промпт для [Liquid Death]) выходы на бренды и издатели разделились.

  • Для транзакционных интент-промптов: Бренды поглощают большинство выходов, когда задача — купить один товар сейчас. [Холщовая сумка] показывает сильный крен в сторону PDP брендов.
  • Для интент-промптов на репутацию: Сайты брендов появляются alongside издателей. Промпт для [Liquid Death] делится между liquiddeath.com и Reddit/YouTube/Eater.
  • Для промптов на сравнение: Бренды отходят на второй план. Выходы по [Ramp vs Brex] в основном идут на сайты-обзоры, такие как NerdWallet и Kruze.

Инсайт

Учитывая, что пользователи теперь могут напрямую оформлять заказ в ChatGPT и AI Mode, задачи, связанные с шоппингом, могут отправлять еще меньше кликов вовне. [2, 3]

Следовательно, AI Mode становится completely закрытым опытом, где даже шопинговый интент удовлетворяется прямо в приложении.

История AI Mode еще не закончена: что делать дальше

Кликов мало. Влияния — много.

Данные дают нам проверку реальности: если пользователи продолжат адаптироваться к новому способу гугления, AI Mode изменит поисковое поведение так, как SEO-специалисты не могут позволить себе игнорировать.

Стратегия смещается с «получить клик» на «заработать цитирование».

Сравнения — для доверия, а не для трафика. Они сокращают выходы, потому что пользователи чувствуют себя информированными внутри панели.

Продавцы должны оптимизироваться для решающих выходов. Указывайте цены, наличие и доказательства выше среднего, чтобы конвертировать те немногие выходы, которые у вас есть.

Вам нужно будет зарабатывать цитирования, которые отвечают на задачу, а затем выигрывать те немногие, оставшиеся выходы с высоким интентом.

Но наше исследование на этом не заканчивается.

Сегодняшние результаты раскрывают ключевые инсайты о том, как люди взаимодействуют с AI Mode. Мы раскроем больше в Части 2, которая выйдет на следующей неделе.

Но для тех, кто любит копаться в деталях, методология исследования приведена ниже.

Методология

Дизайн и цели исследования

Мы провели исследование юзабилити смешанными методами, чтобы количественно оценить, каким образом новый режим AI от Google влияет на поведение пользователей. Каждый участник выполнил семь реальных поисковых подсказок в Google через функцию AI Mode. Такой дизайн позволил нам одновременно отслеживать как техническую сторону взаимодействия (прокрутка, клики, время, уровень доверия), так и качественные рассуждения участников, высказанные ими в процессе выполнения заданий.

Задачи:

  1. Что люди говорят о Liquid Death, компании по производству напитков? Привлекают ли вас их напитки?
  2. Представьте, что вы собираетесь купить трекер сна, и доступны только два варианта: Oura Ring 3 или Apple Watch 9. Что бы вы выбрали и почему?
  3. Вы получаете информацию о преимуществах кредитной карты Ramp против карты Brex для малого бизнеса. Какая из них кажется лучше? Что заставило бы бизнес перейти с другой карты: детали комиссий, тонкости условий оплаты или вознаграждения?
  4. Введите в окно «Задайте любой вопрос» в режиме AI следующее: «Помогите приобрести водонепроницаемую холщовую вещь». Выберите наиболее подходящий вам вариант исходя из ваших потребностей и предпочтений (например, чехол для камеры, шоппер, дорожная сумка и т.п.). Перейдите на страницу продавца. Добавьте выбранный товар в корзину и завершите выполнение задания, не продолжая дальнейшие шаги.
  5. Сравните платные языковые приложения с бесплатными. Стали бы вы платить и в какой ситуации? Какой продукт вы бы выбрали?
  6. Предположим, вы навещаете друга в большом городе и хотите пойти либо: 1. В виртуальную реальность аркаду, ЛИБО 2. В шоу-рум умного дома. Как называется город, который вы посещаете?
  7. Предположим, 1. Предположим, вы работаете за маленьким столом, и ваши кабели разбросаны повсюду. 2. Во вкладке «Задавайте любые вопросы» в режиме AI введите: «Кабели устройств захламляют моё рабочее пространство. Что я могу купить сегодня, чтобы решить проблему?» 3. После этого выберите один товар, который, по вашему мнению, станет наилучшим решением. Добавьте этот товар в корзину на стороннем сайте и завершите выполнение задания.

Участники и рекрутинг

Тридцать семь англоговорящих взрослых из США были наняты через Prolific в период с 20 августа по 1 сентября 2025 года (включая участников небольшой группы, которые проводили пилотные исследования).

Для участия требовался approval rate ≥ 95% на Prolific, Chromium-браузер и работающий микрофон. Участники посещали AI Mode и выполняли задачи удаленно через свой десктопный компьютер; невалидные сессии были исключены due to технические сбои или non-compliance. Финальный dataset содержит более 250 валидных записей задач от 37 участников.

Пилотные исследования проводятся главным образом в рамках удалённого тестирования юзабилити (remote usability testing) для выявления и устранения технических проблем — таких как совместное использование экрана (screen-sharing), постановка задач или проблемы с записью — ещё до начала основной части исследования. Эти тесты позволяют скорректировать формулировки заданий, временные рамки и инструкции таким образом, чтобы участники правильно понимали их смысл. Но самое важное заключается в том, что пилотные сессии проверяют, отвечают ли собираемые данные на поставленные исследовательские вопросы и насколько хорошо сама методика работает гладко в реальных удалённых условиях.

Протокол задач

Сессии проходили в режиме удаленной сессии UXtweak. Участники читали промпт задачи, переходили на Google.com/aimode, вводили промпт в AI Mode и проговаривали свои мысли вслух во время взаимодействия с AI Mode. Им были даны следующие указания: «Думайте вслух и кратко объясняйте, что привлекает ваше внимание, пока вы изучаете информацию. Говорите вслух и наводите курсор, чтобы указать, где вы находите информацию, которую ищете.» Каждый участник выполнил семь типов задач, разработанных для охвата различных категорий интента, включая сценарии сравнения, транзакций и информации.

Стек захвата данных

UXtweak записывал полноэкранное видео, движения курсора мыши, события прокрутки страницы и аудиозаписи. Средняя продолжительность сессий составляла 20–25 минут. Используемые стимулы носили конкурентный характер. Исходные видеозаписи, расшифрованные стенограммы и журналы событий были выгружены для последующего кодирования и анализа.

Процедура аннотирования

Три подготовленных кодировщика одновременно просматривали каждое видео. Запись осуществлялась для элементов пользовательского интерфейса (UI), которые привлекли внимание примерно на 5 секунд или дольше. Зафиксированные переменные включали:

- Структурные: поля, описывающие конфигурацию, метаданные или структуру исследования — не поведение пользователей; сюда входят такие данные, как ID участника, ID задачи, используемое устройство, запрос, последовательность элементов интерфейса, по которым производились клики или переходы в ходе выполнения задачи, тип веб-сайта, на который было совершено нажатие (например, социальные сети, сообщества, бренды, платформы), доменное имя внешнего ресурса, которое посетило исследование, и прочее.
- Особенности интерфейса: поля, описывающие элементы пользовательского интерфейса или интерфейсные компоненты, доступные участникам. Например, типы элементов интерфейса, такие как карусель товаров, карточки продавцов, правая панель, иконки ссылок, встроенная карта, локальные пакеты, карточка Google My Business (GMB), пакеты магазинов и карточки продуктов.
- Вовлечение: поля, фиксирующие активные взаимодействия участников, степень внимания или затраченное время. Сюда входит процесс чтения и концентрация внимания, поведение в чатах и опросах, поведение при кликах и взаимодействиях.
- Результативность: поля, отражающие итоговые показатели действий пользователей, оценки кодировщиков или интерпретацию поведения. Это включает комментарии кодировщиков, оценку приложенных усилий и места нахождения искомой информации.

Кроме того, кодировщики выделяли качественные тематики (например, скорость, недоверчивость, доверие к источникам цитат) для улучшения поиска на основе извлеченной информации (RAG-based retrieval). Руководитель исследований выборочно просмотрел около 10% записей для проверки согласованности результатов.

Обработка данных и метрики

Аннотации были загружены в среду Python/Pandas версии 2.2. Удалены пропуски значений («999 = неприменимо», «998 = не наблюдаемо»), а категориальные переменные (например, появление, клики, настроение) приведены к единому формату. Временные интервалы задержки (dwell time) и прочие временные метрики очищены от крайних выбросов. По завершении обработки осталось около 250 валидных записей на уровне отдельных задач.

Наш конвейер извлечения и дополненного формирования вывода (RAG pipeline) обеспечивал три этапа анализа:

- Подготовка данных (Ingestion): Семь задач каждого участника преобразовывались в индивидуальные строки. Закодированные значения приводились к общему виду, нормализовались временные промежутки, количество кликов и другие показатели. Расшифровка диалогов сохранялась отдельно, позволяя сопоставлять структурированную информацию (например, время задержки взгляда) с фактическими высказываниями пользователей. ЦЕЛЬ: создание чистого унифицированного набора данных, объединяющего поведение и рассуждения.

- Отбор по релевантности (Retrieval): Используя структурированные поля и аннотации, мы изолировали определённые шаблоны поведения (например, покидание режима AI, щелчок по карточкам продавца или проявление нерешительности). Далее мы искали соответствующие темы в расшифровках разговоров, такие как доверие, комфорт или разочарование. ЦЕЛЬ: объединить объективные наблюдения с эмоциональными реакциями, раскрывающими истинные намерения пользователей.

- Интерпретация (Quantitative+Qualitative синтез): Для каждой подгруппы рассчитывались описательные статистики (задержка, клики, уровень доверия) и дополнялись доказательствами из расшифровок бесед. Таким способом выявлялись важные закономерности, например: «Задачи на внешних сайтах демонстрировали большую удовлетворённость пользователей, однако сопровождались большим количеством замешательств относительно призывов к действию (CTA)». ЦЕЛЬ: установить связь между действиями пользователей и их ощущениями в рамках режима AI.

Такой подход позволял точно извлекать конкретные подмножества данных — например, «все участники, пролиставшие более 50% материала в режиме AI, но выражавшие сомнения». Иначе говоря, мы могли легко выбирать интересующие группы пользователей или моменты взаимодействия, такие как «все, кому не нравился режим AI», или «те, кто листал страницу более чем на половину».

Статистический анализ

Пользовательское поведение суммировалось с использованием описательной и индуктивной статистики на основании 250 валидных записей задач. Каждая метрическая характеристика включала подсчёт количества случаев, среднее значение, медиану, стандартное отклонение, ошибку среднего и интервал надёжности в 95%. Классификация исходов (категорий), таких как выход из режима AI или щелчки по карточкам продавцов, представлена пропорциями.

Анализ затронул более 50 структурированных и поведенческих характеристик — начиная от типа устройства и задержек взглядов и заканчивая элементами интерфейса и настроением. Показатели достоверности определялись путём анализа файлов JSON, содержащих настроения пользователей на основе их расшифрованных высказываний.

Надёжность и статистическая сила

Каждая задача была отмечена квалифицированным специалистом-кодовщиком и подвергнута проверке на предмет внутренней согласованности. Распределения оценок среди разных кодировщиков сравнивались для подтверждения стабильных маркировочных схем и внутреннего единства подхода.

Всего тридцать семь участников выполнили по семь задач каждый, в общей сложности получив около 250 валидных задач. Такой объём позволяет обеспечить точность порядка ±6%, что даёт достаточную точность для выявления значимых изменений направлений.

Ограничения

Выборка значительно меньше аналогичного исследования AI Overview (37 против 69 участников), кроме того, оно ориентировано исключительно на американских пользователей (все респонденты проживали в США). Все запросы выполнялись исключительно в пределах режима AI, то есть прямое сравнение условий с и без AI отсутствовало. Метод «мыслить вслух» мог слегка увеличить показатель длительности задержек. Кодировка на основе технологии RAG настолько сильна, насколько надежны её вводные данные, хотя тщательная проверка подтвердила её надёжность.

Этическое соблюдение

Участие добровольцев основывалось на информированном согласии. Записи шифровались и анонимизировались, персональные идентификационные данные не собирались. Исследование проводилось согласно этическим стандартам платформы Prolific и условиям обслуживания сервиса UXtweak.

Комментарии