Blog / Глубокое погружение в скрытые системы Google Поиска
Глубокое погружение в скрытые системы Google Поиска
Раскрытие живых экспериментов, инфраструктуры на основе сущностей, ИИ-агентов и многого другого.
За последние несколько месяцев мы провели масштабное расследование внутренней работы Google.
Оно привело к важным открытиям — некоторые из них мы раскрываем здесь.
Хотя мы не можем рассказать всё, приведённые ниже данные дают более чёткое представление о том, как Google генерирует и ранжирует результаты.
Что ~1200 экспериментов рассказывают о внутренней работе Google
Мы получили список из почти 1200 экспериментов Google, более 800 из которых были активны по состоянию на июнь 2025 года.
Этот набор данных подтверждает, что многие компоненты, упомянутые в утечках 2024 года — Mustang, Twiddlers, QRewrite, Tangram, QUS и другие — по-прежнему играют ключевую роль в системе.
Появились также новые, интересные кодовые имена: Harmony, Thor, Whisper, Moonstone, Solar и др.
Среди самых примечательных — DeepNow (преемник Google Now) с NowBoost, и SuperGlue, возможно, замена Glue — аналога NavBoost для универсального поиска.
Облако из 1200 экспериментов
В отличие от большинства сайтов, которые получают редизайн раз в 3–5 лет, Google развивается непрерывно.
Нет громкого «релиза новой версии» — только поток микрoизменений, переходящих от эксперимента к полноценному внедрению.
Именно этим объясняется многослойность списка: старые тесты соседствуют с новыми, некоторые — уже на 15-й итерации (например, MagiCotRev15Launch).
Такой постепенный подход снижает риски — неудачные эксперименты затрагивают лишь малую часть пользователей — и позволяет инновациям развиваться быстрее, чем при традиционных редизайнах.
Области, охваченные экспериментами:
- ИИ: множество вариантов Magi и AIM (AI Mode)
- Шопинг: более 50 экспериментов
- Вертикали: спорт, финансы, погода, путешествия и др.
Каждой вертикали соответствует свой домен, например:
ShoppingOverlappingDomain
TravelOverlappingDomain
SportsOverlappingDomain
Такая архитектура позволяет каждой команде работать в собственной экспериментальной среде, устраняя конфликты при параллельном тестировании.
См. полный список экспериментов
Сущности повсюду
Сущности играют ключевую роль в экосистеме Google — эта тема подробно рассматривалась на конференции “Entities Everywhere”, проведённой Дамьеном Анделем и Сильвеном Доэ из 1492.vision в Марселе в начале года.
Knowledge Graph — центральная нервная система Google
Исследования показывают, что Knowledge Graph — это не просто панель сбоку.
Это центральная нервная система Google: он питает Search, Discover, YouTube, Maps, Assistant, Gemini и AI Overviews.
В основе графа знаний — Livegraph, который назначает вес доверия каждому триплету данных перед тем, как включить его в граф.
Иерархия пространств имён:
- kc: Данные из проверенных источников (официальные данные, госзаписи)
- ss: Извлечённые из интернета «вебфакты»
- hw: Данные, проверенные вручную
Это не просто метки — они определяют уровень доверия и способ использования данных в сервисах Google.
Призрачные сущности и адаптация в реальном времени
Среди самых захватывающих находок — так называемые призрачные сущности — временные структуры, не привязанные к стабильным идентификаторам.
Они позволяют Google быстро реагировать на события:
- Генерация новых сущностей
- Постепенная валидация
- Отображение в результатах по мере необходимости
Системы SAFT и WebRef — как показали утечки 2024 года — непрерывно извлекают, классифицируют и связывают сущности, создавая семантическое представление интернета.
SEO и валидация сущностей
Вывод для SEO-специалистов: ваш бренд должен быть валидированной сущностью в Knowledge Graph Google.
Утечки 2024 года раскрыли векторизацию сайтов и тематические сигналы вроде siteFocusScore
и NSR
, наказывающие разрозненный контент.
Данные из Chrome также вносят вклад:
- Обновление сигналов доверия
- Отслеживание трендов
- Выявление посещаемых сущностей
Здесь важна не просто масса контента, а согласованность, подтверждённая несколькими источниками и встроенная в тематический граф.
Подробнее — в докладе “Entities Everywhere: The Knowledge Graph, the Invisible Architecture of the Google Empire” от 1492.vision.
AI Mode Google: 90 проектов и созвездие агентов
Последние находки дали доступ к внутреннему debug-меню Google (доступно только в сети компании или через VPN).
Версия от 28 мая 2025 года содержит почти 90 проектов — на 40 больше, чем в предыдущей утечке.
Созвездие узкоспециализированных агентов
Google делает ставку не на универсального помощника, а на множество агентов:
- MedExplainer — здоровье
- Travel Agent, Flight Deals — путешествия
- Neural Chef, Food Analyzer, Smart Recipe — еда
- News Digest, Daily Brief — новости
- Shopping AI Studio — шопинг
Проект Magi — основа AI Mode
Более 50 экспериментов относятся к Project Magi:
MagiModelLayerDomain
: ядро инфраструктурыMagitV2p5Launch
: связана с Gemini 2.5SuperglueMagiAlignment
: отслеживание взаимодействий
Наиболее продвинутый: MagitCotRev15Launch
— уже 15-я итерация.
Использует Chain-of-Thought (Цепочку мышления):
Reflect → Research → Read → Synthesize → Polish
AIM (AI Mode) и новый интерфейс
Проект AIM (AI Mode) фокусируется на UI:
AimLhsOverlay
: AI-панель сбокуSbnAimEntrypoints
: кнопка «Мне повезёт» как точка входа- Интерактивный логотип Google
Также появляются StatefulJourney
и ContextBridge
— переход от отдельных запросов к полноценным сессиям общения.
SEO-выводы из AI Mode
- Гиперспециализация: контент должен соответствовать уровню экспертных агентов
- Мультимодальность: текст, изображения, видео, структурированные данные
- Глубокая персонализация: контекст на уровне сессии важнее отдельных запросов
Подробнее — в статье “AI at the Heart of Google’s Strategy” от RESONEO.
Система профилирования: Улыбнитесь, вы — вектор!
Исследование показывает: Google превращает каждое цифровое взаимодействие в вектор — математическое представление вашей цифровой идентичности.
В центре этой системы — Nephesh, универсальная основа профилирования пользователя.
Она генерирует векторы предпочтений и поведения во всех продуктах Google.
Как показали утечки 2024 года:
- Оценивается типичный/нетипичный профиль
- Вычисляется вероятность взаимодействия с контентом по векторному совпадению
Picasso и VanGogh — дуальная векторизация Discover
- Picasso — долгосрочный профиль (STAT и LTAT)
- VanGogh — на устройстве, фиксирует сигналы в реальном времени (состояние устройства, прокрутка и др.)
Системы синхронизированы: мгновенные потребности + долгосрочные интересы.
Специализированные векторы
- Вертикальные (подкасты, видео, путешествия и т. д.)
- Временные (мгновенные, краткосрочные, долговременные)
- Контекстные (учёт ситуации)
Система HULK идёт ещё дальше: определяет, едете ли вы на машине, спите, едете в лифте — и использует эти данные для персонализации.
Также отслеживаются места (SEMANTIC_HOME
, SEMANTIC_WORK
) и предсказываются будущие перемещения.
Подробнее — в статье “Smile, you’re being embedded!” от 1492.vision.
Понимание запросов: Расширение и оценка в реальном времени
Ещё одно открытие — расширение запросов и система оценки в реальном времени.
Пример: cycling tour france
→ bigram cyclingtour
, дополнения: bike
, bicycle
, trips
Спецмаркеры:
iv;p
: точное совпадениеiv;d
: языковая производная
Геоинтеллект
Запрос: nail salon fort lauderdale 17th street
:
- Гео-категория:
geo:ypcat:manicuring
- Код зоны:
geo;88d850000000000
- Вариации адресов
- Перевод терминов в зависимости от местоположения
Подтверждена работа архитектуры из утечек 2024:
GWS → Superroot → QUS → QBST
Оценка терминов в реальном времени
Каждому термину даётся 0–10 баллов на URL:
- Стоп-слова игнорируются
- Термины из заголовков получают бонус
- Именованные сущности почти всегда получают максимум
Система учитывает контекст: один и тот же термин может иметь разные баллы в зависимости от запроса.
Это соответствует Salient Terms Process Google (виртуальный tf, idf, значимость и пр.)
Финальный рейтинг зависит от других факторов (NavBoost, свежесть и др.), но эта система определяет, как интерпретируются запросы.
Подробнее — в статье “Uncovering Google’s Query Expansion System” от RESONEO.
Вся информация получена из открытых источников без обхода защиты. Публикуется исключительно в информационных целях.
Материал подготовлен по материалам Search Engine Land.