Blog / Una mirada profunda a los sistemas ocultos detrás de la Búsqueda de Google
Una mirada profunda a los sistemas ocultos detrás de la Búsqueda de Google
Descubriendo experimentos activos, infraestructura basada en entidades, agentes de IA y más.
Durante los últimos meses, hemos llevado a cabo una investigación exhaustiva sobre el funcionamiento interno de Google.
Esto condujo a descubrimientos importantes, algunos de los cuales revelamos aquí.
Aunque no podemos divulgar todo, la información a continuación ofrece una comprensión más clara de cómo Google genera y clasifica sus resultados.
Lo que ~1,200 experimentos revelan sobre el funcionamiento interno de Google
Obtuvimos una lista de casi 1,200 experimentos de Google, más de 800 de los cuales estaban activos en junio de 2025.
Este conjunto de datos confirma que muchos componentes mencionados en las filtraciones de 2024 — Mustang, Twiddlers, QRewrite, Tangram, QUS y otros — siguen siendo centrales en el sistema.
También han aparecido nuevos y curiosos nombres en clave: Harmony, Thor, Whisper, Moonstone, Solar, entre otros.
Destacan especialmente DeepNow (sucesor de Google Now) junto con NowBoost, y SuperGlue, posible reemplazo de Glue, el equivalente de NavBoost para la búsqueda universal.
Nube de palabras: 1,200 experimentos
A diferencia de la mayoría de los sitios web, que reciben rediseños cada 3–5 años, Google evoluciona continuamente.
No existe una gran “nueva versión”, sino un flujo constante de microcambios que pasan de experimento a lanzamiento y luego a integración total.
Esto explica la naturaleza escalonada de la lista de experimentos: pruebas antiguas conviven con nuevas, algunas ya en su 15ª iteración (por ejemplo, MagiCotRev15Launch).
Este enfoque incremental reduce el riesgo — los experimentos fallidos afectan solo a un pequeño número de usuarios — y permite un ritmo de innovación que los rediseños tradicionales no pueden igualar.
Áreas cubiertas:
- IA: numerosas variantes de Magi y AIM (AI Mode)
- Compras: más de 50 experimentos dedicados
- Verticales: deportes, finanzas, clima, viajes y más
A cada vertical se le asigna su propio dominio, como:
ShoppingOverlappingDomain
TravelOverlappingDomain
SportsOverlappingDomain
Esto señala una arquitectura donde cada equipo trabaja en su propio entorno de prueba, permitiendo experimentación en paralelo sin conflictos.
Ver lista completa de experimentos
Entidades en todas partes
Las entidades juegan un papel clave en todo el ecosistema de Google — tema explorado a fondo en la charla “Entities Everywhere” de Damien Andell y Sylvain Deauré de 1492.vision, en Marsella.
El Knowledge Graph — El sistema nervioso central de Google
Las investigaciones muestran que el Knowledge Graph es mucho más que un panel lateral.
Funciona como el sistema nervioso central de Google: alimenta Search, Discover, YouTube, Maps, Assistant, Gemini y AI Overviews.
En su núcleo está Livegraph, que asigna niveles de confianza a cada triple de datos antes de integrarlo en el grafo.
Jerarquía de espacios de nombres:
- kc: Datos altamente verificados (registros oficiales)
- ss: “Webfacts” extraídos de la web
- hw: Información curada manualmente
Estas etiquetas no son cosméticas — afectan directamente el nivel de confianza y cómo se usan los hechos en los servicios de Google.
Entidades fantasma y adaptación en tiempo real
Uno de los hallazgos más fascinantes: entidades fantasma — estructuras temporales sin identificadores estables.
Permiten a Google:
- Generar nuevas entidades dinámicamente
- Validarlas progresivamente
- Mostrarlas en resultados en tiempo real
Esto es respaldado por SAFT y WebRef, sistemas que (según las filtraciones de 2024) extraen, clasifican y enlazan entidades para construir un mapa semántico del web.
SEO y validación de entidades
Conclusión clave para profesionales de SEO: tu marca debe existir como una entidad validada en el Knowledge Graph de Google.
Las filtraciones de 2024 revelaron que Google vectoriza sitios enteros, calculando señales temáticas como siteFocusScore
y NSR
, que penalizan el contenido disperso.
Los datos de navegación en Chrome también influyen:
- Actualización de señales de confianza
- Seguimiento de tendencias emergentes
- Identificación de entidades visitadas
En este entorno, importa menos la cantidad de contenido y más si tu sitio es una entidad bien conectada dentro de un grafo temático coherente.
Más información en “Entities Everywhere: The Knowledge Graph, the Invisible Architecture of the Google Empire” por 1492.vision.
Modo IA de Google: 90 proyectos y una constelación de agentes
Recientes descubrimientos revelaron un menú de depuración interno de Google (visible solo en red corporativa o vía VPN).
La versión del 28 de mayo de 2025 enumera casi 90 proyectos — 40 más que en versiones anteriores.
Una constelación de agentes especializados
Google no construye un asistente universal, sino muchos agentes especializados:
- MedExplainer — salud
- Travel Agent, Flight Deals — viajes
- Neural Chef, Food Analyzer, Smart Recipe — cocina
- News Digest, Daily Brief — noticias
- Shopping AI Studio — comercio
Proyecto Magi: La columna vertebral del Modo IA
Más de 50 experimentos pertenecen al Project Magi:
MagiModelLayerDomain
: infraestructura centralMagitV2p5Launch
: vinculado a Gemini 2.5SuperglueMagiAlignment
: seguimiento del comportamiento de usuarios
El más avanzado: MagitCotRev15Launch
— ya en su 15ª iteración.
Usa razonamiento en Cadena de Pensamiento:
Reflexionar → Investigar → Leer → Sintetizar → Pulir
AIM (Modo IA) y la nueva interfaz
El proyecto AIM se enfoca en la interfaz de usuario:
AimLhsOverlay
: barra lateral con IASbnAimEntrypoints
: convierte el botón “Voy a tener suerte” en una puerta de entrada IA- El logotipo de Google se vuelve interactivo
También aparecen StatefulJourney
y ContextBridge
, señalando el paso de consultas aisladas a sesiones conversacionales.
Ver menú de depuración de AI Mode
Implicaciones SEO del Modo IA
- Hiperespecialización: el contenido debe coincidir con la especialización de cada agente
- Multimodalidad: texto, imágenes, video y datos estructurados alimentan los agentes
- Personalización profunda: el contexto de la sesión es más relevante que la consulta individual
Más en “AI at the Heart of Google’s Strategy” por RESONEO.
Motor de perfiles: ¡Sonríe, estás siendo embebido!
Nuestra investigación reveló que cada interacción digital se transforma en un vector: una incrustación matemática de tu identidad.
En el centro de esto está Nephesh — el sistema universal de representación del usuario de Google.
Genera vectores de comportamiento a partir de todos los productos de Google.
Según las filtraciones de 2024:
- Evalúa si eres un perfil “típico” o “atípico”
- Predice tu probabilidad de interacción por coincidencia entre tus vectores y los del contenido
Picasso y VanGogh — Embeddings duales para Discover
- Picasso: memoria a largo plazo (ventanas STAT y LTAT)
- VanGogh: se ejecuta en el dispositivo, captura señales en tiempo real (scroll, estado del dispositivo, consultas)
Ambos trabajan juntos para equilibrar necesidades inmediatas e intereses duraderos.
Constelación de embeddings
- Verticales: podcasts, video, viajes, compras
- Temporales: en tiempo real, corto y largo plazo
- Contextuales: adaptados a la situación
El sistema HULK lleva el análisis de comportamiento al extremo:
Detecta si estás:
- EN_VEHÍCULO
- EN_BICICLETA
- EN_ESCALERAS
- EN_ELEVADOR
- DURMIENDO
También identifica lugares frecuentes (SEMANTIC_HOME
, SEMANTIC_WORK
) para anticipar destinos y personalizar resultados.
Más en “Smile, You’re Being Embedded!” por 1492.vision.
Comprensión de consultas: Expansión y puntuación en tiempo real
Hemos descubierto cómo Google expande y evalúa consultas en tiempo real.
Ejemplo: cycling tour france
→ Se agrupa como cyclingtour
y se expande a bike
, bicycle
, trips
Aparecen marcadores especiales:
iv;p
: coincidencias literalesiv;d
: derivaciones lingüísticas
Inteligencia geográfica
Consulta: nail salon fort lauderdale 17th street
- Categoría:
geo:ypcat:manicuring
- Código de zona:
geo;88d850000000000
- Variaciones de dirección
- Traducción automática según intención local
Confirmado: la arquitectura filtrada en 2024 sigue activa:
GWS → Superroot → QUS → QBST
Puntuación de términos en tiempo real
Cada término recibe de 0 a 10 puntos por URL:
- Las stopwords se ignoran
- Términos en el título obtienen bonificaciones
- Las entidades nombradas suelen recibir la puntuación máxima
La puntuación es dependiente del contexto — un mismo término puede tener diferentes puntuaciones según la consulta.
Esto se alinea con el proceso Salient Terms, que usa virtualTf
, idf
, salience
, etc.
No define el ranking final (NavBoost, frescura, y otros factores dominan), pero influye en cómo se interpretan las consultas.
Más en “Uncovering Google’s Query Expansion System” por RESONEO.
Toda la información proviene de fuentes públicas y fue obtenida sin violar controles de acceso. Publicado solo con fines informativos.
Este material fue preparado a partir de contenido de Search Engine Land.