Google mueve ficha en el tablero de la democratización de la inferencia y nos demuestra que, en la guerra por el control del asistente definitivo, regalar la capacidad de razonar paso a paso es el mejor caballo de Troya para fidelizar los escritorios de medio mundo.
Hasta la fecha, los modelos de IA comerciales solían pecar de impulsivos: en cuanto le dabas al botón de enviar, el algoritmo escupía la primera estructura de texto que casaba probabilísticamente con tu prompt. Con el nuevo selector de niveles de pensamiento, Google divide la experiencia en dos flujos de trabajo claros basados en sus últimos modelos Gemini 3.5 Flash y Gemini 3.5 Flash-lite:
- Modo Estándar: El comportamiento clásico. Respuestas directas, concisas y optimizadas para minimizar la latencia. Ideal para consultas rápidas, resúmenes de texto planos o comandos sencillos.
- Modo Extendido (Thinking): El motor frena, reserva recursos de computación en la nube y se toma su tiempo para desglosar el problema paso a paso antes de responder. Analiza dependencias, busca contradicciones lógicas y elabora una cadena de razonamiento interno mucho más precisa. Es la herramienta perfecta si le vas a pedir ayuda con código informático avanzado o problemas matemáticos densos.
Paso a paso: Cómo activar el pensamiento profundo en tu pantalla
El despliegue global ya se ha completado en los servidores, por lo que no necesitas actualizar ninguna API de desarrollo ni picar código extraño para empezar a usarlo:
- Entra en la app oficial de Gemini en tu smartphone o accede a la interfaz web clásica.
- Despliega el selector de modelos situado en el menú superior de la pantalla.
- En la nueva sección bautizada como ‘Thinking’, haz clic sobre la pestaña ‘Extended’ (o Extendido si tienes la interfaz en castellano). A partir de ese momento, verás cómo la IA muestra una pequeña animación que resume sus pasos de pensamiento lógico antes de pintarte el resultado final en la pantalla.

El tablero de la inferencia de Google (junio 2026)
| Modelo de Gemini (Línea 3.5) | Nivel de pensamiento óptimo | Ventaja principal en el IDE / Web | Inconveniente crítico / Consumo |
| Gemini 3.5 Flash Lite | Estándar (sin retraso de procesamiento) | Mínima latencia, respuestas directas en milisegundos | Estructuras de texto simples (Poco apto para lógica) |
| Gemini 3.5 Flash | Extendido (razonamiento activado) | Precisión matemática y depuración de código avanzada | Quema el límite de uso gratuito a velocidad de vértigo |
| Gemini 3.5 Pro | Estándar / Extendido Avanzado | Ideal para grandes volúmenes de datos y prompts largos | Requiere suscripción activa en entornos exigentes |
| Google AI Ultra (de pago) | Modo Pensamiento Profundo (Deep Thinking) | Máximo razonamiento agéntico y planificación multi-archivo | Exclusivo del plan premium de Google One AI Premium |
El anzuelo del pensamiento gratis para camuflar el hachazo de la cuota de tokens
Que Google regale una función de razonamiento avanzado sin obligarte a pasar por su pasarela de pago mensual es un movimiento de marketing brutal que va a hacer mucho daño a los planes premium de la competencia. Ver cómo la IA desglosa su lógica antes de escupirte una función en Python es una delicia visual e informática para cualquier desarrollador que trabaje con Copilot.
Pero bajemos del optimismo corporativo y hablemos claro del peaje oculto que esconde esta actualización: el modo extendido es una trituradora silenciosa de tokens diseñada para obligarte a pagar la suscripción tarde o temprano.
La propia Google lo admite con la boca pequeña en sus notas de uso: activar el pensamiento extendido «puede agotar tu límite de uso mucho más rápido». Hacer que una IA piense paso a paso exige que el modelo genere miles de tokens invisibles de razonamiento interno antes de escribirte la respuesta definitiva.

Para un usuario gratuito que use el sistema de forma casual, dejar el modo Extended encendido por defecto equivale a suicidar su cuota diaria de mensajes en apenas tres o cuatro consultas complejas. Es una jugada psicológica brillante: te dan gratis la miel de la precisión absoluta, te acostumbras a la calidad del razonamiento profundo y, cuando te quieres dar cuenta, el sistema te bloquea la pantalla con el cartelito de «Has agotado tu límite, vuelve a Gemini Flash Lite o pásate al plan Pro«. Nos venden altruismo algorítmico, pero lo que buscan es que consumas tus recursos a ritmo de vértigo para empujarte directo hacia su pasarela de pago. Úsalo con cabeza en tu día a día o te quedarás sin IA a las primeras de cambio.
Viendo que el modo de pensamiento extendido es gratuito pero devora la cuota de mensajes diaria en un suspiro, ¿lo dejaréis activado por defecto para vuestras tareas de programación o preferís la velocidad estándar para estirar los tokens gratis? ¿Creéis que este movimiento de Google forzará a OpenAI y Anthropic a liberar por completo sus modos de razonamiento avanzado en las cuentas básicas?
Déjanos tu opinión en los comentarios y únete a la discusión en Instagram, Facebook y YouTube.
