Saltar al contenido
Gurú Tecno

OpenAI revoluciona la IA: lanza o3 y o4-mini, modelos que razonan con imágenes y herramientas integradas

abril 17, 2025

OpenAI ha vuelto a sacudir el panorama de la inteligencia artificial con el lanzamiento oficial de sus nuevos y avanzados modelos de razonamiento: o3 y o4-mini. Estas incorporaciones a su «serie o», dedicada al razonamiento profundo, prometen un salto cualitativo en las capacidades de la IA, destacando por su habilidad para «pensar con imágenes» y utilizar herramientas de forma autónoma, todo ello ya disponible para usuarios y desarrolladores, incluso en la versión gratuita de ChatGPT.

La evolución del razonamiento: la serie ‘o’

Siguiendo los pasos de sus predecesores o1 y 03-mini (lanzado en enero de 2025), los nuevos o3 y o4-mini están diseñados específicamente para abordar tareas que requieren una deliberación más extensa y un razonamiento lógico paso a paso. OpenAI afirma que estos son «los modelos más inteligentes que hemos lanzado hasta la fecha», estableciendo un nuevo estándar en dominios complejos como las matemáticas avanzadas, la ciencia, la codificación y la escritura técnica.

Más allá del texto: «pensar con imágenes» y herramientas inteligentes

Una de las innovaciones más destacadas es la capacidad multimodal nativa, especialmente el razonamiento visual. Lo revolucionario no es solo que los modelos vean una imagen, sino que decidan cómo interactuar con ella (girarla, ampliar detalles, ignorar lo irrelevante) como parte integral de su proceso de pensamiento para resolver una consulta.

Además, o3 y o4-mini integran de forma nativa el uso de herramientas, funcionando de manera más «agente». Pueden decidir autónomamente cuándo y cómo:

  • Realizar búsquedas web adaptativas y complejas.
  • Ejecutar código Python para análisis de datos, visualizaciones o simulaciones.
  • Manipular archivos o interpretar gráficos.
  • Incluso generar imágenes (probablemente mediante DALL·E) como parte de una respuesta estructurada.

Cómo de buenos son estos modelos y dónde pueden usarse: buenas noticias para ChatGPT gratis

El lanzamiento de o3 y o4-mini no es solo una actualización más; representa un salto significativo en la capacidad y precisión de la inteligencia artificial de OpenAI. Pero, ¿cuánto han mejorado realmente y qué significa esto para los usuarios?

Rendimiento demostrado: superando barreras en tareas complejas

Los benchmarks y las pruebas internas de OpenAI pintan una imagen clara: estos modelos son excepcionalmente buenos en tareas que requieren un razonamiento profundo. Analizando los datos de rendimiento publicados por OpenAI (ver gráfico):

  • Matemáticas de competición (AIME 2024/2025): o4-mini muestra un rendimiento sobresaliente, alcanzando un 93.4% de precisión en AIME 2024 y un 92.7% en AIME 2025 (sin herramientas), superando consistentemente a o3 (91.6% y 88.9% respectivamente) y dejando muy atrás a modelos anteriores como o1 o o3-mini. Esto demuestra una capacidad matemática de muy alto nivel.
  • Codificación (codeforces): En la competición de código Codeforces, tanto o3 como o4-mini alcanzan puntuaciones ELO de nivel experto (2706 y 2719 respectivamente, usando terminal), una mejora drástica sobre o1 (1891) y o3-mini (2073). Son herramientas muy potentes para desarrolladores.
  • Ciencia y razonamiento experto (GPQA Diamond, Humanity’s Last Exam): En preguntas científicas de nivel doctoral (GPQA), o3 (83.3%) supera ligeramente a o4-mini (81.4%), ambos muy por encima de sus predecesores. En el complejo examen «Humanity’s Last Exam», que requiere el uso de herramientas (navegador, Python), o3 demuestra una capacidad superior (20.32) frente a o4-mini (17.70), aunque ambos muestran cómo el uso de herramientas potencia su razonamiento para abordar problemas multifacéticos.

En resumen, o3 parece ser el rey del razonamiento más complejo y la orquestación de herramientas avanzadas, mientras que o4-mini ofrece una potencia increíblemente cercana (y a veces superior, como en matemáticas) con mayor eficiencia.

Aplicaciones potenciales: más allá de la conversación

Estas capacidades abren un abanico de usos prácticos:

  1. Educación STEM: Tutores personalizados capaces de resolver y explicar problemas complejos de matemáticas, física o química.
  2. Desarrollo de software: Asistencia en codificación, depuración, diseño de algoritmos y resolución de problemas de ingeniería de software (como demuestra SWE-Bench).
  3. Investigación y análisis: Ayuda en la generación de hipótesis, análisis de datos (usando Python integrado), comprensión de diagramas y gráficos complejos (gracias al razonamiento visual).
  4. Resolución de problemas cotidianos: Desde planificar itinerarios complejos hasta analizar informes financieros o comprender documentos técnicos.
  5. Interacción multimodal: Los usuarios pueden subir imágenes (fotos, gráficos, capturas de pantalla) y pedir a los modelos que razonen sobre ellas, las expliquen o extraigan información.

¡Excelentes noticias para los usuarios de ChatGPT gratis!

Quizás la implicación más emocionante es la democratización de esta potencia. OpenAI ha confirmado que o4-mini, el modelo que demuestra un rendimiento tan espectacular en múltiples áreas (especialmente matemáticas y codificación, rivalizando con o3), se está implementando para todos los usuarios de ChatGPT, incluidos aquellos en el plan gratuito.

Esto significa que millones de usuarios ahora tienen acceso sin coste a:

  • Un razonamiento significativamente mejorado para resolver problemas más complejos.
  • La capacidad de interactuar con imágenes («pensar con imágenes»).
  • El uso integrado de herramientas como la navegación web y la ejecución de código Python (donde aplique) para obtener respuestas más completas y precisas.

Es una mejora sustancial que eleva drásticamente el listón de lo que se puede esperar de una IA gratuita, poniendo herramientas de vanguardia al alcance de todos.

Disponibilidad inmediata y un ritmo acelerado

En una muestra de la velocidad vertiginosa de OpenAI, o3 y 04-mini están disponibles desde ayer en la API para desarrolladores y ya se están integrando en ChatGPT para usuarios finales, sin periodos de espera prolongados, incluso en la Unión Europea. Este lanzamiento llega apenas días después de la presentación de la serie GPT-4.1 (14 de abril) y sigue a GPT-4.5 (febrero 2025) y o3-mini (enero 2025), demostrando la existencia de líneas de modelos paralelas (GPT para capacidades generales, ‘o’ para razonamiento especializado).

El lanzamiento de o3 y o4-mini no es solo una actualización incremental; representa un cambio significativo en cómo interactuamos con la IA y lo que podemos esperar de ella, acercando capacidades antes teóricas al uso práctico y cotidiano, y marcando un nuevo hito en la carrera hacia la inteligencia artificial general.

Índice
    Ajustes