OpenAI BiDi: El nuevo modelo de voz que permite interrumpir a ChatGPT sin que se «rompa» la conversación

OpenAI está cansada de los monólogos. Según una filtración de The Information, la compañía de Sam Altman trabaja en BiDi (Bidirectional Speech Model), un modelo de habla bidireccional diseñado para que las conversaciones con la IA sean indistinguibles de una charla humana. La gran novedad: podrás interrumpir a ChatGPT, soltar un «ajá» o cambiar de opinión a mitad de frase, y la IA ajustará su discurso en tiempo real sin detenerse en seco.

Adiós al diálogo por turnos: La era de la fluidez

Hasta ahora, el modo de voz avanzado de ChatGPT funcionaba como un walkie-talkie: tú hablas, él escucha y luego responde. Si te atrevías a decir «vale» mientras él hablaba, el sistema se bloqueaba o se detenía bruscamente.

  • Procesamiento continuo: BiDi escucha mientras habla. Si a mitad de una explicación le pides que cambie de tema, el modelo no descarta lo que estaba diciendo, sino que lo adapta sobre la marcha.
  • El futuro de la atención al cliente: Imagina llamar a un soporte técnico y, mientras te explican cómo devolver un producto, tú dices: «Espera, prefiero cambiarlo». BiDi permite que la IA reconduzca la frase sin caos ni silencios incómodos.

Retrasos y sonidos extraños: El «Frankenstein» de la voz

Aunque OpenAI esperaba lanzar BiDi este trimestre, el modelo aún tiene comportamientos erráticos. Fuentes cercanas al proyecto aseguran que, tras varios minutos de charla, el prototipo puede empezar a emitir sonidos extraños o fallar por completo. Por ello, el lanzamiento se ha pospuesto al segundo trimestre de 2026.

Este avance es vital para el rumoreado altavoz inteligente de OpenAI, un dispositivo sin pantalla que dependerá totalmente de la voz para reservar servicios o leer correos electrónicos.

Debate en el Búnker: ¿Estamos listos para una IA que nos interrumpa?

  1. ¿Más humano o más molesto? ¿Te gusta la idea de una conversación bidireccional o prefieres el sistema de turnos actual para que la IA no te pise la palabra?
  2. El fin de las llamadas al cliente: ¿Confiarías en una IA «BiDi» para resolver un problema bancario o de un seguro, o prefieres seguir hablando con humanos?
  3. Privacidad auditiva: Si la IA está escuchando siempre (incluso mientras ella habla), ¿te preocupa que guarde demasiada información ambiental?
  4. Altavoces inteligentes: ¿Comprarías un altavoz de OpenAI si garantizara una fluidez total como la de la película Her?

Únete a nuestras redes sociales en InstagramFacebook y en YouTube.

Alfredo Santiago Martín
Alfredo Santiago Martín
Ingeniero Químico, Máster en Aplicaciones Multimedia por la UOC y un apasionado de la Ciencia y de la Tecnología desde que tiene conocimiento de causa. Se define como un Geek en un mundo imperfecto. Ciudadano del mundo y nómada por suerte, su hábitat natural transcurre entre ordenadores y máquinas con muchos cables y botones. CEO y Fundador de GurúTecno.

Últimos artículos

1.330 Seguidores
Seguir

Artículos relacionados

Cuéntanos tu opinión

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.