Microsoft MAI-Transcribe-1: El nuevo estándar de oro en transcripción IA

Microsoft ha dejado de depender exclusivamente de sus socios para liderar el sector. Con el lanzamiento de MAI-Transcribe-1, su tercer modelo de desarrollo propio tras MAI-Voice-1 y MAI-Image-2, la compañía reclama el trono de la conversión de voz a texto con una precisión que roza la perfección humana.

El benchmark FLEURS: Una victoria en 25 idiomas

La cifra que todo el mundo está comentando en la industria es el 3,9% de WER (Word Error Rate). Para ponerlo en contexto:

  • Precisión imbatible: En la prueba FLEURS, el modelo ha logrado una tasa media de error de solo el 3,9% en 25 idiomas clave (incluyendo español, chino y francés).
  • Superando a los gigantes: MAI-Transcribe-1 ha liderado la clasificación en 11 idiomas principales. En los 14 restantes, ha logrado superar a Whisper-large-v3 de OpenAI y al reciente Gemini 3.1 Flash de Google en 11 de ellos.
  • Consistencia: A diferencia de otros modelos que «alucinan» o fallan en idiomas menos comunes, el modelo de Microsoft mantiene una precisión constante en todo su espectro lingüístico.
Microsoft MAI Transcribe 1

Más rápido, más barato, más MAI

Microsoft no solo ha optimizado los pesos del modelo para la precisión, sino también para el bolsillo y el tiempo de computación:

  1. Velocidad de vértigo: El modelo es 2,5 veces más rápido en transcripción por lotes que el servicio Microsoft Azure Fast.
  2. Coste disruptivo: Se ofrece a 0,36 dólares por hora. Microsoft afirma que, a día de hoy, es la opción más rentable de todos los proveedores de servicios cloud.
MAI Transcribe 1 1

Nota técnica del Gurú: Aunque de momento no admite transcripción en tiempo real ni separación de locutores (diarización), su despliegue en la plataforma Microsoft Foundry indica que estas funciones llegarán en actualizaciones inminentes.

¿Crees que un 3,9% de error es suficiente para sustituir a los transcriptores humanos en juicios o medicina? ¿Es este el fin de las «alucinaciones» en la transcripción de idiomas que no son el inglés?

Déjanos tu opinión en los comentarios y únete a la discusión en InstagramFacebook y YouTube.

Alfredo Santiago Martín
Alfredo Santiago Martín
Ingeniero Químico, Máster en Aplicaciones Multimedia por la UOC y un apasionado de la Ciencia y de la Tecnología desde que tiene conocimiento de causa. Se define como un Geek en un mundo imperfecto. Ciudadano del mundo y nómada por suerte, su hábitat natural transcurre entre ordenadores y máquinas con muchos cables y botones. CEO y Fundador de GurúTecno.

Últimos artículos

1.330 Seguidores
Seguir

Artículos relacionados

Cuéntanos tu opinión

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.