Stability AI lanza Stable Audio 3.0: Música de 6 minutos con IA local

Stability AI demuestra que hay vida más allá de las grandes corporaciones cerradas. Al darnos herramientas como el inpainting y los pesos abiertos de sus modelos intermedios, ponen en manos de cualquier creador independiente un estudio de sonido automatizado. ¡A entrenar vuestros propios LoRAs musicales, que el búnker hoy tiene banda sonora nueva!

La gran evolución de esta versión con respecto a lo que vimos en 2024 es la gestión del tiempo y la estructura. Generar un ritmo es fácil, pero mantener el sentido de la melodía, la introducción, el clímax y el desenlace durante más de seis minutos sin que la IA «delire» es un hito de ingeniería acústica brutal.

La democratización del silicio: Cuatro modelos para cada necesidad

Stability AI ha dividido la familia para que puedas usarla tanto si tienes un superordenador como si quieres componer desde el autobús con tu smartphone:

Small SFX (459M de parámetros): El hermano pequeño, ultraoptimizado para crear efectos de sonido (foley, explosiones, ambiente) directamente en local en un móvil o portátil convencional.
Small (459M de parámetros): Orientado a la composición musical completa pero optimizado para funcionar sin conexión a internet en hardware de consumo.
Medium (1.400M de parámetros): El equilibrio perfecto. Genera pistas completas de hasta 6 minutos y 20 segundos con pesos abiertos para descarga.
Large (2.700M de parámetros): El titán de la familia. Pensado para plataformas comerciales de alto volumen y baja latencia, disponible exclusivamente a través de API de pago.

Lo mejor de todo: Small SFX, Small y Medium son de pesos abiertos. Te los puedes descargar hoy mismo desde Hugging Face, modificarlos y, gracias a la licencia comunitaria de Stability AI, comercializar todo lo que generes con ellos (siempre que tu organización facture menos de un millón de dólares al año).

Las herramientas definitivas para el productor moderno

A nivel técnico, Stable Audio 3.0 introduce tres características que van a dejar obsoletos a muchos bancos de sonidos tradicionales:

Autocodificador Semántico-Acústico: Ya no estás esclavo de duraciones fijas. Puedes pedirle a la IA por prompt una sección exacta de «43 segundos de Jazz de baja fidelidad» y el modelo clavará la precisión del tiempo al segundo.
Soporte nativo para LoRA: La clave para los artistas. Puedes coger tu propia biblioteca de muestras o tus sintetizadores grabados, entrenar un LoRA ligero y hacer que la IA componga música siguiendo exclusivamente tu estilo personal y tus sonidos.
Inpainting de Audio: ¿Tienes una pista perfecta pero el solo de guitarra del medio no te convence? Seleccionas ese fragmento, le pides a la IA que lo «rellene» con un saxofón y el sistema restaurará ese segmento integrándolo de forma orgánica con el tempo y la tonalidad del resto de la canción.

El tablero de la generación de audio (2026)

Característica	Stable Audio 2.0 (2024)	Stable Audio 3.0 (Hoy)
Duración máxima	~3 minutos	+6 minutos y 20 segundos
Acceso al código	Limitado / Web	Pesos abiertos (Small/Medium en Hugging Face)
Personalización	No nativa	Entrenamiento LoRA documentado de serie
Derechos legales	Disputas por fuentes de datos	100% datos licenciados (acuerdos con Warner y Universal)
Uso en dispositivo	Requiere servidores en la nube	Pequeños modelos ejecutables en local (Móvil/PC)

El blindaje corporativo frente a la rebelión de los músicos

El lanzamiento de Stable Audio 3.0 es una obra maestra técnica, pero su trasfondo nos enseña cómo Stability AI ha tenido que claudicar ante las reglas del capitalismo tradicional para no morir en los tribunales. El gran logro del que presumen hoy —estar limpios de demandas gracias al entrenamiento con datos totalmente licenciados y acuerdos con gigantes como Warner Music Group y Universal Music Group— es al mismo tiempo la soga que ata al modelo.

Al aliarse con las grandes discográficas para evitar el destino judicial de Stable Diffusion, Stability AI se asegura que las canciones generadas sean legales y comercializables, pero limita la «anarquía creativa» que hizo famosa a la IA generativa. Los modelos de pesos abiertos son un caramelo para la comunidad, pero el modelo Large, el verdaderamente potente y capaz de producir éxitos de alta fidelidad a escala masiva, se queda encerrado tras el muro de pago de una API. Además, esto nos deja una verdad incómoda: la música de fondo para vídeos, videojuegos independientes y publicidad va a pasar a costar cero euros en cuestión de meses. Los compositores de stock y diseñadores de sonido se enfrentan a un escenario laboral dantesco donde competir contra un modelo Small gratuito que corre en un teléfono móvil es, sencillamente, imposible. La música se vuelve infinita, pero el valor del trabajo humano vuelve a cotizar a la baja.

¿Crees que el soporte LoRA de Stable Audio 3.0 ayudará a los músicos a expandir su creatividad con sus propios sonidos o acabará inundando las plataformas de streaming de clones de artistas famosos? Sabiendo que los modelos entrenados con datos de Warner y Universal son legales, ¿utilizarías esta IA para crear la banda sonora de tus proyectos comerciales sin miedo a reclamaciones de copyright?

Déjanos tu opinión en los comentarios y únete a la discusión en Instagram, Facebook y YouTube.

Cuéntanos tu opinión

Por favor ingrese su comentario!

Por favor ingrese su nombre aquí

¡Has introducido una dirección de correo electrónico incorrecta!

Por favor ingrese su dirección de correo electrónico aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Stable Audio 3.0: Canciones de 6 minutos hechas en local y con derechos comerciales listos

La democratización del silicio: Cuatro modelos para cada necesidad

Las herramientas definitivas para el productor moderno

El tablero de la generación de audio (2026)

El blindaje corporativo frente a la rebelión de los músicos

Oportunidad de oro antes del Unpacked: El Samsung Galaxy Z Fold7 se desploma más de 400 euros en Amazon

La UE acorrala a Meta: Multas millonarias a la vista si no elimina el «scroll infinito» de Instagram y Facebook

ChatGPT Trabajo: La nueva IA que crea presentaciones y Excel sola

La OPV de SpaceX desata una lluvia de millonarios: Elon Musk celebra el éxito de sus empleados

Cuéntanos tu opinión

Stable Audio 3.0: Canciones de 6 minutos hechas en local y con derechos comerciales listos

La democratización del silicio: Cuatro modelos para cada necesidad

Las herramientas definitivas para el productor moderno

El tablero de la generación de audio (2026)

El blindaje corporativo frente a la rebelión de los músicos

Oportunidad de oro antes del Unpacked: El Samsung Galaxy Z Fold7 se desploma más de 400 euros en Amazon

La UE acorrala a Meta: Multas millonarias a la vista si no elimina el «scroll infinito» de Instagram y Facebook

ChatGPT Trabajo: La nueva IA que crea presentaciones y Excel sola

La OPV de SpaceX desata una lluvia de millonarios: Elon Musk celebra el éxito de sus empleados

ChatGPT Trabajo: La nueva IA que crea presentaciones y Excel sola

Meta abre la API de Muse Spark: El contraataque comercial contra OpenAI y Anthropic ya tiene precio

Microsoft pasa la factura de la IA: Office sube de precio y los reguladores europeos se ponen serios

Cuéntanos tu opinión