La inteligencia artificial ya no solo escribe textos, genera imágenes o responde correos. Ahora también compone canciones completas con letra, voz y hasta video, partiendo de algo tan simple como una fotografía. Lyria 3 es el nuevo modelo de música generativa desarrollado por Google DeepMind.
Cualquier usuario puede crear una producción musical a partir de una descripción o de una imagen. Basta con escribir algo como “un R&B cómico y lento sobre un calcetín que encuentra a su pareja” y, en cuestión de segundos, Gemini lo transforma en una pista pegajosa y de alta calidad, con voz y letra generadas por IA.
Lo más relevante del salto entre la versión anterior y Lyria 3 es que deja de ser una herramienta técnica y experimental para convertirse en un colaborador creativo mucho más intuitivo y humano.
Mientras que la versión pasada estaba enfocada principalmente en la fidelidad del audio instrumental y requería que el usuario tuviera una idea muy clara de la estructura musical, el nuevo modelo introduce la capacidad de generar voces y letras de forma autónoma. Esto significa que ya no necesitas ser compositor ni escribir tus propios versos para obtener una canción completa.
Plataformas como Suno o Udio han demostrado que la generación de música por IA puede alcanzar niveles de calidad sorprendentes. De acuerdo con datos de la Federación Internacional de la Industria Fonográfica (IFPI), el mercado global de música grabada superó los 28 mil millones de dólares en 2023, y los analistas estiman que las herramientas de IA tendrán un impacto creciente en la producción, distribución y monetización del contenido hacia 2026.

¿Cómo convertir una foto en canción?
Uno de los cambios fundamentales en Lyria 3 es la integración de la multimodalidad en el proceso creativo. Antes, la interacción estaba limitada casi exclusivamente al texto. Ahora, el modelo permite usar fotos y videos como punto de partida.
Esto significa que puedes subir imágenes de un viaje, de tu mascota o de un momento especial, y el sistema es capaz de “leer” el contenido visual para traducir esa atmósfera en un género musical específico. No se trata solo de describir lo que ve, sino de capturar el tono emocional de la escena.
Por ejemplo, puedes pedir: “Usa estas fotos para crear una canción sobre mi perro Duncan en una caminata por el bosque”. Gemini analizará el entorno visual, la iluminación, colores y el contexto para proponer una banda sonora original con letras que encajen con ese ambiente.
Además, Lyria 3 ofrece mayor precisión sobre elementos como el estilo vocal, el tempo y la complejidad musical. El resultado son pistas menos robóticas y con arreglos más ricos, acercándose cada vez más a producciones profesionales.
Lyria 3 está disponible dentro de la aplicación Gemini para usuarios mayores de 18 años en español, inglés, alemán, francés, hindi, japonés, coreano y portugués. Se lanza inicialmente en la versión de escritorio y llegará a la aplicación móvil en los próximos días.
Los suscriptores de Google AI Plus, Pro y Ultra contarán con límites más altos de generación, lo que apunta a un modelo freemium donde la creatividad ilimitada tiene un costo adicional.









