Google anunciou MusicLM, intelixencia artificial que crea música a partir das palabras que escribes, como DALL-E 2. É un modelo de linguaxe creado por Google Research. Ademais, o deseñaron exclusivamente para a creación musical.
Ademais, foi adestrado nun amplo conxunto de datos de ficheiros de música e pode producir música nunha variedade de estilos e formas. Se che interesa a música; entón deberías comprobar o que ofrecerá MusicLM.
Con MusicLM produces música nalgunhas técnicas e formas. Por exemplo, podes crear pezas de piano, ritmos de batería e melodías para as letras.
Ademais, podes afinar certos estilos ou incluír entradas proporcionadas polo usuario. Está destinado a producir música cohesionada harmonicamente e rítmicamente. Entón, mergullémonos e vexamos de que se trata MusicLM.
Intentos anteriores
MusicLM non é o primeiro sistema de música xerado por intelixencia artificial. Riffusion, Dance Diffusion, AudioML de Google e OpenAI Jukebox son exemplos de enfoques comparables. Non obstante, estes sistemas anteriores víronse limitados por restricións tecnolóxicas.
Ademais, a súa falta de datos de adestramento dificultou a composición de melodías de alta calidade. Non obstante, MusicLM ten a capacidade de crear música cun maior nivel de sofisticación e realismo.
Visión xeral MusicLM
MusicLM aprende a estrutura e o estilo da música. Polo tanto, adestrase nun amplo conxunto de datos de ficheiros MIDI e de música simbólica. Como os seus programas similares, MusicLM está construído sobre a arquitectura Transformer.
Usando técnicas de autoatención para concentrarse en compoñentes de entrada particulares, a arquitectura transformadora de MusicLM úsase para extraer a estrutura e o estilo da música dun gran conxunto de datos. Como resultado, podes crear música armónica e rítmicamente cohesionada.
E, esta música pode imitar a organización da entrada do usuario. Así, poderás obter o resultado musical que describes especificamente no programa.
O éxito do anterior modelos lingüísticos, como GPT-2 e GPT-3, que demostraron a súa capacidade para crear unha escritura coherente e fluída, inspiraron MusicLM. MusicLM, pola súa banda, é o primeiro modelo de linguaxe que se construíu exclusivamente para a xeración musical.
E, pensamos que será considerado un dos modelos máis sofisticados.
Como funciona isto?
DALL-E 2 e MusicLM de Google intelixencia artificial comparten moitas semellanzas estruturais. Esta vez, porén, a túa escrita transmítese musicalmente máis que visualmente. Neste punto, podes construír completamente unha peza enteira. Ademais, pode xerar ritmo usando só un instrumento.
Podes ver varios estudos de mostra creados polo equipo de IA de Google na páxina Github de MusicLM. Aínda que a IA aínda está en fase de investigación e desenvolvemento, os sons que pode facer son de alta resolución. Ademais, houbo suxestións, como integrar esta IA con ChatGPT. Esta integración podería levar a música máis complexa e creativa.
De tarareas a melodías de éxito
MusicLM combina catro modelos de IA distintos: MuLan, AudioLM, w2v-BERT e Soundstream. Aínda que cada un destes modelos ten un conxunto de capacidades distintivas. Non obstante, cando se integraron, deron lugar a MusicLM!
Músicos e profesionais do sector decatáronse da capacidade de MusicLM para transformar ata os zumbidos e murmurios máis básicos en melodías completas. Ao combinarse con ChatGPT, pode producir música única.
Podes escoitar e explorar a música e os sons creados por MusicLM . Pero hai que ter en conta que actualmente está en fase de proba. É obvio que MusicLM ten a capacidade de transformar completamente o negocio da música a medida que se desenvolve a tecnoloxía.
Música xerada pola IA con matices humanos
Para producir cancións que teñan sentido a partir de descricións completas, MusicLM foi adestrado nun gran conxunto de datos de 280,000 horas de música. Por exemplo, podes crear "unha melodía dubstep melódica cun grave profundo e ritmos de batería sofisticados". Ou, podes pedir que cree "unha canción pop atractiva cun riff de guitarra cativante e un vocalista contundente". A túa imaxinación é o límite neste caso.
As cancións producidas aseméllanse ás compostas por músicos humanos. As mostras de MusicLM son moi sorprendentes. É certo sobre todo tendo en conta que non hai ningún humano implicado no proceso de composición. MusicLM pode repetir aspectos matizados como riffs musicais, melodías e emocións. Ademais, funciona mesmo cando se dan especificacións complicadas e explícitas.
Características importantes
Pintura Lenda Acondicionamento
Painting Caption Conditioning é unha función MusicLM. Podes producir música a partir dunha descrición textual ou un "subtítulo" dunha pintura. Isto implica que MusicLM é capaz de crear música que capture as emocións, os estados de ánimo e as ideas expresadas nunha imaxe. Esta capacidade é moi útil para facer música para películas, videoxogos, e todo tipo de medios visuais.
Story Mode
A función do modo historia toma un texto da historia como entrada. Polo tanto, crea música de fondo acompañante. Os usuarios poden utilizar esta función para crear unha banda sonora para un conto, un videoxogo ou unha película representando o escenario ou o ton emocional.
O modo Historia é unha ferramenta útil para artistas multimedia. Así, pode xerar unha ampla gama de estilos e instrumentos musicais. O modo conto de MusicLM aumenta o impacto emocional dunha escena. Así, os espectadores poden ter un grao adicional de inmersión na historia.
Nivel de experiencia músico
Podes personalizar a dificultade da música creada. Os usuarios poden escoller entre tres niveis en función do seu nivel de habilidade. Ademais, poden especificar o grao de complexidade preferido: principiante, intermedio ou avanzado.
Esta función axúdache se tes un pouco de coñecementos musicais e queres experimentar con novas composicións. Non obstante, se es un músico experimentado, pode crear música sofisticada e sutil. O obxectivo de MusicLM con esta función é ofrecer unha experiencia accesible para todos os usuarios.
Diversidade de xeración
Coa función Generation Diversity, podes producir moitas versións dunha canción a partir da mesma entrada. E, podes ter unha gama variada de saídas. Isto implica que a IA pode xerar varias versións dunha canción.
Ademais, hai melodías alternativas ou progresións de acordes, mantendo o estilo e estrutura básicas da canción. Esta función axuda a que a creación musical da IA sexa máis creativa. Polo tanto, fai que a creación musical sexa máis análoga á composición humana.
Posibles limitacións de MusicLM
Google aínda non puxo MusicLM a disposición do público en xeral xa que aínda está en desenvolvemento. Polo tanto, aínda non podes dar mostras particulares dos tipos de música que MusicLM pode producir. Ademais, aínda se descoñece un pouco que restricións podería ter MusicLM.
Como a tecnoloxía aínda está nos seus primeiros estadios, podería ter certas restricións sobre o calibre da música que se produce ou a súa capacidade para xestionar entradas particulares.
A calidade distorsionada das mostras producidas é un dos principais inconvenientes. Este é un subproduto necesario do procedemento de adestramento utilizado para desenvolver MusicLM.
Outro inconveniente é que, a pesar da capacidade técnica de MusicLM para fabricar voces. Isto inclúe cancións do coro. As "letras" producidas por MusicLM ás veces parecen un galimatías. Ademais, poden ser difíciles de comprender. Non obstante, MusicLM aínda está en desenvolvemento e estes problemas pódense mellorar.
Observacións finais
Finalmente, cremos que a tecnoloxía subxacente a Google MusicLM é interesante e fascinante. É sorprendente que unha IA poida facer música nunha variedade de estilos, cun maior nivel de realismo. MusicLM ten o potencial de cambiar o negocio da música. E estamos encantados de ver como evoluciona esta tecnoloxía.
Deixe unha resposta