O Google anunciou o MusicLM, inteligência artificial que cria música a partir das palavras que você digita, como o DALL-E 2. É um modelo de linguagem criado pelo Google Research. Além disso, eles o projetaram exclusivamente para a criação musical.
E foi treinado em um vasto conjunto de dados de arquivos de música e pode produzir música em uma variedade de estilos e formas. Se você está interessado em música; então você deve verificar o que o MusicLM oferece.
Com o MusicLM você produz música em algumas técnicas e formas. Por exemplo, você pode criar peças de piano, batidas de bateria e melodias para letras.
Além disso, você pode ajustar certos estilos ou incluir entrada fornecida pelo usuário. Destina-se a produzir música harmonicamente e ritmicamente coesa. Então, vamos nos aprofundar e ver do que se trata o MusicLM.
Tentativas Anteriores
O MusicLM não é o primeiro sistema de música gerado por IA. Riffusion, Dance Diffusion, AudioML do Google e OpenAI's juke-box são exemplos de abordagens comparáveis. No entanto, esses sistemas anteriores foram limitados por restrições tecnológicas.
Além disso, a falta de dados de treinamento dificultava a composição de músicas de alta qualidade. No entanto, o MusicLM tem a capacidade de criar música com um maior nível de sofisticação e realismo.
Visão geral MusicLM
MusicLM aprende a estrutura e o estilo da música. Portanto, ele é treinado em um vasto conjunto de dados de arquivos MIDI e de música simbólica. Como seus programas semelhantes, MusicLM é construído na arquitetura Transformer.
Utilizando técnicas de auto-atenção para se concentrar em componentes de entrada específicos, a arquitetura transformadora do MusicLM é usada para extrair a estrutura e o estilo da música de um grande conjunto de dados. Como resultado, você pode criar uma música harmonicamente e ritmicamente coesa.
E essa música pode imitar a organização da entrada do usuário. Assim, você poderá obter o resultado musical que descreve especificamente para o programa.
O sucesso dos anteriores modelos de linguagem, como GPT-2 e GPT-3, que provaram sua capacidade de criar uma escrita coerente e fluente, inspiraram o MusicLM. O MusicLM, por outro lado, é o primeiro modelo de linguagem construído exclusivamente para a geração musical.
E achamos que será considerado um dos modelos mais sofisticados.
Como isso funciona?
DALL-E 2 e MusicLM do Google inteligência artificial compartilham muitas semelhanças estruturais. Desta vez, porém, sua escrita é transmitida musicalmente e não visualmente. Neste ponto, você pode construir completamente uma peça inteira. Além disso, você pode gerar ritmo usando apenas um instrumento.
Você pode ver vários estudos de amostra criados pela equipe do Google AI na página Github do MusicLM. Embora a IA ainda esteja em fase de pesquisa e desenvolvimento, os sons que ela pode emitir são de alta resolução. Além disso, houve sugestões, como integrar esta IA ao ChatGPT. Essa integração pode levar a uma música mais complexa e criativa.
De cantarolar a melodias de sucesso
O MusicLM combina quatro modelos distintos de IA: MuLan, AudioLM, w2v-BERT e Soundstream. Embora cada um desses modelos tenha um conjunto de recursos distintos. No entanto, quando se integraram, resultaram no MusicLM!
Músicos e profissionais da indústria perceberam a capacidade do MusicLM de transformar até mesmo os zumbidos e murmúrios mais básicos em melodias completas. Ao combinar com o ChatGPT, pode produzir música única.
Você pode ouvir e explorar a música e os sons criados pelo MusicLM em seu site do Network Development Group. Mas, lembre-se de que está atualmente em fase de teste. É óbvio que MusicLM tem a capacidade de transformar completamente o negócio da música à medida que a tecnologia se desenvolve.
Música gerada por IA com nuances semelhantes às humanas
Para produzir músicas que façam sentido com base em descrições completas, o MusicLM foi treinado em um grande conjunto de dados de 280,000 horas de música. Por exemplo, você pode criar “uma melodia de dubstep melódica com graves profundos e ritmos de bateria sofisticados”. Ou você pode pedir para criar “uma música pop atraente com um riff de guitarra cativante e um vocalista forte”. Sua imaginação é o limite neste caso.
As canções produzidas se assemelham àquelas compostas por músicos humanos. Os samples do MusicLM são extremamente surpreendentes. É verdade especialmente porque não há nenhum ser humano envolvido no processo de composição. O MusicLM pode repetir aspectos diferenciados, como riffs musicais, melodias e emoções. Além disso, funciona mesmo com especificações complicadas e explícitas.
Características importantes
Condicionamento de legenda de pintura
O condicionamento de legendas de pintura é uma função do MusicLM. Você pode produzir música com base em uma descrição textual ou “legenda” de uma pintura. Isso implica que o MusicLM é capaz de criar música que captura as emoções, humores e ideias expressas em uma imagem. Esta capacidade é muito útil para fazer música para filmes, jogos de vídeoe todos os tipos de mídia visual.
Story Mode
O recurso Story Mode usa um texto de história como entrada. Portanto, cria uma música de fundo de acompanhamento. Os usuários podem utilizar esta função para criar uma trilha sonora para um conto, videogame ou filme retratando o cenário ou o tom emocional.
O Story Mode é uma ferramenta útil para artistas de mídia. Assim, pode gerar uma ampla gama de estilos musicais e instrumentos. O Tale Mode do MusicLM consegue aumentar o impacto emocional de uma cena. Assim, os espectadores podem ter um grau adicional de imersão na história.
Nível de experiência do músico
Você pode personalizar a dificuldade da música criada. Os usuários podem escolher entre três níveis com base em seu nível de habilidade. Além disso, eles podem especificar o grau de complexidade preferido: iniciante, intermediário ou avançado.
Esse recurso ajuda se você tiver um pouco de conhecimento musical e quiser experimentar novas composições. No entanto, se você for um músico experiente, poderá criar músicas sofisticadas e sutis. O objetivo do MusicLM com esse recurso é oferecer uma experiência acessível para todos os usuários.
Diversidade de Gerações
Com a função Generation Diversity, você pode produzir várias versões de uma música a partir da mesma entrada. E você pode ter uma gama variada de saídas. Isso implica que a IA pode gerar várias versões de uma música.
Além disso, existem melodias alternativas ou progressões de acordes, mantendo o estilo e a estrutura básicos da música. Esse recurso ajuda a criação de música da IA a ser mais criativa. Portanto, torna a criação musical mais análoga à composição humana.
Possíveis limitações do MusicLM
O Google ainda não disponibilizou o MusicLM para o público em geral, pois ainda está em desenvolvimento. Portanto, você ainda não pode fornecer amostras específicas dos tipos de música que o MusicLM pode produzir. Além disso, ainda é um pouco desconhecido quais restrições o MusicLM poderia ter.
Como a tecnologia ainda está em seus estágios iniciais, ela pode ter certas restrições no calibre da música que é produzida ou na capacidade de lidar com entradas específicas.
A qualidade distorcida das amostras produzidas é uma das principais desvantagens. Este é um subproduto necessário do procedimento de treinamento usado para desenvolver o MusicLM.
Outra desvantagem é que, apesar da capacidade técnica do MusicLM para fabricar vocais. Isso inclui canções de coral. As “letras” produzidas pela MusicLM às vezes parecem sem sentido. Além disso, eles podem ser difíceis de compreender. No entanto, o MusicLM ainda está em desenvolvimento e esses problemas podem ser melhorados.
Considerações finais
Finalmente, acreditamos que a tecnologia subjacente ao Google MusicLM é interessante e fascinante. É surpreendente que uma IA possa fazer música em uma variedade de estilos, com um nível de realismo maior. MusicLM tem o potencial de mudar o negócio da música. E estamos ansiosos para ver como essa tecnologia evolui.
Deixe um comentário