Google ha annunciato MusicLM, un'intelligenza artificiale che crea musica dalle parole digitate, come DALL-E 2. È un modello linguistico creato da Google Research. Inoltre, l'hanno progettato esclusivamente per la creazione di musica.
Inoltre, è stato addestrato su un vasto set di dati di file musicali e può produrre musica in una gamma di stili e forme. Se sei interessato alla musica; quindi dovresti controllare cosa offrirà MusicLM.
Con MusicLM produci musica in alcune tecniche e forme. Ad esempio, puoi creare brani per pianoforte, ritmi di batteria e melodie per i testi.
Inoltre, puoi perfezionare determinati stili o includere l'input fornito dall'utente. Ha lo scopo di produrre musica che sia armonicamente e ritmicamente coesa. Quindi, tuffiamoci e vediamo di cosa tratta MusicLM.
Tentativi precedenti
MusicLM non è il primo sistema musicale generato dall'intelligenza artificiale. Riffusion, Dance Diffusion, AudioML di Google e OpenAI juke-box sono esempi di approcci comparabili. Tuttavia, questi sistemi precedenti sono stati vincolati da restrizioni tecnologiche.
Inoltre, la loro mancanza di dati di allenamento rendeva difficile comporre brani di alta qualità. Tuttavia, MusicLM ha la capacità di creare musica con un maggiore livello di raffinatezza e realismo.
Panoramica MusicaLM
MusicLM apprende la struttura e lo stile della musica. Quindi, viene addestrato su un vasto set di dati di file musicali MIDI e simbolici. Come i suoi programmi simili, MusicLM è costruito sull'architettura Transformer.
Utilizzando tecniche di auto-attenzione per concentrarsi su particolari componenti di input, l'architettura del trasformatore di MusicLM viene utilizzata per estrarre la struttura e lo stile della musica da un grande set di dati. Di conseguenza, puoi creare musica armonicamente e ritmicamente coesa.
E questa musica può imitare l'organizzazione dell'input dell'utente. Quindi, sarai in grado di ottenere il risultato musicale che descrivi specificamente al programma.
Il successo del precedente modelli linguistici, come GPT-2 e GPT-3, che hanno dimostrato la loro capacità di creare una scrittura coerente e scorrevole, hanno ispirato MusicLM. MusicLM, d'altra parte, è il primo modello di linguaggio creato esclusivamente per la generazione musicale.
E pensiamo che sarà considerato uno dei modelli più sofisticati.
Come funziona?
DALL-E 2 e MusicLM di Google intelligenza artificiale condividono molte somiglianze strutturali. Questa volta, però, la tua scrittura è trasmessa musicalmente piuttosto che visivamente. A questo punto, puoi costruire completamente un intero pezzo. Inoltre, puoi generare il ritmo usando un solo strumento.
Puoi visualizzare diversi studi di esempio creati dal team AI di Google sulla pagina Github di MusicLM. Anche se l'intelligenza artificiale è ancora in fase di ricerca e sviluppo, i suoni che può emettere sono ad alta risoluzione. Inoltre, ci sono stati suggerimenti, come l'integrazione di questa IA con ChatGPT. Questa integrazione potrebbe portare a musica più intricata e creativa.
Dal ronzio alle melodie di successo
MusicLM combina quattro distinti modelli di intelligenza artificiale: MuLan, AudioLM, w2v-BERT e Soundstream. Sebbene ciascuno di questi modelli abbia una serie di capacità distintive. Tuttavia, quando sono stati integrati, hanno portato a MusicLM!
Musicisti e professionisti del settore hanno notato la capacità di MusicLM di trasformare anche i mormorii e i mormorii più elementari in melodie intere. Combinandosi con ChatGPT, può produrre musica unica.
Puoi ascoltare ed esplorare la musica e i suoni creati da MusicLM sul suo sito web. Ma tieni presente che è attualmente in fase di test. È ovvio che MusicLM ha la capacità di trasformare completamente il business della musica man mano che la tecnologia si sviluppa.
Musica generata dall'intelligenza artificiale con sfumature simili a quelle umane
Per produrre canzoni che abbiano un senso sulla base di descrizioni approfondite, MusicLM è stato addestrato su un ampio set di dati di 280,000 ore di musica. Ad esempio, puoi creare "una melodia dubstep melodica con bassi profondi e sofisticati ritmi di batteria". Oppure potresti chiedergli di creare "una canzone pop allettante con un accattivante riff di chitarra e un cantante energico". La tua immaginazione è il limite in questo caso.
Le canzoni prodotte assomigliano a quelle composte da musicisti umani. I campioni di MusicLM sono estremamente sbalorditivi. È vero soprattutto perché non c'è nessun essere umano coinvolto nel processo di composizione. MusicLM può ripetere aspetti sfumati come riff musicali, melodie ed emozioni. Inoltre, funziona anche quando vengono fornite specifiche complicate ed esplicite.
Caratteristiche importanti
Condizionamento della didascalia della pittura
Il condizionamento della didascalia della pittura è una funzione di MusicLM. Puoi produrre musica basata su una descrizione testuale o "didascalia" di un dipinto. Ciò implica che MusicLM è in grado di creare musica che catturi le emozioni, gli stati d'animo e le idee espresse in un'immagine. Questa capacità è molto utile per creare musica per film, video gamese tutti i tipi di media visivi.
Story Mode
La funzione Story Mode accetta un testo della storia come input. Quindi, crea una musica di sottofondo di accompagnamento. Gli utenti possono utilizzare questa funzione per creare una colonna sonora per un racconto, un videogioco o un film rappresentando lo scenario o il tono emotivo.
La modalità Storia è uno strumento utile per gli artisti dei media. Pertanto, può generare un'ampia gamma di stili e strumenti musicali. La modalità Racconto di MusicLM aumenta l'impatto emotivo di una scena. Quindi, gli spettatori possono avere un ulteriore grado di immersione nella storia.
Livello di esperienza del musicista
Puoi personalizzare la difficoltà della musica creata. Gli utenti possono scegliere tra tre livelli in base al loro livello di abilità. Inoltre, possono specificare il grado di complessità preferito: principiante, intermedio o avanzato.
Questa funzione ti aiuta se hai un po' di esperienza musicale e vuoi sperimentare nuove composizioni. Tuttavia, se sei un musicista esperto, puoi creare musica sofisticata e sottile. L'obiettivo di MusicLM con questa funzione è offrire un'esperienza accessibile a tutti gli utenti.
Diversità generazionale
Con la funzione Generation Diversity, puoi produrre molte versioni di una canzone dallo stesso input. E puoi avere una vasta gamma di output. Ciò implica che l'IA può generare più versioni di una canzone.
Inoltre, ci sono melodie alternative o progressioni di accordi, pur mantenendo lo stile e la struttura di base della canzone. Questa funzione aiuta la creazione musicale dell'IA a essere più creativa. Quindi, rende la creazione musicale più analoga alla scrittura umana.
Possibili limitazioni di MusicLM
Google non ha ancora reso disponibile al pubblico MusicLM perché è ancora in fase di sviluppo. Pertanto, non è ancora possibile fornire campioni particolari dei tipi di musica che MusicLM è in grado di produrre. Inoltre, è ancora un po' sconosciuto quali restrizioni potrebbe avere MusicLM.
Poiché la tecnologia è ancora nelle sue fasi iniziali, potrebbe avere alcune restrizioni sul calibro della musica prodotta o sulla sua capacità di gestire input particolari.
La qualità distorta dei campioni prodotti è uno dei principali svantaggi. Questo è un sottoprodotto necessario della procedura di formazione utilizzata per sviluppare MusicLM.
Un altro svantaggio è che, nonostante la capacità tecnica di MusicLM di produrre voci. Ciò include le canzoni del coro. I "testi" prodotti da MusicLM a volte sembrano senza senso. Inoltre, possono essere difficili da comprendere. Tuttavia, MusicLM è ancora in fase di sviluppo e questi problemi possono essere migliorati.
Osservazioni finali
Infine, riteniamo che la tecnologia alla base di Google MusicLM sia interessante e affascinante. È sorprendente che un'intelligenza artificiale possa creare musica in una varietà di stili, con un livello di realismo più elevato. MusicLM ha il potenziale per cambiare il mondo della musica. E siamo entusiasti di vedere come si evolve questa tecnologia.
Lascia un Commento