Google va anunciar MusicLM, intel·ligència artificial que crea música a partir de les paraules que escriviu, com DALL-E 2. És un model de llenguatge creat per Google Research. A més, l'han dissenyat exclusivament per a la creació musical.
A més, s'ha entrenat en un ampli conjunt de dades de fitxers de música i pot produir música en una varietat d'estils i formes. Si t'interessa la música; llavors hauríeu de comprovar què oferirà MusicLM.
Amb MusicLM produïs música en algunes tècniques i formes. Per exemple, podeu crear peces de piano, ritmes de bateria i melodies per a lletres.
A més, podeu afinar determinats estils o incloure entrada proporcionada per l'usuari. Està pensat per produir música que sigui harmònica i rítmicament cohesionada. Per tant, anem a submergir-nos i veure de què tracta MusicLM.
Intents anteriors
MusicLM no és el primer sistema de música generat per IA. Riffusion, Dance Diffusion, AudioML de Google i OpenAI Jukebox són exemples d'enfocaments comparables. Tanmateix, aquests sistemes anteriors es van veure limitats per restriccions tecnològiques.
A més, la seva manca de dades d'entrenament va dificultar la composició de cançons d'alta qualitat. No obstant això, MusicLM té la capacitat de crear música amb un major nivell de sofisticació i realisme.
Visió general MusicLM
MusicLM aprèn l'estructura i l'estil de la música. Per tant, s'entrena en un ampli conjunt de dades de fitxers de música MIDI i simbòlics. Igual que els seus programes similars, MusicLM es basa en l'arquitectura Transformer.
Utilitzant tècniques d'autoatenció per concentrar-se en components d'entrada particulars, l'arquitectura del transformador de MusicLM s'utilitza per extreure l'estructura i l'estil de la música d'un gran conjunt de dades. Com a resultat, podeu crear música harmònica i rítmicament cohesionada.
I, aquesta música pot imitar l'organització de l'entrada de l'usuari. Per tant, podreu obtenir el resultat musical que descriu específicament al programa.
L'èxit de l'anterior models lingüístics, com GPT-2 i GPT-3, que han demostrat la seva capacitat per crear una escriptura coherent i fluida, van inspirar MusicLM. MusicLM, en canvi, és el primer model de llenguatge que es va construir exclusivament per a la generació musical.
I, creiem que serà considerat com un dels models més sofisticats.
Com funciona?
DALL-E 2 i MusicLM de Google intel·ligència artificial comparteixen moltes similituds estructurals. Aquesta vegada, però, la teva escriptura es transmet musicalment més que visualment. En aquest punt, podeu construir completament una peça sencera. A més, podeu generar ritme amb un sol instrument.
Podeu veure diversos estudis de mostra creats per l'equip de Google AI a la pàgina Github de MusicLM. Tot i que la IA encara es troba en l'etapa d'investigació i desenvolupament, els sons que pot fer són d'alta resolució. A més, hi ha hagut suggeriments, com ara integrar aquesta IA amb ChatGPT. Aquesta integració podria conduir a una música més complexa i creativa.
Del tararear a les melodies de hit
MusicLM combina quatre models d'IA diferents: MuLan, AudioLM, w2v-BERT i Soundstream. Tot i que cadascun d'aquests models té un conjunt de capacitats distintives. Tanmateix, quan es van integrar, van donar lloc a MusicLM!
Músics i professionals del sector s'han adonat de la capacitat de MusicLM per transformar fins i tot els murmuris i els murmuris més bàsics en melodies senceres. En combinar-se amb ChatGPT, pot produir música única.
Podeu escoltar i explorar la música i els sons creats per MusicLM al seu . Però, tingueu en compte que actualment es troba en fase de proves. És obvi que MusicLM té la capacitat de transformar completament el negoci de la música a mesura que es desenvolupa la tecnologia.
Música generada per IA amb matisos humans
Per produir cançons que tinguin sentit a partir de descripcions exhaustives, MusicLM es va formar amb un gran conjunt de dades de 280,000 hores de música. Per exemple, podeu crear "una melodia dubstep melòdica amb un baix profund i ritmes de bateria sofisticats". O podeu demanar-lo per crear "una cançó pop atractiva amb un riff de guitarra captivador i un vocalista contundent". La teva imaginació és el límit en aquest cas.
Les cançons produïdes s'assemblen a les compostes per músics humans. Les mostres de MusicLM són extremadament sorprenents. És cert sobretot tenint en compte que no hi ha cap humà implicat en el procés de composició. MusicLM pot repetir aspectes matisats com ara riffs musicals, melodies i emocions. A més, funciona fins i tot quan es donen especificacions complicades i explícites.
Característiques importants
Condicionament de la llegenda de la pintura
Painting Caption Conditioning és una funció de MusicLM. Podeu produir música a partir d'una descripció textual o "subtítol" d'una pintura. Això implica que MusicLM és capaç de crear música que capti les emocions, els estats d'ànim i les idees expressades en una imatge. Aquesta capacitat és molt útil per fer música per a pel·lícules, jocs de vídeo, i tot tipus de mitjans visuals.
La manera història
La funció del mode història pren un text de la història com a entrada. Per tant, crea música de fons d'acompanyament. Els usuaris poden utilitzar aquesta funció per crear una banda sonora per a un conte, un videojoc o una pel·lícula representant l'escenari o el to emocional.
El mode història és una eina útil per als artistes multimèdia. Així, pot generar una àmplia gamma d'estils i instruments musicals. El mode conte de MusicLM augmenta l'impacte emocional d'una escena. Així, els espectadors poden tenir un grau addicional d'immersió en la història.
Nivell d'experiència músic
Podeu personalitzar la dificultat de la música creada. Els usuaris poden triar entre tres nivells en funció del seu nivell d'habilitat. A més, poden especificar el grau de complexitat preferit: principiant, intermedi o avançat.
Aquesta funció t'ajuda si tens una mica d'experiència musical i vols experimentar amb noves composicions. Tanmateix, si sou un músic experimentat, podeu crear música sofisticada i subtil. L'objectiu de MusicLM amb aquesta funció és oferir una experiència accessible per a tots els usuaris.
Diversitat generacional
Amb la funció de diversitat de generació, podeu produir moltes versions d'una cançó des de la mateixa entrada. I, podeu tenir una gamma variada de sortides. Això implica que l'IA pot generar diverses versions d'una cançó.
A més, hi ha melodies alternatives o progressions d'acords, tot mantenint l'estil i l'estructura bàsics de la cançó. Aquesta funció ajuda la creació musical de l'IA a ser més creativa. Per tant, fa que la creació musical sigui més anàloga a la composició humana.
Possibles limitacions de MusicLM
Google encara no ha posat MusicLM a disposició del públic en general, ja que encara està en desenvolupament. Per tant, encara no podeu donar mostres particulars dels tipus de música que MusicLM pot produir. A més, encara es desconeix una mica quines restriccions podria tenir MusicLM.
Com que la tecnologia encara es troba en les seves primeres etapes, podria tenir certes restriccions sobre el calibre de la música que es produeix o la seva capacitat per gestionar entrades particulars.
La qualitat distorsionada de les mostres produïdes és un dels principals inconvenients. Aquest és un subproducte necessari del procediment d'entrenament utilitzat per desenvolupar MusicLM.
Un altre inconvenient és que, malgrat la capacitat tècnica de MusicLM per fabricar veus. Això inclou cançons de cor. Les "lletres" produïdes per MusicLM de vegades semblen un galimat. A més, poden ser difícils d'entendre. Tanmateix, MusicLM encara està en desenvolupament i aquests problemes es poden millorar.
Observacions finals
Finalment, creiem que la tecnologia subjacent a Google MusicLM és interessant i fascinant. És sorprenent que una IA pugui fer música en una varietat d'estils, amb un nivell més alt de realisme. MusicLM té el potencial de canviar el negoci de la música. A més, estem emocionats de veure com evoluciona aquesta tecnologia.
Deixa un comentari