Google je najavio MusicLM, umjetnu inteligenciju koja stvara muziku od riječi koje kucate, poput DALL-E 2. To je jezički model koji je kreirao Google Research. Osim toga, ekskluzivno su ga dizajnirali za stvaranje muzike.
I, obučen je na ogromnom skupu muzičkih datoteka i može proizvoditi muziku u nizu stilova i oblika. Ako ste zainteresovani za muziku; onda biste trebali provjeriti šta će MusicLM ponuditi.
Uz MusicLM proizvodite muziku u nekim tehnikama i oblicima. Na primjer, možete kreirati komade za klavir, udarce bubnjeva i melodije za tekstove.
Također, možete fino podesiti određene stilove ili uključiti unos koji daje korisnik. Namijenjen je stvaranju muzike koja je harmonično i ritmički kohezivna. Dakle, hajde da zaronimo i vidimo šta je MusicLM.
Prethodni pokušaji
MusicLM nije prvi muzički sistem generisan veštačkom inteligencijom. Riffusion, Dance Diffusion, Google-ov AudioML i OpenAI džu-boks su primjeri uporedivih pristupa. Međutim, ovi prethodni sistemi su bili ograničeni tehnološkim ograničenjima.
Takođe, njihov nedostatak podataka o treningu otežavao je komponovanje visokokvalitetnih melodija. Međutim, MusicLM ima kapacitet da kreira muziku sa većim nivoom sofisticiranosti i realizma.
Pregled MusicLM
MusicLM uči strukturu i stil muzike. Stoga se obučava na ogromnom skupu podataka MIDI i simboličkih muzičkih datoteka. Poput sličnih programa, MusicLM je izgrađen na Transformer arhitekturi.
Koristeći tehnike samopažnje za koncentrisanje na određene ulazne komponente, MusicLM-ova transformatorska arhitektura se koristi za izdvajanje strukture i stila muzike iz velikog skupa podataka. Kao rezultat, možete kreirati harmonično i ritmički kohezivnu muziku.
I ova muzika može oponašati organizaciju unosa korisnika. Dakle, moći ćete da dobijete muzički ishod koji ste posebno opisali u programu.
Uspjeh prethodnih jezički modeli, kao što su GPT-2 i GPT-3, koji su dokazali svoju sposobnost da kreiraju koherentno i tečno pisanje, inspirisali su MusicLM. MusicLM je, s druge strane, prvi jezički model koji je napravljen isključivo za muzičku generaciju.
I mislimo da će se smatrati jednim od najsofisticiranijih modela.
Kako to radi?
DALL-E 2 i Google MusicLM umjetne inteligencije dijele mnogo strukturnih sličnosti. Ovaj put, međutim, vaše pisanje je preneto muzički, a ne vizuelno. U ovom trenutku možete ili u potpunosti konstruirati cijeli komad. Takođe, možete generisati ritam koristeći samo jedan instrument.
Možete pogledati nekoliko uzoraka studija koje je kreirao Google AI tim na MusicLM-ovoj Github stranici. Iako je AI još uvijek u fazi istraživanja i razvoja, zvuci koje može proizvesti su visoke rezolucije. Također, bilo je prijedloga, kao što je integracija ove AI sa ChatGPT. Ova integracija bi mogla dovesti do složenije i kreativnije muzike.
Od pjevušenja do hit melodija
MusicLM kombinuje četiri različita AI modela: MuLan, AudioLM, w2v-BERT i Soundstream. Iako svaki od ovih modela ima skup karakterističnih mogućnosti. Međutim, kada su se integrisali, rezultirali su MusicLM!
Muzičari i profesionalci iz industrije primijetili su sposobnost MusicLM-a da transformiše čak i najosnovnije pjevušenje i žamor u cijele melodije. Kombinacijom sa ChatGPT, može proizvesti jedinstvenu muziku.
Možete slušati i istraživati muziku i zvukove kreirane od strane MusicLM-a sajt. Ali, imajte na umu da je trenutno u fazi testiranja. Očigledno je da MusicLM ima sposobnost da potpuno transformiše muzički biznis kako se tehnologija razvija.
Muzika generisana veštačkom inteligencijom sa nijansama nalik ljudima
Da bi proizveo pesme koje imaju smisla na osnovu detaljnih opisa, MusicLM je obučen na velikom skupu podataka od 280,000 sati muzike. Na primjer, možete kreirati „melodičnu dubstep melodiju s dubokim basom i sofisticiranim ritmovima bubnjeva“. Ili, možete zatražiti da stvori "zamamnu pop pjesmu sa zadivljujućim gitarskim rifom i snažnim vokalom." Vaša mašta je granica u ovom slučaju.
Proizvedene pesme liče na one koje su komponovali ljudski muzičari. MusicLM-ovi uzorci su izuzetno zapanjujući. To je tačno, posebno imajući u vidu da niko nije uključen u proces sastavljanja. MusicLM može ponoviti nijansirane aspekte kao što su muzički rifovi, melodije i emocije. Osim toga, radi čak i kada mu se daju komplikovane i eksplicitne specifikacije.
Važne karakteristike
Slikanje Caption Conditioning
Slikanje Caption Conditioning je funkcija MusicLM. Možete proizvesti muziku na osnovu tekstualnog opisa ili „naslova“ slike. Ovo implicira da je MusicLM sposoban stvoriti muziku koja bilježi emocije, raspoloženja i ideje izražene na slici. Ova mogućnost je veoma korisna za pravljenje muzike za filmove, video igricei sve vrste vizuelnih medija.
Priča moda
Funkcija Story Mode uzima tekst priče kao unos. Dakle, stvara prateću muziku u pozadini. Korisnici mogu koristiti ovu funkciju za pravljenje zvučnog zapisa za priču, video igricu ili film tako što će prikazati scenarij ili emocionalni ton.
Story Mode je zgodan alat za medijske umjetnike. Dakle, može generirati širok spektar muzičkih stilova i instrumenata. MusicLM-ov Tale Mode može povećati emocionalni utjecaj scene. Dakle, gledaoci mogu imati dodatni stepen uronjenja u priču.
Nivo muzičarskog iskustva
Možete prilagoditi težinu kreirane muzike. Korisnici mogu birati između tri nivoa na osnovu nivoa njihove veštine. Takođe, mogu odrediti željeni stepen složenosti: početni, srednji ili napredni.
Ova funkcija vam pomaže ako imate malo muzičkog znanja i želite da eksperimentišete sa novim kompozicijama. Međutim, ako ste iskusan muzičar, možete stvarati sofisticiranu i suptilnu muziku. MusicLM-ov cilj sa ovom funkcijom je pružiti dostupno iskustvo za sve korisnike.
Generation Diversity
Sa funkcijom Generation Diversity, možete proizvesti mnogo verzija pjesme iz istog ulaza. I, možete imati raznolik raspon izlaza. Ovo implicira da AI može generirati više verzija pjesme.
Osim toga, postoje alternativne melodije ili progresije akorda, uz zadržavanje osnovnog stila i strukture pjesme. Ova funkcija pomaže da AI kreiranje muzike bude kreativnije. Stoga stvaranje muzike čini analognijim ljudskom pisanju pjesama.
Moguća ograničenja MusicLM-a
Google još uvijek nije učinio MusicLM dostupnim široj javnosti jer je još uvijek u razvoju. Dakle, još uvijek ne možete dati posebne uzorke vrste muzike koju MusicLM može proizvesti. Nadalje, još uvijek je malo nepoznato kakva bi ograničenja mogla imati MusicLM.
Kako je tehnologija još uvijek u ranoj fazi, mogla bi imati određena ograničenja u pogledu kalibra muzike koja se proizvodi ili njenog kapaciteta za rukovanje određenim ulazima.
Iskrivljeni kvalitet proizvedenih uzoraka jedan je od ključnih nedostataka. Ovo je neophodan nusprodukt procedure obuke koja se koristi za razvoj MusicLM-a.
Još jedan nedostatak je to, uprkos tehničkoj sposobnosti MusicLM-a za proizvodnju vokala. Ovo uključuje i horske pjesme. „Stirovi“ koje proizvodi MusicLM ponekad izgledaju kao besmislica. Osim toga, mogu biti teški za razumijevanje. Međutim, MusicLM je još uvijek u razvoju i ova pitanja se mogu poboljšati.
Završne napomene
Konačno, vjerujemo da je tehnologija na kojoj se temelji Google MusicLM i zanimljiva i fascinantna. Zapanjujuće je da veštačka inteligencija može da pravi muziku u različitim stilovima, sa višim nivoom realizma. MusicLM ima potencijal da promijeni muzički biznis. I sa uzbuđenjem gledamo kako se ova tehnologija razvija.
Ostavite odgovor