Google julkisti MusicLM:n, tekoälyn, joka luo musiikkia kirjoittamistasi sanoista, kuten DALL-E 2. Se on Google Researchin luoma kielimalli. Lisäksi he ovat suunnitelleet sen yksinomaan musiikin luomiseen.
Ja se on koulutettu laajalle musiikkitiedostojen tietojoukolle, ja se voi tuottaa musiikkia eri tyyleissä ja muodoissa. Jos olet kiinnostunut musiikista; sitten sinun pitäisi tarkistaa, mitä MusicLM tarjoaa.
MusicLM:n avulla tuotat musiikkia joissakin tekniikoissa ja muodoissa. Voit esimerkiksi luoda pianokappaleita, rumpujen lyöntejä ja melodioita sanoituksiin.
Voit myös hienosäätää tiettyjä tyylejä tai sisällyttää käyttäjän toimittaman syötteen. Sen on tarkoitus tuottaa harmonisesti ja rytmisesti yhtenäistä musiikkia. Sukellaan siis sisään ja katsotaan, mistä MusicLM on kyse.
Aikaisemmat yritykset
MusicLM ei ole ensimmäinen tekoälyn luoma musiikkijärjestelmä. Riffusion, Dance Diffusion, Googlen AudioML ja OpenAI Levyautomaatti ovat esimerkkejä vertailukelpoisista lähestymistavoista. Näitä aikaisempia järjestelmiä kuitenkin rajoittavat tekniset rajoitukset.
Myös harjoitustietojen puute vaikeutti korkealaatuisten sävelmien säveltämistä. MusicLM:llä on kuitenkin kyky luoda musiikkia, joka on hienostuneempi ja realistisempi.
Yleiskatsaus MusicLM
MusicLM oppii musiikin rakenteen ja tyylin. Siksi se koulutetaan valtavaan MIDI- ja symbolisten musiikkitiedostojen tietojoukkoon. Kuten sen vastaavat ohjelmat, MusicLM on rakennettu Transformer-arkkitehtuuriin.
MusicLM:n muuntaja-arkkitehtuuria käytetään musiikin rakenteen ja tyylin poimimiseen suuresta tietojoukosta käyttämällä itsetarkkailutekniikoita keskittyäkseen tiettyihin tulokomponentteihin. Tuloksena voit luoda harmonisesti ja rytmisesti yhtenäistä musiikkia.
Ja tämä musiikki voi jäljitellä käyttäjän syötteen organisaatiota. Näin ollen voit saada musiikkituloksen, jonka nimenomaan kuvailet ohjelmaan.
Edellisen menestys kielimalleja, kuten GPT-2 ja GPT-3, jotka ovat osoittaneet kykynsä luoda yhtenäistä ja sujuvaa kirjoitusta, inspiroivat MusicLM:ää. MusicLM puolestaan on ensimmäinen kielimalli, joka on rakennettu yksinomaan musiikkisukupolvelle.
Ja uskomme, että sitä pidetään yhtenä hienostuneimmista malleista.
Kuinka se toimii?
DALL-E 2 ja Googlen MusicLM tekoäly jakaa paljon rakenteellisia yhtäläisyyksiä. Tällä kertaa kirjoituksesi välitetään kuitenkin enemmän musiikillisesti kuin visuaalisesti. Tässä vaiheessa voit joko rakentaa kokonaan kokonaisen kappaleen. Voit myös luoda rytmiä yhdellä instrumentilla.
Voit tarkastella useita Google AI -tiimin luomia esimerkkitutkimuksia MusicLM:n Github-sivulla. Vaikka tekoäly on vielä tutkimus- ja kehitysvaiheessa, sen tuottamat äänet ovat korkearesoluutioisia. Lisäksi on esitetty ehdotuksia, kuten tämän tekoälyn integrointi ChatGPT:hen. Tämä integraatio voisi johtaa monimutkaisempaan ja luovampaan musiikkiin.
Huminasta hittimelodioihin
MusicLM yhdistää neljä erillistä tekoälymallia: MuLan, AudioLM, w2v-BERT ja Soundstream. Vaikka jokaisella näistä malleista on joukko erottuvia ominaisuuksia. Kuitenkin, kun ne integroituivat, ne johtivat MusicLM!
Muusikot ja alan ammattilaiset ovat huomanneet MusicLM:n kyvyn muuttaa alkeellisimmatkin huminat kokonaisiksi säveliksi. Yhdistämällä ChatGPT:hen se voi tuottaa ainutlaatuista musiikkia.
Voit kuunnella ja tutkia MusicLM:n luomaa musiikkia ja ääniä sillä verkkosivusto. Muista kuitenkin, että se on tällä hetkellä testausvaiheessa. On selvää, että MusicLM pystyy muuttamaan musiikkibisneksen täysin tekniikan kehittyessä.
Tekoälyn luomaa musiikkia ihmisen kaltaisilla vivahteilla
MusicLM koulutettiin 280,000 XNUMX tunnin musiikin suuren tietojoukon perusteella tuottaakseen järkeviä kappaleita perusteellisten kuvausten perusteella. Voit esimerkiksi luoda "melodisen dubstep-sävelmän syvällä bassolla ja hienostuneilla rumpuretmeillä". Tai voit pyytää sitä luomaan "houkuttelevan popkappaleen, jossa on kiehtova kitarariffi ja voimakas vokalisti". Tässä tapauksessa mielikuvituksesi on rajana.
Tuotetut kappaleet muistuttavat ihmisten säveltämiä kappaleita. MusicLM:n näytteet ovat erittäin hämmästyttäviä. Se on totta, etenkin kun otetaan huomioon, että koostumusprosessissa ei ole mukana ihmisiä. MusicLM voi toistaa vivahteita, kuten musiikillisia riffejä, melodioita ja tunteita. Lisäksi se toimii myös monimutkaisilla ja täsmällisillä määritelmillä.
Tärkeitä ominaisuuksia
Painting Caption Conditioning
Painting Caption Conditioning on MusicLM-toiminto. Voit tuottaa musiikkia maalauksen tekstillisen kuvauksen tai "tekstityksen" perusteella. Tämä tarkoittaa, että MusicLM pystyy luomaan musiikkia, joka vangitsee kuvassa ilmaistut tunteet, tunnelmat ja ideat. Tämä ominaisuus on erittäin hyödyllinen elokuvien musiikin tekemisessä, Videopelitja kaikenlaista visuaalista mediaa.
Tarinatilassa
Story Mode -ominaisuus ottaa tarinan tekstin syötteeksi. Näin ollen se luo taustamusiikkia. Käyttäjät voivat käyttää tätä toimintoa luodakseen ääniraidan tarinalle, videopelille tai elokuvalle kuvaamalla skenaariota tai tunnesävyä.
Story Mode on kätevä työkalu mediataiteilijoille. Siten se voi luoda laajan valikoiman musiikkityylejä ja soittimia. MusicLM:n Tale Mode voi lisätä kohtauksen emotionaalista vaikutusta. Katsojat voivat siis uppoutua tarinaan enemmän.
Muusikkokokemustaso
Voit mukauttaa luodun musiikin vaikeusastetta. Käyttäjät voivat valita kolmesta tasosta taitotasonsa perusteella. He voivat myös määrittää halutun monimutkaisuusasteen: aloittelija, keskitason tai edistynyt.
Tämä ominaisuus auttaa sinua, jos sinulla on vähän musiikillista asiantuntemusta ja haluat kokeilla uusia sävellyksiä. Jos olet kuitenkin kokenut muusikko, voit luoda hienostunutta ja hienovaraista musiikkia. MusicLM:n tavoitteena tällä ominaisuudella on tarjota helppokäyttöinen kokemus kaikille käyttäjille.
Sukupolvien monimuotoisuus
Generation Diversity -toiminnolla voit tuottaa useita versioita kappaleesta samasta syötteestä. Ja sinulla voi olla monipuolinen valikoima ulostuloja. Tämä tarkoittaa, että tekoäly voi luoda kappaleesta useita versioita.
Lisäksi on olemassa vaihtoehtoisia melodioita tai sointujen kulkua, mutta silti kappaleen perustyyli ja rakenne säilyvät. Tämä ominaisuus auttaa tekoälyn musiikin luomisessa olemaan luovempaa. Siksi se tekee musiikin luomisesta analogisemman ihmisen laulunkirjoittamisen kanssa.
MusicLM:n mahdolliset rajoitukset
Google ei ole vielä tuonut MusicLM:ää suuren yleisön saataville, koska se on vielä kehitysvaiheessa. Tästä syystä et voi vielä antaa tiettyjä näytteitä sellaisesta musiikista, jota MusicLM voi tuottaa. Lisäksi on vielä hieman epäselvää, mitkä rajoitukset MusicLM:llä voisi olla.
Koska tekniikka on vielä alkuvaiheessa, sillä voi olla tiettyjä rajoituksia tuotetun musiikin kaliiperiin tai sen kykyyn käsitellä tiettyjä syötteitä.
Tuotettujen näytteiden vääristynyt laatu on yksi tärkeimmistä haitoista. Tämä on välttämätön sivutuote MusicLM:n kehittämiseen käytetystä koulutusmenettelystä.
Toinen haittapuoli on, että huolimatta MusicLM:n teknisestä kyvystä valmistaa laulua. Tämä sisältää kuorolaulut. MusicLM:n tuottamat "lyriikat" tuntuvat joskus hölynpölyltä. Lisäksi niitä voi olla vaikea ymmärtää. MusicLM on kuitenkin edelleen kehitteillä ja näitä asioita voidaan parantaa.
Viimeiset huomautukset
Lopuksi uskomme, että Google MusicLM:n taustalla oleva tekniikka on sekä mielenkiintoinen että kiehtova. On hämmästyttävää, että tekoäly voi tehdä musiikkia eri tyyleillä korkeammalla realistisella tasolla. MusicLM:llä on potentiaalia muuttaa musiikkialaa. Ja seuraamme innolla, kuinka tämä tekniikka kehittyy.
Jätä vastaus