„Google“ paskelbė apie MusicLM – dirbtinį intelektą, kuris kuria muziką iš jūsų įvedamų žodžių, pvz., DALL-E 2. Tai kalbos modelis, sukurtas „Google Research“. Be to, jie sukūrė jį išskirtinai muzikos kūrimui.
Be to, jis buvo išmokytas naudotis didžiuliu muzikos failų duomenų rinkiniu ir gali sukurti įvairių stilių ir formų muziką. Jei domitės muzika; tada turėtumėte patikrinti, ką MusicLM pasiūlys.
Su MusicLM kuriate muziką tam tikromis technikomis ir formomis. Pavyzdžiui, galite sukurti fortepijono kūrinius, būgnų ritmus ir dainų tekstų melodijas.
Be to, galite tiksliai suderinti tam tikrus stilius arba įtraukti vartotojo pateiktą įvestį. Jis skirtas sukurti harmoningai ir ritmiškai darnią muziką. Taigi, pasinerkime ir pažiūrėkime, kas yra „MusicLM“.
Ankstesni bandymai
MusicLM nėra pirmoji dirbtinio intelekto sukurta muzikos sistema. Riffusion, Dance Diffusion, Google AudioML ir OpenAI Jukebox yra panašių metodų pavyzdžiai. Tačiau šios ankstesnės sistemos buvo suvaržytos technologinių apribojimų.
Be to, dėl mokymo duomenų trūkumo buvo sunku sukurti aukštos kokybės melodijas. Tačiau „MusicLM“ gali kurti muziką, pasižyminčią didesniu rafinuotumu ir tikroviškumu.
„MusicLM“ apžvalga
MusicLM mokosi muzikos struktūros ir stiliaus. Taigi jis mokomas naudotis didžiuliu MIDI ir simbolinių muzikos failų duomenų rinkiniu. Kaip ir panašios programos, „MusicLM“ yra sukurta remiantis „Transformer“ architektūra.
Naudojant dėmesio sau metodus, siekiant sutelkti dėmesį į tam tikrus įvesties komponentus, „MusicLM“ transformatoriaus architektūra naudojama muzikos struktūrai ir stiliui išgauti iš didelio duomenų rinkinio. Dėl to galite sukurti harmoningai ir ritmiškai darnią muziką.
Ir ši muzika gali imituoti vartotojo įvesties organizavimą. Taigi galėsite gauti muzikinį rezultatą, kurį konkrečiai apibūdinsite programai.
Ankstesnė sėkmė kalbos modeliai, pavyzdžiui, GPT-2 ir GPT-3, kurie įrodė savo gebėjimą kurti nuoseklų ir sklandų rašymą, įkvėpė MusicLM. Kita vertus, MusicLM yra pirmasis kalbos modelis, sukurtas tik muzikos kartai.
Ir manome, kad jis bus laikomas vienu įmantriausių modelių.
Kaip tai veikia?
DALL-E 2 ir Google MusicLM dirbtinis intelektas turi daug struktūrinių panašumų. Tačiau šį kartą jūsų rašymas perteiktas muzikiškai, o ne vizualiai. Šiuo metu galite arba visiškai sukurti visą kūrinį. Be to, galite sukurti ritmą naudodami tik vieną instrumentą.
„MusicLM“ „Github“ puslapyje galite peržiūrėti keletą „Google AI“ komandos sukurtų tyrimų pavyzdžių. Nors dirbtinis intelektas vis dar yra tyrimų ir plėtros stadijoje, garsai, kuriuos jis gali skleisti, yra didelės skiriamosios gebos. Taip pat buvo pasiūlymų, pavyzdžiui, integruoti šį AI su „ChatGPT“. Ši integracija gali lemti sudėtingesnę ir kūrybiškesnę muziką.
Nuo niūniavimo iki hitų melodijų
MusicLM sujungia keturis skirtingus AI modelius: MuLan, AudioLM, w2v-BERT ir Soundstream. Nors kiekvienas iš šių modelių turi išskirtinių galimybių rinkinį. Tačiau kai jie buvo integruoti, jie sukūrė MusicLM!
Muzikantai ir pramonės profesionalai atkreipė dėmesį į „MusicLM“ gebėjimą net paprasčiausią dūzgimą ir ūžesį paversti ištisomis melodijomis. Sujungus su ChatGPT, jis gali sukurti unikalią muziką.
Galite klausytis ir tyrinėti MusicLM sukurtą muziką ir garsus Interneto svetainė. Tačiau atminkite, kad šiuo metu tai yra bandymo fazė. Akivaizdu, kad „MusicLM“ turi galimybę visiškai pakeisti muzikos verslą tobulėjant technologijoms.
Dirbtinio intelekto sukurta muzika su žmogui panašiais niuansais
Norėdami sukurti dainas, kurios būtų prasmingos remiantis išsamiais aprašymais, „MusicLM“ buvo apmokytas naudojant didelį 280,000 XNUMX valandų muzikos duomenų rinkinį. Pavyzdžiui, galite sukurti „melodingą dubstep melodiją su giliu bosu ir sudėtingais būgnų ritmais“. Arba galite paprašyti, kad ji sukurtų „viliojančią pop dainą su žaviu gitaros rifu ir stipriu vokaliste“. Šiuo atveju riba yra jūsų vaizduotė.
Pagamintos dainos primena žmonių muzikantų sukurtas dainas. „MusicLM“ pavyzdžiai yra nepaprastai stulbinantys. Tai tiesa, ypač atsižvelgiant į tai, kad kompozicijos procese nedalyvauja joks žmogus. MusicLM gali pakartoti niuansuotus aspektus, tokius kaip muzikiniai rifai, melodijos ir emocijos. Be to, jis veikia net tada, kai pateikiamos sudėtingos ir aiškios specifikacijos.
Svarbios funkcijos
Paveikslas Antraštės kondicionavimas
Painting Caption Conditioning yra MusicLM funkcija. Galite kurti muziką pagal tekstinį paveikslo aprašymą arba „antraštę“. Tai reiškia, kad „MusicLM“ gali sukurti muziką, kuri fiksuoja emocijas, nuotaikas ir idėjas, išreikštas paveikslėlyje. Ši galimybė labai naudinga kuriant muziką filmams, Video žaidimai, ir visų rūšių vaizdinės medijos.
Istorija būdas
Istorijos režimo funkcija kaip įvestį paima istorijos tekstą. Taigi jis sukuria lydinčią foninę muziką. Vartotojai gali naudoti šią funkciją kurdami pasakos, vaizdo žaidimo ar filmo garso takelį, pavaizduodami scenarijų arba emocinį toną.
Story Mode yra patogus įrankis žiniasklaidos menininkams. Taigi jis gali sukurti platų muzikos stilių ir instrumentų spektrą. „MusicLM“ pasakojimo režimas padidina emocinį scenos poveikį. Taigi žiūrovai gali dar labiau pasinerti į istoriją.
Muzikanto patirties lygis
Galite tinkinti kuriamos muzikos sudėtingumą. Vartotojai gali pasirinkti vieną iš trijų lygių pagal savo įgūdžių lygį. Be to, jie gali nurodyti pageidaujamą sudėtingumo laipsnį: pradedantysis, vidutinis ar pažengęs.
Ši funkcija padės, jei turite šiek tiek muzikinės patirties ir norite eksperimentuoti kurdami naujas kompozicijas. Tačiau jei esate patyręs muzikantas, galite kurti įmantrią ir subtilią muziką. „MusicLM“ šios funkcijos tikslas – suteikti visiems naudotojams prieinamą patirtį.
Kartų įvairovė
Naudodami „Generation Diversity“ funkciją galite sukurti daugybę dainos versijų iš tos pačios įvesties. Be to, galite turėti įvairių išėjimų. Tai reiškia, kad AI gali sukurti kelias dainos versijas.
Be to, yra alternatyvių melodijų arba akordų progresijos, išlaikant pagrindinį dainos stilių ir struktūrą. Ši funkcija padeda kurti AI muziką kūrybiškiau. Taigi muzikos kūrimas yra labiau panašus į žmogaus dainų kūrimą.
Galimi MusicLM apribojimai
„Google“ dar nepadarė „MusicLM“ prieinamo plačiajai visuomenei, nes ji vis dar kuriama. Taigi dar negalite pateikti konkrečių muzikos, kurią gali sukurti „MusicLM“, pavyzdžių. Be to, vis dar šiek tiek nežinoma, kokius apribojimus gali turėti MusicLM.
Kadangi technologija vis dar yra ankstyvoje stadijoje, ji gali turėti tam tikrų apribojimų, susijusių su kuriamos muzikos kalibru arba jos gebėjimu apdoroti tam tikras įvestis.
Pagamintų mėginių iškraipyta kokybė yra vienas iš pagrindinių trūkumų. Tai būtinas mokymo procedūros, naudojamos kuriant MusicLM, šalutinis produktas.
Kitas trūkumas yra tas, kad nepaisant MusicLM techninių galimybių gaminti vokalą. Tai apima choro dainas. „MusicLM“ sukurti „dainų tekstai“ kartais atrodo kaip beprasmiška. Be to, juos gali būti sunku suprasti. Tačiau MusicLM vis dar kuriama ir šias problemas galima pagerinti.
Paskutinės pastabos
Galiausiai manome, kad „Google MusicLM“ technologija yra įdomi ir žavi. Stebina tai, kad dirbtinis intelektas gali kurti įvairių stilių muziką su aukštesniu tikroviškumu. MusicLM gali pakeisti muzikos verslą. Ir mes su malonumu stebime, kaip ši technologija vystosi.
Palikti atsakymą