Googlek MusicLM iragarri zuen, idazten dituzun hitzetatik musika sortzen duen adimen artifiziala, DALL-E 2 bezalakoa. Google Research-ek sortutako hizkuntza-eredua da. Gainera, musika sorkuntzarako soilik diseinatu dute.
Eta musika-fitxategien datu-multzo zabal batean trebatu da eta hainbat estilo eta formatako musika sor dezake. Musika interesatzen bazaizu; orduan MusicLM-k zer eskainiko duen egiaztatu beharko zenuke.
MusicLM-rekin musika ekoizten duzu teknika eta forma batzuetan. Esate baterako, piano piezak, bateria-taupadak eta letren melodiak sor ditzakezu.
Gainera, estilo jakin batzuetara doi ditzakezu edo erabiltzaileak emandako sarrera sar dezakezu. Harmonikoki eta erritmikoki kohesionatua den musika ekoizteko da. Beraz, murgil gaitezen eta ikus dezagun zer den MusicLM.
Aurreko Saiakerak
MusicLM ez da AI-k sortutako lehen musika sistema. Riffusion, Dance Diffusion, Google-ren AudioML eta OpenAI-ak Jukebox planteamendu konparagarrien adibideak dira. Hala ere, aurreko sistema hauek murrizketa teknologikoek mugatu zituzten.
Gainera, haien prestakuntza-datu faltak kalitate handiko doinuak konposatzea zaildu zuen. Hala ere, MusicLM-k musika sofistikazio eta errealismo maila handiagoarekin sortzeko gaitasuna du.
Ikuspegi orokorra MusicLM
MusicLM-k musikaren egitura eta estiloa ikasten du. Horregatik, MIDI eta musika fitxategi sinbolikoen datu multzo zabal batean trebatzen da. Bere antzeko programak bezala, MusicLM Transformer arkitekturan eraikia dago.
Sarrerako osagai jakinetan kontzentratzeko auto-arreta teknikak erabiliz, MusicLM-ren arkitektura transformatzailea erabiltzen da datu multzo handi batetik musikaren egitura eta estiloa ateratzeko. Ondorioz, harmonikoki eta erritmikoki kohesionatutako musika sor dezakezu.
Eta, musika honek erabiltzaileen sarreraren antolaketa imita dezake. Hori dela eta, programan zehazki deskribatzen duzun musika-emaitza lortu ahal izango duzu.
Aurrekoaren arrakasta hizkuntza ereduak, hala nola GPT-2 eta GPT-3, idazkera koherentea eta jarioa sortzeko gaitasuna frogatu dutenek, inspiratu zuten MusicLM. MusicLM, berriz, musika belaunaldiarentzat esklusiboki eraiki zen lehen hizkuntza eredua da.
Eta, eredu sofistikatuenetako bat bezala hartuko dela uste dugu.
Nola funtzionatzen du?
DALL-E 2 eta Google-ren MusicLM adimen artifizialeko egiturazko antzekotasun asko partekatzen dituzte. Oraingoan, baina, zure idazkera bisualki baino musikalki transmititzen da. Une honetan, pieza oso bat guztiz eraiki dezakezu. Gainera, erritmoa sor dezakezu instrumentu bakarra erabiliz.
Google AI taldeak sortutako hainbat ikerketa lagin ikus ditzakezu MusicLM-ren Github orrian. Nahiz eta AI oraindik ikerketa eta garapen fasean dagoen, egin ditzakeen soinuak bereizmen handikoak dira. Gainera, iradokizunak izan dira, esate baterako, AI hau ChatGPT-ekin integratzea. Integrazio honek musika korapilatsuagoa eta sortzaileagoa ekar dezake.
Humming-etik Hit Melodiesetara
MusicLM-k lau AI eredu desberdin konbinatzen ditu: MuLan, AudioLM, w2v-BERT eta Soundstream. Eredu horietako bakoitzak gaitasun bereizgarri multzo bat badu ere. Hala ere, integratu zirenean, MusicLM sortu zuten!
Musikariek eta industriako profesionalek ohartu dira MusicLM-ek zurrumurru eta zurrumurru oinarrizkoenak doinu osoetan bihurtzeko duen gaitasunaz. ChatGPT-rekin konbinatuz, musika berezia sor dezake.
MusicLM-k sortutako musika eta soinuak entzun eta arakatu ditzakezu bere horretan . Baina, kontuan izan une honetan proba fasean dagoela. Bistakoa da MusicLM-k musikaren negozioa guztiz eraldatzeko gaitasuna duela teknologia garatzen den heinean.
AI-k sortutako musika, gizakiaren antzeko ñabardurarekin
Deskribapen sakonetan oinarrituta zentzua duten abestiak sortzeko, MusicLM 280,000 orduko musikako datu multzo handi batean trebatu zen. Adibidez, "dubstep doinu melodiko bat baxu sakon batekin eta bateria-erritmo sofistikatuekin" sor dezakezu. Edo, eska dezakezu "pop abesti erakargarri bat gitarra riff liluragarri batekin eta ahots indartsu batekin". Zure irudimena da muga kasu honetan.
Ekoiztutako abestiek giza musikariek konposatutakoen antza dute. MusicLM-ren laginak oso harrigarriak dira. Egia da, batez ere, konposizio-prozesuan gizakirik ez dagoela parte hartzen. MusicLM-k ñabarduradun alderdiak errepika ditzake, hala nola musika-riffak, doinuak eta emozioak. Gainera, zehaztapen konplikatuak eta esplizituak emanda ere funtzionatzen du.
Ezaugarri garrantzitsuak
Pintura Epigrafea Girotzea
Painting Caption Conditioning MusicLM funtzio bat da. Margolan baten testu-deskribapen edo "oinaren" testuan oinarritutako musika ekoiz dezakezu. Horrek esan nahi du MusicLM gai dela irudi batean adierazitako emozioak, aldarteak eta ideiak jasotzen dituen musika sortzeko. Gaitasun hau oso lagungarria da filmetarako musika egiteko, bideo-jokoak, eta mota guztietako euskarri bisualak.
Story Mode
Story Mode funtzioak istorio testu bat hartzen du sarrera gisa. Hori dela eta, hondoko musika sortzen du. Erabiltzaileek funtzio hau erabil dezakete ipuin, bideo-joko edo film baten soinu-banda sortzeko eszenatokia edo tonu emozionala irudikatuz.
Story Mode tresna erabilgarria da komunikabideetako artistentzat. Horrela, musika-estilo eta instrumentu sorta zabala sor dezake. MusicLM-ren Tale Mode-k eszena baten eragin emozionala areagotzen du. Beraz, ikusleek istorioan murgiltze maila gehigarria izan dezakete.
Musikari Esperientzia Maila
Sortutako musikaren zailtasuna pertsonaliza dezakezu. Erabiltzaileek hiru mailaren artean aukera dezakete beren trebetasun mailaren arabera. Gainera, hobetsitako konplexutasun-maila zehaztu dezakete: hasiberria, ertaina edo aurreratua.
Ezaugarri honek musika trebetasun apur bat baduzu eta konposizio berriekin esperimentatu nahi baduzu. Hala ere, esperientziadun musikaria bazara, musika sofistikatua eta sotila sor dezakezu. MusicLM-ren helburua funtzio honekin erabiltzaile guztientzat esperientzia eskuragarria eskaintzea da.
Belaunaldi Aniztasuna
Generation Diversity funtzioarekin, abesti baten bertsio asko ekoiz ditzakezu sarrera beretik. Eta irteera sorta anitza izan dezakezu. Horrek esan nahi du AIak abesti baten bertsio anitz sor ditzakeela.
Gainera, melodiak edo akordeen progresioak daude, abestiaren oinarrizko estiloa eta egitura mantenduz. Ezaugarri honek AI-ren musika-sorkuntza sortzaileagoa izaten laguntzen du. Horregatik, musika-sorkuntza gizakien abestien idazketaren antzekoagoa bihurtzen du.
MusicLM-ren muga posibleak
Google-k oraindik ez du jarri MusicLM publiko orokorrarentzat eskuragarri, oraindik garatzen ari baita. Hori dela eta, oraindik ezin duzu MusicLM-k ekoitzi dezakeen musika motaren lagin zehatzik eman. Gainera, oraindik pixka bat ezezaguna da MusicLM-k zer murrizketa izan ditzakeen.
Teknologia oraindik hasierako fasean dagoenez, ekoizten den musikaren kalibrean edo sarrera jakin batzuk kudeatzeko gaitasunean murrizketa batzuk izan ditzake.
Ekoiztutako laginen kalitate distortsionatua da eragozpen nagusietako bat. Hau MusicLM garatzeko erabilitako prestakuntza-prozeduraren beharrezko azpiproduktua da.
Beste eragozpen bat hori da, MusicLM-k ahotsak fabrikatzeko duen gaitasun teknikoa izan arren. Honek abesbatzako abestiak biltzen ditu. MusicLM-ek ekoitzitako "letrak" iragarkiak dirudite batzuetan. Gainera, zailak izan daitezke ulertzea. Hala ere, MusicLM oraindik garatzen ari da eta gai hauek hobetu daitezke.
Azken Oharrak
Azkenik, Google MusicLMren azpian dagoen teknologia interesgarria eta liluragarria dela uste dugu. Harrigarria da AI batek hainbat estilotako musika egin dezakeela, errealismo maila handiagoarekin. MusicLM-k musikaren negozioa aldatzeko ahalmena du. Eta teknologia hau nola eboluzionatzen den ikusteak ilusioz gaude.
Utzi erantzun bat