Google ħabbret MusicLM, intelliġenza artifiċjali li toħloq mużika mill-kliem li ttajpja, bħal DALL-E 2. Huwa mudell tal-lingwa maħluq minn Google Research. Barra minn hekk, iddisinjawha esklussivament għall-ħolqien tal-mużika.
U, ġie mħarreġ fuq sett ta 'dejta vast ta' fajls tal-mużika u jista 'jipproduċi mużika f'firxa ta' stili u forom. Jekk inti interessat fil-mużika; imbagħad għandek tiċċekkja x'se joffri MusicLM.
Bil MusicLM inti tipproduċi mużika f'xi tekniki u forom. Pereżempju, tista 'toħloq biċċiet tal-pjanu, taħbit tat-tnabar, u melodiji għal-lirika.
Ukoll, tista 'tirfina għal ċerti stili jew tinkludi input ipprovdut mill-utent. Hija maħsuba biex tipproduċi mużika li hija armonikament u ritmikament koeżiva. Mela, ejja ngħaddu u naraw x'inhu l-MusicLM.
Tentattivi Preċedenti
MusicLM mhix l-ewwel sistema tal-mużika ġġenerata mill-AI. Riffusion, Dance Diffusion, AudioML ta' Google, u OpenAI's jukebox huma eżempji ta’ approċċi komparabbli. Madankollu, dawn is-sistemi preċedenti ġew kostretti minn restrizzjonijiet teknoloġiċi.
Ukoll, in-nuqqas tagħhom ta 'dejta ta' taħriġ għamilha diffiċli biex jikkomponu melodiji ta 'kwalità għolja. Madankollu, MusicLM għandu l-kapaċità li joħloq mużika b'livell akbar ta 'sofistikazzjoni u realiżmu.
Ħarsa ġenerali MusicLM
MusicLM jitgħallem l-istruttura u l-istil tal-mużika. Għalhekk, titħarreġ fuq sett ta 'dejta vast ta' fajls tal-mużika MIDI u simboliċi. Bħall-programmi simili tiegħu, MusicLM huwa mibni fuq l-arkitettura tat-Transformer.
Bl-użu ta 'tekniki ta' awto-attenzjoni biex tikkonċentra fuq komponenti ta 'input partikolari, l-arkitettura tat-transformer ta' MusicLM tintuża biex tiġi estratta l-istruttura u l-istil tal-mużika minn dataset kbir. Bħala riżultat, tista 'toħloq mużika koeżiva armonikament u ritmikament.
U, din il-mużika jistgħu jimitaw l-organizzazzjoni tal-input tal-utent. Għalhekk, tkun tista 'tikseb ir-riżultat mużikali li tiddeskrivi speċifikament għall-programm.
Is-suċċess ta 'qabel mudelli tal-lingwa, bħal GPT-2 u GPT-3, li wrew il-kapaċità tagħhom li joħolqu kitba koerenti u fluwenti, ispiraw MusicLM. MusicLM, min-naħa l-oħra, huwa l-ewwel mudell tal-lingwa li nbena esklussivament għall-ġenerazzjoni tal-mużika.
U, naħsbu li se jitqies bħala wieħed mill-aktar mudelli sofistikati.
Kif taħdem?
DALL-E 2 u MusicLM ta' Google intelliġenza artifiċjali jaqsmu ħafna xebh strutturali. Din id-darba, madankollu, il-kitba tiegħek titwassal mużikali aktar milli viżwalment. F'dan il-punt, tista 'jew tibni kompletament biċċa sħiħa. Ukoll, tista 'tiġġenera ritmu billi tuża strument wieħed biss.
Tista' tara bosta studji kampjuni maħluqa mit-tim ta' Google AI fuq il-paġna Github ta' MusicLM. Anke jekk l-AI għadha fl-istadju ta 'riċerka u żvilupp, il-ħsejjes li tista' tagħmel huma ta 'riżoluzzjoni għolja. Ukoll, kien hemm suġġerimenti, bħall-integrazzjoni ta 'din l-AI ma' ChatGPT. Din l-integrazzjoni tista' twassal għal mużika aktar kumplessa u kreattiva.
Minn Humming għal Hit Melodies
MusicLM jgħaqqad erba' mudelli distinti ta' AI: MuLan, AudioLM, w2v-BERT, u Soundstream. Għalkemm kull wieħed minn dawn il-mudelli għandu sett ta 'kapaċitajiet distintivi. Madankollu, meta ġew integrati, irriżultaw f'MusicLM!
Il-mużiċisti u l-professjonisti tal-industrija ħadu l-attenzjoni tal-kapaċità ta’ MusicLM li jittrasforma anke l-aktar hums u murmurs bażiċi f’melodiji sħaħ. Billi tikkombina ma 'ChatGPT, tista' tipproduċi mużika unika.
Tista' tisma' u tesplora l-mużika u l-ħsejjes maħluqa minn MusicLM fuqha websajt. Iżda, żomm f'moħħok li bħalissa jinsab fil-fażi tal-ittestjar. Huwa ovvju li MusicLM għandu l-abbiltà li jittrasforma kompletament in-negozju tal-mużika hekk kif tiżviluppa t-teknoloġija.
Mużika Ġenerata mill-AI b'Sfumaturi Tixbah lill-Bniedem
Biex tipproduċi kanzunetti li jagħmlu sens ibbażati fuq deskrizzjonijiet bir-reqqa, MusicLM ġie mħarreġ fuq dataset kbir ta '280,000 siegħa ta' mużika. Pereżempju, tista 'toħloq "melodic dubstep tune b'bass profond u ritmi ta' drum sofistikati". Jew, tista 'titlob għaliha biex toħloq "kanzunetta pop li tħajjar b'riff tal-kitarra attraenti u vocalist qawwi." L-immaġinazzjoni tiegħek hija l-limitu f'dan il-każ.
Il-kanzunetti prodotti jixbħu dawk komposti minn mużiċisti umani. Il-kampjuni ta' MusicLM huma estremament tal-għaġeb. Huwa veru speċjalment minħabba li m'hemm l-ebda bniedem involut fil-proċess tal-kompożizzjoni. MusicLM jista’ jirrepeti aspetti sfumati bħal riffs mużikali, melodiji, u emozzjonijiet. Barra minn hekk, jaħdem anke meta jingħata speċifikazzjonijiet ikkumplikati u espliċiti.
Karatteristiċi importanti
Pittura Caption Kundizzjonament
Painting Caption Conditioning hija funzjoni MusicLM. Tista 'tipproduċi mużika bbażata fuq deskrizzjoni testwali jew "caption" ta' pittura. Dan jimplika li MusicLM huwa kapaċi joħloq mużika li taqbad l-emozzjonijiet, il-burdata, u l-ideat espressi fi stampa. Din il-kapaċità hija utli ħafna biex tagħmel mużika għall-films, video games, u kull tip ta 'midja viżiva.
Modalità Story
Il-karatteristika tal-Modalità Storja tieħu test tal-istorja bħala input. Għalhekk, toħloq mużika fl-isfond ta' akkumpanjament. L-utenti jistgħu jużaw din il-funzjoni biex jibnu soundtrack għal tale, video game, jew film billi juru x-xenarju jew it-ton emozzjonali.
Story Mode hija għodda utli għall-artisti tal-midja. Għalhekk, jista 'jiġġenera firxa wiesgħa ta' stili u strumenti mużikali. Il-Modalità Tale ta' MusicLM iżżid l-impatt emozzjonali ta' xena. Għalhekk, it-telespettaturi jista 'jkollhom grad addizzjonali ta' immersjoni fl-istorja.
Livell ta' Esperjenza ta' Mużiċist
Tista 'tippersonalizza d-diffikultà tal-mużika maħluqa. L-utenti jistgħu jagħżlu bejn tliet livelli bbażati fuq il-livell tal-ħiliet tagħhom. Ukoll, jistgħu jispeċifikaw il-grad preferut ta 'kumplessità: Bidu, intermedju, jew avvanzat.
Din il-karatteristika tgħinek jekk għandek ftit għarfien mużikali u trid tesperimenta b'kompożizzjonijiet ġodda. Madankollu, jekk inti mużiċist b'esperjenza, tista 'toħloq mużika sofistikata u sottili. L-għan ta' MusicLM b'din il-karatteristika huwa li jagħti esperjenza aċċessibbli għall-utenti kollha.
Diversità tal-Ġenerazzjoni
Bil-funzjoni tad-Diversità tal-Ġenerazzjoni, tista 'tipproduċi ħafna verżjonijiet ta' kanzunetta mill-istess input. U, jista 'jkollok firxa varjata ta' outputs. Dan jimplika li l-AI tista 'tiġġenera verżjonijiet multipli ta' kanzunetta.
Barra minn hekk, hemm melodiji alternattivi jew progressjonijiet tal-korda, filwaqt li xorta jinżammu l-istil u l-istruttura bażika tal-kanzunetta. Din il-karatteristika tgħin lill-ħolqien tal-mużika tal-AI biex ikun aktar kreattiv. Għalhekk, jagħmel il-ħolqien tal-mużika aktar analogu għall-kitba tal-kanzunetti tal-bniedem.
Limitazzjonijiet Possibbli ta' MusicLM
Google għadha ma għamlitx MusicLM disponibbli għall-pubbliku ġenerali peress li għadu fl-iżvilupp. Għalhekk, għad ma tistax tagħti kampjuni partikolari tat-tipi ta 'mużika li MusicLM jista' jipproduċi. Barra minn hekk, għadu kemmxejn mhux magħruf x'restrizzjonijiet jista' jkollu MusicLM.
Peress li t-teknoloġija għadha fl-istadji bikrija tagħha, jista 'jkollha ċerti restrizzjonijiet fuq il-kalibru tal-mużika li tiġi prodotta jew il-kapaċità tagħha li timmaniġġja inputs partikolari.
Il-kwalità mgħawġa tal-kampjuni prodotti hija waħda mill-iżvantaġġi ewlenin. Dan huwa prodott sekondarju meħtieġ tal-proċedura ta 'taħriġ użata biex tiżviluppa MusicLM.
Żvantaġġ ieħor huwa li, minkejja l-kapaċità teknika ta 'MusicLM li timmanifattura vokali. Dan jinkludi kanzunetti tal-kor. Il-"lirika" prodotta minn MusicLM xi drabi tidher qisha ġid. Barra minn hekk, jistgħu jkunu diffiċli biex jinftiehmu. Madankollu, MusicLM għadu fl-iżvilupp u dawn il-kwistjonijiet jistgħu jittejbu.
Rimarki Finali
Fl-aħħarnett, nemmnu li t-teknoloġija sottostanti Google MusicLM hija kemm interessanti kif ukoll affaxxinanti. Huwa tal-għaġeb li AI tista 'tagħmel mużika f'varjetà ta' stili, b'livell ogħla ta 'realiżmu. MusicLM għandu l-potenzjal li jibdel in-negozju tal-mużika. U, aħna eċċitati li naraw kif din it-teknoloġija tevolvi.
Ħalli Irrispondi