Google tilkynnti MusicLM, gervigreind sem býr til tónlist úr orðunum sem þú skrifar, eins og DALL-E 2. Þetta er tungumálalíkan búið til af Google Research. Að auki hafa þeir hannað það eingöngu fyrir tónlistarsköpun.
Og það hefur verið þjálfað á miklum gagnagrunni tónlistarskráa og getur framleitt tónlist í ýmsum stílum og myndum. Ef þú hefur áhuga á tónlist; þá ættirðu að athuga hvað MusicLM mun bjóða upp á.
Með MusicLM framleiðir þú tónlist í sumum aðferðum og formum. Til dæmis geturðu búið til píanóverk, trommuslátt og laglínur fyrir texta.
Einnig geturðu fínstillt að ákveðnum stílum eða látið inntak frá notanda fylgja með. Það er ætlað að framleiða tónlist sem er samhljóða og taktfast. Svo, við skulum kafa inn og sjá hvað MusicLM snýst um.
Fyrri tilraunir
MusicLM er ekki fyrsta gervigreind-myndaða tónlistarkerfið. Riffusion, Dance Diffusion, AudioML frá Google og OpenAI Glymskratti eru dæmi um sambærilegar aðferðir. Hins vegar voru þessi fyrri kerfi takmörkuð af tæknilegum takmörkunum.
Einnig gerði skortur þeirra á þjálfunargögnum það erfitt að semja hágæða lag. Hins vegar hefur MusicLM getu til að búa til tónlist með meiri fágun og raunsæi.
Yfirlit MusicLM
MusicLM lærir uppbyggingu og stíl tónlistar. Þess vegna er það þjálfað í miklu gagnasafni MIDI og táknrænna tónlistarskráa. Eins og svipuð forrit er MusicLM byggð á Transformer arkitektúr.
Með því að nota sjálfsathyglistækni til að einbeita sér að tilteknum inntakshlutum, er spenniarkitektúr MusicLM notaður til að draga uppbyggingu og stíl tónlistar úr stóru gagnasafni. Fyrir vikið geturðu búið til samhljóða og taktfasta tónlist.
Og þessi tónlist getur líkt eftir skipulagi notendainntaksins. Þess vegna muntu geta fengið tónlistarútkomuna sem þú lýsir sérstaklega fyrir forritinu.
Árangur fyrri tungumálalíkön, eins og GPT-2 og GPT-3, sem hafa sannað getu sína til að skapa samfellda og reiprennandi skrif, veittu MusicLM innblástur. MusicLM er aftur á móti fyrsta tungumálamódelið sem var eingöngu byggt fyrir tónlistarkynslóðina.
Og við teljum að litið verði á það sem ein af fágustu gerðum.
Hvernig virkar það?
DALL-E 2 og MusicLM frá Google gervigreind deila miklu uppbyggingarlíkindum. Að þessu sinni eru skrif þín flutt tónlistarlega frekar en sjónrænt. Á þessum tímapunkti geturðu annað hvort alveg smíðað heilt verk. Einnig er hægt að búa til takt með því að nota aðeins eitt hljóðfæri.
Þú getur skoðað nokkrar sýnishornsrannsóknir sem Google gervigreindarteymið hefur búið til á Github síðu MusicLM. Jafnvel þó að gervigreindin sé enn á rannsóknar- og þróunarstigi eru hljóðin sem það getur gert háupplausn. Einnig hafa komið fram tillögur, svo sem að samþætta þessa gervigreind við ChatGPT. Þessi samþætting gæti leitt til flóknari og skapandi tónlistar.
Frá suð til slagara
MusicLM sameinar fjórar mismunandi gervigreindargerðir: MuLan, AudioLM, w2v-BERT og Soundstream. Þó að hver af þessum gerðum hafi sett af sérstakri getu. Hins vegar, þegar þeir voru samþættir, leiddu þeir til MusicLM!
Tónlistarmenn og fagmenn í iðnaði hafa tekið eftir getu MusicLM til að umbreyta jafnvel einföldustu suð og kurr í heila tóna. Með því að sameina með ChatGPT getur það framleitt einstaka tónlist.
Þú getur hlustað á og kannað tónlistina og hljóðin sem MusicLM býr til á henni vefsíðu.. En hafðu í huga að það er núna í prófunarfasa. Það er augljóst að MusicLM hefur getu til að gjörbreyta tónlistarbransanum eftir því sem tæknin þróast.
AI-mynduð tónlist með mannlegum blæbrigðum
Til að framleiða lög sem eru skynsamleg byggð á ítarlegum lýsingum var MusicLM þjálfað á stóru gagnasafni með 280,000 klukkustundum af tónlist. Til dæmis er hægt að búa til „melódískt dubstep lag með djúpum bassa og háþróaðri trommutakta“. Eða þú gætir beðið um að búa til „tælandi popplag með grípandi gítarriffi og kraftmiklum söngvara. Ímyndunaraflið er takmörkin í þessu tilfelli.
Framleidd lög líkjast lögunum sem samin eru af mannlegum tónlistarmönnum. Sýnishorn MusicLM eru afar ótrúleg. Það er satt, sérstaklega í ljósi þess að enginn maður tekur þátt í samsetningarferlinu. MusicLM getur endurtekið blæbrigði eins og tónlistarriff, laglínur og tilfinningar. Að auki virkar það jafnvel þegar gefnar eru flóknar og skýrar forskriftir.
Mikilvægir eiginleikar
Málverk Yfirskrift Conditioning
Painting Caption Conditioning er MusicLM aðgerð. Þú getur framleitt tónlist byggða á textalýsingu eða „texta“ af málverki. Þetta gefur til kynna að MusicLM sé fær um að búa til tónlist sem fangar tilfinningar, skap og hugmyndir sem koma fram í mynd. Þessi hæfileiki er mjög gagnlegur til að búa til tónlist fyrir kvikmyndir, vídeó leikur, og alls kyns myndmiðla.
Söguhamur
Sögustillingareiginleikinn tekur sögutexta sem inntak. Þess vegna skapar það meðfylgjandi bakgrunnstónlist. Notendur geta notað þessa aðgerð til að búa til hljóðrás fyrir sögu, tölvuleik eða kvikmynd með því að sýna atburðarásina eða tilfinningalegan tón.
Story Mode er handhægt tæki fyrir fjölmiðlalistamenn. Þannig getur það búið til breitt úrval af tónlistarstílum og hljóðfærum. Tale Mode MusicLM fær að auka tilfinningaleg áhrif senu. Þannig að áhorfendur geta fengið aukna dýpt í söguna.
Tónlistarreynslustig
Þú getur sérsniðið erfiðleika skapaðrar tónlistar. Notendur geta valið á milli þriggja stiga miðað við færnistig þeirra. Einnig geta þeir tilgreint ákjósanlegan flækjustig: byrjendur, miðlungs eða lengra komnir.
Þessi eiginleiki hjálpar þér ef þú hefur smá tónlistarþekkingu og vilt gera tilraunir með ný tónverk. Hins vegar, ef þú ert reyndur tónlistarmaður, geturðu búið til fágaða og fíngerða tónlist. Markmið MusicLM með þessum eiginleika er að skila aðgengilegri upplifun fyrir alla notendur.
Kynslóð fjölbreytileiki
Með Generation Diversity aðgerðinni geturðu framleitt margar útgáfur af lagi úr sama inntakinu. Og þú getur haft fjölbreytt úrval af útgangi. Þetta gefur til kynna að gervigreind gæti búið til margar útgáfur af lagi.
Að auki eru til skiptis laglínur eða hljómaframvindur, en halda samt grunnstíl og uppbyggingu lagsins. Þessi eiginleiki hjálpar tónlistarsköpun gervigreindar að vera skapandi. Þess vegna gerir það tónlistarsköpun hliðstæðari lagasmíð manna.
Mögulegar takmarkanir MusicLM
Google hefur ekki enn gert MusicLM aðgengilegt almenningi þar sem það er enn í þróun. Þess vegna geturðu ekki enn gefið sérstök sýnishorn af þeirri tegund tónlistar sem MusicLM getur framleitt. Ennfremur er enn svolítið óþekkt hvaða takmarkanir MusicLM gæti haft.
Þar sem tæknin er enn á frumstigi gæti hún haft ákveðnar takmarkanir á gæðum tónlistarinnar sem er framleidd eða getu hennar til að takast á við tiltekin inntak.
Bjaguð gæði framleiddu sýnanna eru einn af helstu göllunum. Þetta er nauðsynleg aukaafurð þjálfunarferlisins sem notað er til að þróa MusicLM.
Annar galli er að þrátt fyrir tæknilega getu MusicLM til að framleiða söng. Þar á meðal eru kórlög. „Textarnir“ sem framleiddir eru af MusicLM virðast stundum eins og bull. Að auki getur verið erfitt að skilja þau. Hins vegar er MusicLM enn í þróun og hægt er að bæta þessi mál.
Loka athugasemdir
Að lokum teljum við að tæknin sem liggur til grundvallar Google MusicLM sé bæði áhugaverð og heillandi. Það er ótrúlegt að gervigreind geti búið til tónlist í ýmsum stílum, með hærra raunsæi. MusicLM hefur möguleika á að breyta tónlistarbransanum. Og við erum spennt að fylgjast með hvernig þessi tækni þróast.
Skildu eftir skilaboð