Inanunsyo ng Google ang MusicLM, artificial intelligence na lumilikha ng musika mula sa mga salitang tina-type mo, tulad ng DALL-E 2. Ito ay isang modelo ng wika na ginawa ng Google Research. Bukod, eksklusibo nilang idinisenyo ito para sa paglikha ng musika.
At, ito ay sinanay sa isang malawak na dataset ng mga file ng musika at maaaring makagawa ng musika sa isang hanay ng mga estilo at anyo. Kung ikaw ay interesado sa musika; pagkatapos ay dapat mong suriin kung ano ang iaalok ng MusicLM.
Sa MusicLM gumagawa ka ng musika sa ilang mga diskarte at anyo. Halimbawa, maaari kang lumikha ng mga piyesa ng piano, drums beats, at melodies para sa lyrics.
Gayundin, maaari kang mag-fine-tune sa ilang partikular na istilo o magsama ng input na ibinigay ng user. Ito ay sinadya upang makabuo ng musika na harmonically at rhythmically cohesive. Kaya, sumisid tayo at tingnan kung ano ang tungkol sa MusicLM.
Mga Nakaraang Pagtatangka
Ang MusicLM ay hindi ang unang sistema ng musika na binuo ng AI. Riffusion, Dance Diffusion, Google's AudioML, at OpenAI's Jukebox ay mga halimbawa ng maihahambing na mga diskarte. Gayunpaman, ang mga naunang sistemang ito ay napigilan ng mga teknolohikal na paghihigpit.
Gayundin, ang kanilang kakulangan sa data ng pagsasanay ay nagpahirap sa pagbuo ng mga de-kalidad na himig. Gayunpaman, may kapasidad ang MusicLM na lumikha ng musika na may mas mataas na antas ng pagiging sopistikado at pagiging totoo.
Pangkalahatang-ideya ng MusicLM
Natutunan ng MusicLM ang istraktura at istilo ng musika. Kaya naman, sinasanay ito sa isang malawak na dataset ng MIDI at simbolikong mga file ng musika. Tulad ng mga katulad na programa nito, ang MusicLM ay binuo sa arkitektura ng Transformer.
Ang paggamit ng mga diskarte sa sariling pansin upang tumutok sa mga partikular na bahagi ng input, ang arkitekturang transformer ng MusicLM ay ginagamit upang kunin ang istraktura at istilo ng musika mula sa isang malaking dataset. Bilang resulta, maaari kang lumikha ng harmonically at rhythmically cohesive na musika.
At, maaaring gayahin ng musikang ito ang organisasyon ng input ng user. Kaya, makukuha mo ang resulta ng musika na partikular mong inilalarawan sa programa.
Ang tagumpay ng nakaraan mga modelo ng wika, tulad ng GPT-2 at GPT-3, na nagpatunay ng kanilang kapasidad na lumikha ng magkakaugnay at matatas na pagsulat, ang nagbigay inspirasyon sa MusicLM. Ang MusicLM, sa kabilang banda, ay ang unang modelo ng wika na eksklusibong binuo para sa henerasyon ng musika.
At, sa tingin namin ito ay ituring na isa sa mga pinaka-sopistikadong modelo.
Paano ito gumagana?
DALL-E 2 at MusicLM ng Google artificial intelligence magbahagi ng maraming pagkakatulad sa istruktura. Sa pagkakataong ito, gayunpaman, ang iyong pagsusulat ay inihahatid sa musika kaysa sa biswal. Sa puntong ito, maaari mong ganap na bumuo ng isang buong piraso. Gayundin, maaari kang bumuo ng ritmo gamit ang isang instrumento lamang.
Maaari mong tingnan ang ilang sample na pag-aaral na ginawa ng Google AI team sa Github page ng MusicLM. Kahit na ang AI ay nasa yugto pa rin ng pananaliksik at pag-unlad, ang mga tunog na nagagawa nito ay mataas ang resolution. Gayundin, may mga mungkahi, tulad ng pagsasama nitong AI sa ChatGPT. Ang pagsasamang ito ay maaaring humantong sa mas masalimuot at malikhaing musika.
Mula sa Humming hanggang Hit Melodies
Pinagsasama ng MusicLM ang apat na natatanging modelo ng AI: MuLan, AudioLM, w2v-BERT, at Soundstream. Bagaman ang bawat isa sa mga modelong ito ay may isang hanay ng mga natatanging kakayahan. Gayunpaman, nang sila ay pinagsama, nagresulta sila sa MusicLM!
Napansin ng mga musikero at propesyonal sa industriya ang kakayahan ng MusicLM na ibahin ang kahit na ang pinakapangunahing mga huni at bulungan sa buong mga himig. Sa pamamagitan ng pagsasama sa ChatGPT, makakagawa ito ng natatanging musika.
Maaari kang makinig at tuklasin ang musika at mga tunog na nilikha ng MusicLM dito website. Ngunit, tandaan na ito ay kasalukuyang nasa yugto ng pagsubok. Malinaw na ang MusicLM ay may kakayahang ganap na baguhin ang negosyo ng musika habang umuunlad ang teknolohiya.
AI-Generated Music na may Mga Nuance na Parang Tao
Upang makagawa ng mga kantang may katuturan batay sa masusing paglalarawan, ang MusicLM ay sinanay sa isang malaking dataset ng 280,000 oras ng musika. Halimbawa, maaari kang lumikha ng "isang melodic dubstep tune na may malalim na bass at sopistikadong drum ritmo." O, maaari mong hilingin na lumikha ito ng "isang nakakaakit na pop na kanta na may mapang-akit na riff ng gitara at isang malakas na bokalista." Ang iyong imahinasyon ay ang limitasyon sa kasong ito.
Ang mga ginawang kanta ay kahawig ng mga nilikha ng mga taong musikero. Ang mga sample ng MusicLM ay lubhang kataka-taka. Ito ay totoo lalo na kung walang tao na kasangkot sa proseso ng komposisyon. Maaaring ulitin ng MusicLM ang mga nuanced na aspeto tulad ng mga musical riff, melodies, at emosyon. Bukod dito, gumagana ito kahit na binigyan ng kumplikado at tahasang mga pagtutukoy.
Mahalagang Tampok
Painting Caption Conditioning
Ang Painting Caption Conditioning ay isang function ng MusicLM. Maaari kang gumawa ng musika batay sa isang tekstuwal na paglalarawan o "caption" ng isang pagpipinta. Ito ay nagpapahiwatig na ang MusicLM ay may kakayahang lumikha ng musika na kumukuha ng mga emosyon, mood, at ideya na ipinahayag sa isang larawan. Ang kakayahang ito ay lubhang nakakatulong para sa paggawa ng musika para sa mga pelikula, video laro, at lahat ng uri ng visual media.
Story Mode
Ang feature na Story Mode ay tumatagal ng isang story text bilang input. Samakatuwid, lumilikha ito ng kasamang background music. Maaaring gamitin ng mga user ang function na ito upang bumuo ng soundtrack para sa isang kuwento, video game, o pelikula sa pamamagitan ng pagpapakita ng senaryo o emosyonal na tono.
Ang Story Mode ay isang madaling gamiting tool para sa mga media artist. Kaya, maaari itong makabuo ng malawak na hanay ng mga istilo at instrumento ng musika. Napapalaki ng Tale Mode ng MusicLM ang emosyonal na epekto ng isang eksena. Kaya, ang mga manonood ay maaaring magkaroon ng karagdagang antas ng pagsasawsaw sa kuwento.
Antas ng Karanasan sa Musikero
Maaari mong i-customize ang kahirapan ng nilikhang musika. Maaaring pumili ang mga user sa pagitan ng tatlong antas batay sa kanilang antas ng kasanayan. Gayundin, maaari nilang tukuyin ang gustong antas ng pagiging kumplikado: baguhan, intermediate, o advanced.
Tinutulungan ka ng feature na ito kung mayroon kang kaunting kadalubhasaan sa musika at gusto mong mag-eksperimento sa mga bagong komposisyon. Gayunpaman, kung ikaw ay isang makaranasang musikero, maaari kang lumikha ng sopistikado at banayad na musika. Ang layunin ng MusicLM sa tampok na ito ay maghatid ng isang naa-access na karanasan para sa lahat ng mga gumagamit.
Pagkakaiba-iba ng Henerasyon
Gamit ang Generation Diversity function, makakagawa ka ng maraming bersyon ng isang kanta mula sa parehong input. At, maaari kang magkaroon ng iba't ibang hanay ng mga output. Ito ay nagpapahiwatig na ang AI ay maaaring bumuo ng maraming bersyon ng isang kanta.
Bukod dito, may mga alternatibong melodies o chord progressions, habang pinapanatili pa rin ang pangunahing istilo at istraktura ng kanta. Tinutulungan ng feature na ito ang paglikha ng musika ng AI na maging mas malikhain. Kaya naman, ginagawa nitong mas kahalintulad ang paglikha ng musika sa pagsulat ng kanta ng tao.
Mga Posibleng Limitasyon ng MusicLM
Hindi pa ginagawa ng Google ang MusicLM na magagamit sa pangkalahatang publiko dahil ito ay nasa pagbuo pa rin. Kaya naman, hindi ka pa makakapagbigay ng mga partikular na sample ng mga uri ng musika na kayang gawin ng MusicLM. Higit pa rito, hindi pa rin alam kung anong mga paghihigpit ang maaaring magkaroon ng MusicLM.
Dahil ang teknolohiya ay nasa maagang yugto pa lamang, maaari itong magkaroon ng ilang partikular na paghihigpit sa kalibre ng musika na ginawa o ang kapasidad nitong pangasiwaan ang mga partikular na input.
Ang sira na kalidad ng mga ginawang sample ay isa sa mga pangunahing disbentaha. Ito ay isang kinakailangang byproduct ng pamamaraan ng pagsasanay na ginamit upang bumuo ng MusicLM.
Ang isa pang disbentaha ay, sa kabila ng teknikal na kakayahan ng MusicLM na gumawa ng mga vocal. Kabilang dito ang mga awit ng koro. Ang "lyrics" na ginawa ng MusicLM kung minsan ay parang walang kwenta. Bukod dito, mahirap silang intindihin. Gayunpaman, ang MusicLM ay nasa pagbuo pa rin at ang mga isyung ito ay maaaring mapabuti.
Final Remarks
Sa wakas, naniniwala kami na ang teknolohiyang pinagbabatayan ng Google MusicLM ay parehong kawili-wili at kaakit-akit. Nakapagtataka na ang isang AI ay makakagawa ng musika sa iba't ibang istilo, na may mas mataas na antas ng pagiging totoo. May potensyal ang MusicLM na baguhin ang negosyo ng musika. At, nasasabik kaming panoorin kung paano umuunlad ang teknolohiyang ito.
Mag-iwan ng Sagot