Afaka mampiasa AI ve ianao hamorona rakitsoratra vaovao avy amin'ny mpanakanto tianao indrindra?
Ny fandrosoana vao haingana momba ny fianarana milina dia naneho fa ny maodely ankehitriny dia afaka mahatakatra angon-drakitra sarotra toy ny lahatsoratra sy sary. Ny Jukebox OpenAI dia manaporofo fa na ny mozika aza dia azo atao modely amin'ny tambajotra neural.
Ny mozika dia zavatra sarotra atao modely. Tsy maintsy dinihinao ireo endri-javatra tsotra roa toy ny tempo, ny feo, ny feo ary ny endri-javatra sarotra kokoa toy ny tononkira, zavamaneno ary rafitra mozika.
Mampiasa advanced fianarana milina teknika, OpenAI dia nahita fomba hamadihana ny feo manta ho fanehoana izay azon'ny modely hafa ampiasaina.
Ity lahatsoratra ity dia hanazava izay azon'ny Jukebox atao, ny fomba fiasany, ary ny fetran'ny teknolojia ankehitriny.
Inona ny Jukebox AI?
boaty juke dia modely neural net avy amin'ny OpenAI izay afaka mamorona mozika miaraka amin'ny fihirana. Ny modely dia afaka mamokatra mozika amin'ny karazana karazana sy fomba artista.
Ohatra, Jukebox dia afaka mamokatra hira rock amin'ny fomba Elvis Presley na mozika hip hop amin'ny fomba Kanye West. Afaka mitsidika ity ianao tranonkala mba hijerena ny fahombiazan'ny modely amin'ny fakana ny feon'ireo mpanakanto sy karazana mozika tianao indrindra.
Ny modely dia mitaky karazana, mpanakanto ary tononkira ho fampidirana. Ity fampidirana ity dia mitarika modely voaofana amin'ny artista sy angona tononkira an-tapitrisany.
Ahoana ny fiasan'ny Jukebox?
Andeha hojerentsika ny fomba hitantanan'i Jukebox hamokatra feo vaovao manta avy amin'ny maodely voaofana amin'ny hira an-tapitrisany.
Fanodinkodinana
Raha mampiasa angon-drakitra fanofanana MIDI ny maodely famokarana mozika sasany, ny Jukebox dia voaofana amin'ny rakitra audio manta. Mba hanesorana ny feo ho any amin'ny toerana mitokana, Jukebox dia mampiasa fomba fiasa auto-encoder fantatra amin'ny anarana hoe VQ-VAE.
VQ-VAE mijoro ho an'ny Vector Quantized Variational Autoencoder, izay mety ho saro-takarina, ka andao hovakiana.
Andeha aloha hojerentsika izay tiantsika hatao eto. Raha ampitahaina amin'ny tononkira na mozika an-tsoratra, ny rakitra audio manta dia sarotra kokoa. Raha tiantsika ny “hianatra” ny modely ataontsika amin'ny hira, dia tsy maintsy ovaintsika izany ho fanehoana mipoitra sy tsotsotra kokoa. In fianarana milina, antsointsika hoe a habaka miafina.
An autoencode dia teknika fianarana tsy misy fanaraha-maso izay mampiasa a ny tambazotran'ny fahasalamana mba hitadiavana fanehoana miafina tsy misy tsipika ho an'ny fizarana angon-drakitra iray. Ny autoencoder dia misy ampahany roa: encoder sy decoder.
The encoder miezaka mitady ny habaka miafina avy amin'ny fitambaran'ny angona manta raha ny decoder mampiasa ny fanehoana miafina mba hanandramana hanorina azy indray amin'ny endriny voalohany. Ny autoencoder dia tena mianatra ny fomba hanesorana ny angona manta amin'ny fomba manamaivana ny fahadisoana amin'ny fanamboarana.
Ankehitriny rehefa fantatsika ny ataon'ny autoencoder, andeha hojerentsika ny tiana holazaina amin'ny autoencoder "variational". Raha ampitahaina amin'ny autoencoders mahazatra, ny autoencoders variational dia manampy alohan'ny toerana miafina.
Raha tsy mitsoraka ao amin'ny matematika, ny fampidirana ny probabilistika mialoha dia mitazona ny fizarana miafina akaiky. Ny fahasamihafana lehibe eo amin'ny VAE sy ny VQ-VAE dia ny fampiasana solontena miafina miavaka fa tsy mitohy.
Ny haavon'ny VQ-VAE tsirairay dia mamadika tsy miankina ny fampidirana. Ny fiodinana amin'ny ambaratonga ambany dia mamokatra fanavaozana kalitao avo indrindra. Ny encoding ambony indrindra dia mitazona fampahalalana mozika tena ilaina.
Mampiasa Transformers
Amin'izao fotoana izao dia manana ny kaody mozika nofehezin'ny VQ-VAE isika, afaka manandrana izany mamorona mozika ao amin'ity toerana malalaka voaporitra ity.
Jukebox mampiasa Transformers autoregressive mba hamoronana ny output audio. Transformers dia karazana tambajotra neural izay miasa tsara indrindra amin'ny angona voafantina. Raha jerena ny filaharan'ny famantarana, ny maodelin'ny mpanova dia hanandrana haminavina ny famantarana manaraka.
Jukebox dia mampiasa variana tsotsotra an'ny Sparse Transformers. Rehefa voaofana avokoa ny maodely teo aloha, dia mamokatra kaody voaporitra ny mpanova izay avadika ho feo manta amin'ny alalan'ny décoder VQ-VAE avy eo.
Mpanakanto sy Genre Conditioning ao amin'ny Jukebox
Ny maodelin'ny famoronana Jukebox dia natao azo fehezina kokoa amin'ny fanomezana famantarana misy fepetra fanampiny mandritra ny dingana fanofanana.
Ny modely voalohany dia omen'ny mpanakanto sy ny etikety karazana ho an'ny hira tsirairay. Mampihena ny entropy amin'ny vinavinan'ny feo izany ary mamela ny modely hahatratra kalitao tsara kokoa. Ny etikety koa dia ahafahantsika mamily ny modely amin'ny fomba manokana.
Ankoatra ny mpanakanto sy ny karazana, dia ampiana famantarana ny fotoana mandritra ny fotoana fiofanana. Ireo famantarana ireo dia ahitana ny halavan'ny hira, ny fotoana fanombohan'ny santionany manokana, ary ny ampahany amin'ny hira efa lasa. Ity fampahalalana fanampiny ity dia manampy ny maodely hahatakatra ny lamina audio izay miankina amin'ny rafitra ankapobeny.
Ohatra, mety ho fantatry ny modely fa ny tehaka amin'ny mozika mivantana dia mitranga amin'ny faran'ny hira iray. Ny modely dia afaka mianatra ihany koa, ohatra, fa ny karazana sasany dia manana fizarana fitaovana lava kokoa noho ny hafa.
Lyrics
Ireo modely misy fepetra voalaza ao amin'ny fizarana teo aloha dia afaka mamorona feo mihira isan-karazany. Na izany aza, ireo feo ireo dia matetika tsy mirindra sy tsy fantatra.
Mba hifehezana ny modelim-pamokarana rehefa tonga amin'ny famoronana tononkira, ny mpikaroka dia manome sehatra bebe kokoa amin'ny fotoana fampiofanana. Mba hanampiana amin'ny sarintany ny angona tononkira amin'ny fotoana amin'ny feo tena izy, dia nampiasain'ny mpikaroka Spleeter hanesorana feo sy NUS AutoLyricsAlign mba hahazoana fampifanarahana amin'ny haavon'ny teny amin'ny tononkira.
Famerana ny Modely Jukebox
Ny iray amin'ireo fetra lehibe indrindra amin'ny Jukebox dia ny fahatakarany ireo rafitra mozika lehibe kokoa. Ohatra, ny clip fohy 20 segondra amin'ny vokatra dia mety hanaitra, saingy ho hitan'ny mpihaino fa tsy hita ao amin'ny famoahana farany ny rafitra mozika mahazatra amin'ny adina sy andininy miverimberina.
Ny modely koa dia miadana amin'ny famoahana. Mila adiny 9 eo ho eo vao mamoaka feo iray minitra feno. Izany dia mametra ny isan'ny hira azo amboarina ary manakana ny modely tsy hampiasaina amin'ny fampiharana interactive.
Farany, ny mpikaroka dia nanamarika fa ny angon-drakitra santionany dia amin'ny teny anglisy ary mampiseho indrindra ny fivoriambe mozika tandrefana. Ireo mpikaroka AI dia afaka mifantoka amin'ny fikarohana ho avy amin'ny famokarana mozika amin'ny fiteny hafa sy ny mozika tsy tandrefana.
Famaranana
Ny tetikasa Jukebox dia manasongadina ny fitomboan'ny fahaiza-manaon'ny maodely fianarana milina mba hamoronana fanehoana miafina marina momba ny angona sarotra toy ny feo manta. Misy fandrosoana mitovy amin'izany ao amin'ny lahatsoratra, toy ny hita amin'ny tetikasa toy ny GPT-3, ary sary, araka ny hita ao amin'ny OpenAI's DALL-E2.
Na dia nahavariana aza ny fikarohana ao amin'ity habaka ity, dia mbola misy ny ahiahy momba ny zon'ny fananana ara-tsaina sy ny fiantraikan'ireo modely ireo amin'ny indostrian'ny famoronana amin'ny ankapobeny. Ny mpikaroka sy ny mpamorona dia tokony hanohy hiara-miasa akaiky mba hahazoana antoka fa afaka mihatsara hatrany ireo modely ireo.
Mety ho fitaovana ho an'ny mpitendry mozika na ho fampiharana ho an'ny mpamorona mila mozika mahazatra ho an'ny tetikasa ny maodely mozika miteraka ho avy.
Leave a Reply