Google njoftoi MusicLM, inteligjencë artificiale që krijon muzikë nga fjalët që shkruani, si DALL-E 2. Është një model gjuhësor i krijuar nga Google Research. Përveç kësaj, ata e kanë dizajnuar ekskluzivisht për krijimin e muzikës.
Dhe, ai është trajnuar në një grup të madh të dhënash skedarësh muzikorë dhe mund të prodhojë muzikë në një sërë stilesh dhe formash. Nëse jeni të interesuar për muzikë; atëherë duhet të kontrolloni se çfarë do të ofrojë MusicLM.
Me MusicLM prodhoni muzikë në disa teknika dhe forma. Për shembull, mund të krijoni pjesë pianoje, rrahje baterish dhe melodi për tekste këngësh.
Gjithashtu, mund të rregulloni stile të caktuara ose të përfshini hyrjen e ofruar nga përdoruesi. Ajo ka për qëllim të prodhojë muzikë që është harmonikisht dhe ritmikisht kohezive. Pra, le të zhytemi dhe të shohim se për çfarë bëhet fjalë për MusicLM.
Përpjekjet e mëparshme
MusicLM nuk është sistemi i parë muzikor i krijuar nga AI. Riffusion, Dance Diffusion, AudioML e Google dhe OpenAI Jukebox janë shembuj të qasjeve të krahasueshme. Megjithatë, këto sisteme të mëparshme u kufizuan nga kufizimet teknologjike.
Gjithashtu, mungesa e të dhënave të tyre të trajnimit e bëri të vështirë kompozimin e melodive me cilësi të lartë. Megjithatë, MusicLM ka kapacitetin për të krijuar muzikë me një nivel më të lartë sofistikimi dhe realizmi.
Përmbledhje MusicLM
MusicLM mëson strukturën dhe stilin e muzikës. Prandaj, ai trajnohet në një grup të madh të dhënash të skedarëve MIDI dhe simbolikë muzikorë. Ashtu si programet e tij të ngjashme, MusicLM është ndërtuar mbi arkitekturën Transformer.
Duke përdorur teknika të vetë-vëmendjes për t'u përqëndruar në komponentë të veçantë hyrës, arkitektura e transformatorit të MusicLM përdoret për të nxjerrë strukturën dhe stilin e muzikës nga një grup i madh të dhënash. Si rezultat, ju mund të krijoni muzikë kohezive në mënyrë harmonike dhe ritmike.
Dhe, kjo muzikë mund të imitojë organizimin e hyrjes së përdoruesit. Prandaj, do të jeni në gjendje të merrni rezultatin muzikor që i përshkruani në mënyrë specifike programit.
Suksesi i mëparshëm modelet gjuhësore, të tilla si GPT-2 dhe GPT-3, të cilat kanë dëshmuar aftësinë e tyre për të krijuar shkrime koherente dhe të rrjedhshme, frymëzuan MusicLM. MusicLM, nga ana tjetër, është modeli i parë gjuhësor që u krijua ekskluzivisht për brezin e muzikës.
Dhe, mendojmë se do të konsiderohet si një nga modelet më të sofistikuara.
Si funksionon kjo gjë?
DALL-E 2 dhe MusicLM e Google inteligjencës artificiale ndajnë shumë ngjashmëri strukturore. Këtë herë, megjithatë, shkrimi juaj përcillet muzikalisht dhe jo vizualisht. Në këtë pikë, ju ose mund të ndërtoni plotësisht një pjesë të tërë. Gjithashtu, ju mund të gjeneroni ritëm duke përdorur vetëm një instrument.
Ju mund të shikoni disa mostra studimesh të krijuara nga ekipi i Google AI në faqen Github të MusicLM. Edhe pse AI është ende në fazën e kërkimit dhe zhvillimit, tingujt që mund të lëshojë janë me rezolucion të lartë. Gjithashtu, ka pasur sugjerime, si integrimi i kësaj AI me ChatGPT. Ky integrim mund të çojë në muzikë më të ndërlikuar dhe krijuese.
Nga Humming në Hit Melodies
MusicLM kombinon katër modele të dallueshme të AI: MuLan, AudioLM, w2v-BERT dhe Soundstream. Edhe pse secili prej këtyre modeleve ka një sërë aftësish dalluese. Sidoqoftë, kur u integruan, rezultuan në MusicLM!
Muzikantët dhe profesionistët e industrisë kanë marrë parasysh aftësinë e MusicLM për të transformuar edhe zhurmat dhe murmuritjet më elementare në melodi të tëra. Duke u kombinuar me ChatGPT, ai mund të prodhojë muzikë unike.
Mund të dëgjoni dhe eksploroni muzikën dhe tingujt e krijuar nga MusicLM në të . Por, mbani në mend se aktualisht është në fazën e testimit. Është e qartë se MusicLM ka aftësinë për të transformuar plotësisht biznesin e muzikës ndërsa teknologjia zhvillohet.
Muzikë e krijuar nga AI me nuanca të ngjashme me njeriun
Për të prodhuar këngë që kanë kuptim bazuar në përshkrime të plota, MusicLM u trajnua në një grup të dhënash të madhe prej 280,000 orësh muzikë. Për shembull, mund të krijoni "një melodi melodike dubstep me një bas të thellë dhe ritme të sofistikuara daulle". Ose, mund ta kërkoni për të krijuar "një këngë joshëse pop me një riff magjepsës kitarë dhe një vokalist të fuqishëm". Imagjinata juaj është kufiri në këtë rast.
Këngët e prodhuara ngjajnë me ato të kompozuara nga muzikantë njerëzorë. Mostrat e MusicLM janë jashtëzakonisht befasuese. Është e vërtetë veçanërisht duke pasur parasysh se nuk ka asnjë njeri të përfshirë në procesin e përbërjes. MusicLM mund të përsërisë aspekte të nuancuara si riffet muzikore, meloditë dhe emocionet. Për më tepër, funksionon edhe kur jepen specifikime të ndërlikuara dhe të qarta.
Karakteristika të rëndësishme
Titulli i pikturës Kushtëzimi
Painting Caption Conditioning është një funksion MusicLM. Ju mund të prodhoni muzikë bazuar në një përshkrim tekstual ose "titull" të një pikture. Kjo nënkupton që MusicLM është në gjendje të krijojë muzikë që kap emocionet, gjendjet shpirtërore dhe idetë e shprehura në një foto. Kjo aftësi është shumë e dobishme për të bërë muzikë për filma, video games, dhe të gjitha llojet e mediave vizive.
Mode Story
Funksioni "Modaliteti i tregimit" merr një tekst tregimi si hyrje. Prandaj, krijon muzikë shoqëruese në sfond. Përdoruesit mund ta përdorin këtë funksion për të krijuar një kolonë zanore për një përrallë, lojë video ose film duke përshkruar skenarin ose tonin emocional.
Story Mode është një mjet i dobishëm për artistët e medias. Kështu, mund të gjenerojë një gamë të gjerë stilesh dhe instrumentesh muzikore. Modaliteti Tale i MusicLM mund të rrisë ndikimin emocional të një skene. Pra, shikuesit mund të kenë një shkallë shtesë të zhytjes në histori.
Niveli i përvojës së muzikantit
Mund të personalizoni vështirësinë e muzikës së krijuar. Përdoruesit mund të zgjedhin midis tre niveleve bazuar në nivelin e tyre të aftësive. Gjithashtu, ata mund të specifikojnë shkallën e preferuar të kompleksitetit: fillestar, i mesëm ose i avancuar.
Kjo veçori ju ndihmon nëse keni pak ekspertizë muzikore dhe dëshironi të eksperimentoni me kompozime të reja. Megjithatë, nëse jeni një muzikant me përvojë, mund të krijoni muzikë të sofistikuar dhe delikate. Qëllimi i MusicLM me këtë veçori është të ofrojë një përvojë të arritshme për të gjithë përdoruesit.
Diversiteti i gjeneratave
Me funksionin Generation Diversity, mund të prodhoni shumë versione të një kënge nga e njëjta hyrje. Dhe, mund të keni një gamë të larmishme rezultatesh. Kjo nënkupton që AI mund të gjenerojë versione të shumta të një kënge.
Përveç kësaj, ka melodi alternative ose përparime të akordit, duke ruajtur ende stilin dhe strukturën bazë të këngës. Kjo veçori ndihmon krijimin e muzikës së AI të jetë më kreativ. Prandaj, e bën krijimin e muzikës më analoge me shkrimin e këngëve njerëzore.
Kufizimet e mundshme të MusicLM
Google nuk e ka bërë ende MusicLM të disponueshme për publikun e gjerë pasi është ende në zhvillim. Prandaj, nuk mund të jepni ende mostra të veçanta të llojeve të muzikës që mund të prodhojë MusicLM. Për më tepër, është ende pak e panjohur se çfarë kufizimesh mund të ketë MusicLM.
Meqenëse teknologjia është ende në fazat e hershme, ajo mund të ketë kufizime të caktuara në kalibrin e muzikës që prodhohet ose në aftësinë e saj për të trajtuar inpute të veçanta.
Cilësia e shtrembëruar e mostrave të prodhuara është një nga të metat kryesore. Ky është një nënprodukt i domosdoshëm i procedurës së trajnimit të përdorur për të zhvilluar MusicLM.
Një pengesë tjetër është se, pavarësisht aftësisë teknike të MusicLM për të prodhuar vokale. Këtu përfshihen këngët e korit. "Tekstet" e prodhuara nga MusicLM nganjëherë duken si koprraci. Përveç kësaj, ato mund të jenë të vështira për t'u kuptuar. Megjithatë, MusicLM është ende në zhvillim dhe këto çështje mund të përmirësohen.
Shënime përfundimtare
Së fundi, ne besojmë se teknologjia që qëndron në themel të Google MusicLM është interesante dhe magjepsëse. Është e habitshme që një AI mund të bëjë muzikë në stile të ndryshme, me një nivel më të lartë realizmi. MusicLM ka potencialin për të ndryshuar biznesin e muzikës. Dhe, ne jemi të ngazëllyer për të parë se si kjo teknologji evoluon.
Lini një Përgjigju