Google DALL-E 2 сияқты терген сөздерден музыка жасайтын MusicLM жасанды интеллектін жариялады. Бұл Google Research жасаған тіл үлгісі. Сонымен қатар, олар оны тек музыка жасау үшін әзірледі.
Және ол музыкалық файлдардың үлкен деректер жинағында оқытылды және әртүрлі стильдер мен пішіндерде музыканы шығара алады. Егер сіз музыкаға қызығушылық танытсаңыз; содан кейін MusicLM не ұсынатынын тексеру керек.
MusicLM көмегімен кейбір әдістер мен формаларда музыканы шығарасыз. Мысалы, фортепиано пьесаларын, барабан соғуларын және ән мәтініне арналған әуендерді жасауға болады.
Сондай-ақ, белгілі бір мәнерлерді дәл баптай аласыз немесе пайдаланушы берген енгізуді қоса аласыз. Ол гармониялық және ырғақты үйлесімді музыканы шығаруға арналған. Сонымен, MusicLM не туралы екенін көрейік.
Алдыңғы әрекеттер
MusicLM AI жасаған алғашқы музыкалық жүйе емес. Riffusion, Dance Diffusion, Google AudioML және OpenAI Jukebox салыстырмалы тәсілдердің мысалдары болып табылады. Дегенмен, бұл бұрынғы жүйелер технологиялық шектеулермен шектелді.
Сондай-ақ олардың жаттығу деректерінің жоқтығы жоғары сапалы әуендерді шығаруды қиындатты. Дегенмен, MusicLM музыканы неғұрлым күрделі және шынайылықпен жасауға мүмкіндік береді.
MusicLM
MusicLM музыканың құрылымы мен стилін үйренеді. Осылайша, ол MIDI және символдық музыкалық файлдардың үлкен деректер жинағында оқытылады. Өзінің ұқсас бағдарламалары сияқты, MusicLM де Transformer архитектурасына негізделген.
Белгілі бір кіріс құрамдастарына шоғырлану үшін өзіндік назар аудару әдістерін пайдалана отырып, MusicLM трансформаторының архитектурасы үлкен деректер жиынтығынан музыканың құрылымы мен стилін шығару үшін пайдаланылады. Нәтижесінде гармониялық және ырғақты үйлесімді музыка жасауға болады.
Және бұл музыка пайдаланушы енгізуінің ұйымын еліктей алады. Осылайша, сіз бағдарламада арнайы сипаттаған музыкалық нәтижеге қол жеткізе аласыз.
Алдыңғы табыс тілдік модельдерGPT-2 және GPT-3 сияқты біртұтас және еркін жазуды жасау қабілетін дәлелдеген MusicLM шабыттандырды. MusicLM, екінші жағынан, тек музыкалық ұрпақ үшін жасалған бірінші тіл үлгісі.
Және бұл ең күрделі үлгілердің бірі ретінде қарастырылады деп ойлаймыз.
Ол қалай жұмыс істейді?
DALL-E 2 және Google MusicLM жасанды интеллект құрылымдық ұқсастықтары көп. Бұл жолы сіздің жазуыңыз көрнекі емес, музыкалық түрде жеткізіледі. Осы кезде сіз тұтас бөлікті толығымен құра аласыз. Сондай-ақ, сіз тек бір аспапты пайдаланып ырғақты жасай аласыз.
MusicLM компаниясының Github бетінде Google AI тобы жасаған бірнеше үлгі зерттеулерді көре аласыз. AI әлі зерттеу және әзірлеу сатысында болса да, ол шығара алатын дыбыстар жоғары ажыратымдылыққа ие. Сондай-ақ, осы AI-ны ChatGPT-пен біріктіру сияқты ұсыныстар болды. Бұл интеграция күрделі және шығармашылық музыкаға әкелуі мүмкін.
Гуммингтен хит әуендерге дейін
MusicLM төрт түрлі AI моделін біріктіреді: MuLan, AudioLM, w2v-BERT және Soundstream. Бұл модельдердің әрқайсысының өзіндік мүмкіндіктері бар. Алайда, олар біріктірілген кезде MusicLM пайда болды!
Музыканттар мен сала мамандары MusicLM-тің тіпті ең қарапайым ызылдау мен күбірлерді тұтас әуенге айналдыру мүмкіндігін байқады. ChatGPT-пен біріктіру арқылы ол бірегей музыканы шығара алады.
MusicLM арқылы жасалған музыка мен дыбыстарды тыңдап, зерттей аласыз сайтқа. Бірақ оның қазір тестілеу кезеңінде екенін есте сақтаңыз. MusicLM технология дамыған сайын музыка бизнесін толығымен өзгерту мүмкіндігіне ие екені анық.
Адамға ұқсас нюанстары бар AI жасаған музыка
Мұқият сипаттамаларға негізделген әндерді шығару үшін MusicLM 280,000 XNUMX сағаттық музыкадан тұратын үлкен деректер жинағында оқытылды. Мысалы, «терең басс пен күрделі барабан ырғағы бар әуезді дабстеп әуенін» жасауға болады. Немесе сіз одан «баурап алатын гитара рифі мен күшті вокалисті бар еліктіретін поп-әнді» жасауды сұрай аласыз. Бұл жағдайда сіздің қиялыңыз шек болып табылады.
Шығарылған әндер адам музыканттары шығарған әндерге ұқсайды. MusicLM үлгілері өте таң қалдырады. Бұл, әсіресе, композиция процесіне адам қатыспайтынын ескерсек, шындық. MusicLM музыкалық рифтер, әуендер және эмоциялар сияқты нюансты аспектілерді қайталай алады. Сонымен қатар, ол күрделі және анық сипаттамалар берілгенде де жұмыс істейді.
Маңызды ерекшеліктер
Кескіндеме Тақырыптарды кондициялау
Painting Caption Conditioning — MusicLM функциясы. Суреттің мәтіндік сипаттамасы немесе «тақырыбы» негізінде музыка жасауға болады. Бұл MusicLM суретте көрсетілген эмоцияларды, көңіл-күйді және идеяларды түсіретін музыка жасауға қабілетті екенін білдіреді. Бұл мүмкіндік фильмдерге музыка жасау үшін өте пайдалы, видео ойындары, және көрнекі ақпарат құралдарының барлық түрлері.
Story режимі
Story Mode мүмкіндігі әңгіме мәтінін кіріс ретінде қабылдайды. Демек, ол сүйемелдейтін фондық музыканы жасайды. Пайдаланушылар сценарийді немесе эмоционалды реңкті бейнелеу арқылы ертегіге, бейне ойынға немесе фильмге саундтрек жасау үшін осы функцияны пайдалана алады.
Story Mode - медиа суретшілеріне арналған ыңғайлы құрал. Осылайша, ол музыкалық стильдер мен аспаптардың кең ауқымын жасай алады. MusicLM ертегі режимі көріністің эмоционалды әсерін арттырады. Осылайша, көрермендер оқиғаға қосымша әсер ете алады.
Музыкант тәжірибесінің деңгейі
Жасалған музыканың қиындығын реттеуге болады. Пайдаланушылар шеберлік деңгейіне қарай үш деңгейдің бірін таңдай алады. Сондай-ақ, олар қалаған күрделілік дәрежесін көрсете алады: бастауыш, орта немесе жоғары.
Бұл мүмкіндік сізге музыкалық тәжірибеңіз болса және жаңа шығармалармен тәжірибе жасағыңыз келсе көмектеседі. Дегенмен, егер сіз тәжірибелі музыкант болсаңыз, сіз күрделі және нәзік музыка жасай аласыз. MusicLM бұл мүмкіндікті пайдалану мақсаты - барлық пайдаланушылар үшін қолжетімді тәжірибені ұсыну.
Ұрпақтардың әртүрлілігі
Generation Diversity функциясымен бір кірістен әннің көптеген нұсқасын жасауға болады. Сондай-ақ, сізде әртүрлі нәтижелер ауқымы болуы мүмкін. Бұл AI әннің бірнеше нұсқасын жасай алатынын білдіреді.
Сонымен қатар, әннің негізгі стилі мен құрылымын сақтай отырып, балама әуендер немесе аккордтық прогрессиялар бар. Бұл мүмкіндік AI-ның музыкалық туындысын шығармашылықпен жасауға көмектеседі. Демек, ол музыканы жасауды адамның ән жазуына ұқсас етеді.
MusicLM мүмкін шектеулері
Google әлі MusicLM-ді көпшілікке қол жетімді еткен жоқ, себебі ол әлі де әзірлену үстінде. Демек, MusicLM шығара алатын музыка түрлерінің нақты үлгілерін әлі бере алмайсыз. Сонымен қатар, MusicLM-де қандай шектеулер болуы мүмкін екені әлі белгісіз.
Технология әлі бастапқы кезеңдерінде болғандықтан, ол шығарылатын музыканың калибріне немесе белгілі бір кірістерді өңдеуге қабілеттілігіне белгілі шектеулер қоюы мүмкін.
Өндірілген үлгілердің бұрмаланған сапасы негізгі кемшіліктердің бірі болып табылады. Бұл MusicLM әзірлеу үшін пайдаланылатын оқыту процедурасының қажетті қосымша өнімі.
Тағы бір кемшілігі MusicLM-тің вокал шығарудағы техникалық мүмкіндігіне қарамастан. Оның ішінде хор әндері де бар. MusicLM шығарған «ән мәтіні» кейде бос сөз болып көрінеді. Оның үстіне, оларды түсіну қиын болуы мүмкін. Дегенмен, MusicLM әлі де даму үстінде және бұл мәселелерді жақсартуға болады.
Қорытынды ескертулер
Соңында, Google MusicLM негізінде жатқан технология қызықты әрі тартымды деп есептейміз. Жасанды интеллекттің музыканы әртүрлі стильде, жоғары реализм деңгейінде жасай алатыны таң қалдырады. MusicLM музыка бизнесін өзгерту мүмкіндігіне ие. Біз бұл технологияның қалай дамып жатқанын көруге қуаныштымыз.
пікір қалдыру