Google го објави MusicLM, вештачка интелигенција која создава музика од зборовите што ги пишувате, како DALL-E 2. Тоа е јазичен модел создаден од Google Research. Освен тоа, тие го имаат дизајнирано исклучиво за создавање музика.
И, тој е обучен на огромна база на музички датотеки и може да произведува музика во низа стилови и форми. Ако сте заинтересирани за музика; тогаш треба да проверите што ќе понуди MusicLM.
Со MusicLM произведувате музика во некои техники и форми. На пример, можете да креирате парчиња пијано, ритам на тапани и мелодии за текстови.
Исто така, можете фино да се прилагодите на одредени стилови или да вклучите внесување обезбедено од корисникот. Наменет е да произведе музика која е хармонично и ритмички кохезивна. Значи, ајде да се нурнеме и да видиме што е всушност MusicLM.
Претходни обиди
MusicLM не е првиот музички систем генериран со вештачка интелигенција. Riffusion, Dance Diffusion, AudioML на Google и OpenAI Џубокс се примери за споредливи пристапи. Сепак, овие претходни системи беа ограничени од технолошки ограничувања.
Исто така, нивниот недостаток на податоци за обука го отежнува составувањето на висококвалитетни мелодии. Сепак, MusicLM има капацитет да создава музика со поголемо ниво на софистицираност и реализам.
Преглед MusicLM
MusicLM ја учи структурата и стилот на музиката. Оттука, се обучува за огромна база на податоци од MIDI и симболични музички датотеки. Како и неговите слични програми, MusicLM е изграден на архитектурата на Transformer.
Користејќи техники за самовнимание за да се концентрира на одредени влезни компоненти, трансформаторската архитектура на MusicLM се користи за извлекување на структурата и стилот на музиката од голема база на податоци. Како резултат на тоа, можете да креирате хармонично и ритмички кохезивна музика.
И, оваа музика може да ја имитира организацијата на внесувањето на корисникот. Оттука, ќе можете да го добиете музичкиот исход што конкретно го опишувате на програмата.
Успехот на претходниот јазични модели, како што се GPT-2 и GPT-3, кои го докажаа својот капацитет да создаваат кохерентно и течно пишување, го инспирираа MusicLM. MusicLM, од друга страна, е првиот јазичен модел кој е исклучиво изграден за музичката генерација.
И, мислиме дека ќе се смета за еден од најсофистицираните модели.
Како работи?
DALL-E 2 и MusicLM на Google вештачка интелигенција споделуваат многу структурни сличности. Меѓутоа, овој пат вашето пишување е пренесено музички наместо визуелно. Во овој момент, можете или целосно да конструирате цело парче. Исто така, можете да генерирате ритам користејќи само еден инструмент.
Може да видите неколку примероци на студии создадени од тимот на Google AI на страницата Github на MusicLM. Иако вештачката интелигенција сè уште е во фаза на истражување и развој, звуците што може да ги испушта се со висока резолуција. Исто така, имаше предлози, како што е интегрирање на оваа вештачка интелигенција со ChatGPT. Оваа интеграција може да доведе до посложена и креативна музика.
Од потпевнување до хит мелодии
MusicLM комбинира четири различни модели на вештачка интелигенција: MuLan, AudioLM, w2v-BERT и Soundstream. Иако секој од овие модели има сет на карактеристични способности. Меѓутоа, кога се интегрираа, резултираа со MusicLM!
Музичарите и индустриските професионалци го забележаа капацитетот на MusicLM да ги трансформира дури и најосновните брмчења и мрмори во цели мелодии. Со комбинирање со ChatGPT, може да произведе единствена музика.
Можете да ја слушате и истражувате музиката и звуците создадени од MusicLM на него . Но, имајте на ум дека моментално е во фаза на тестирање. Очигледно е дека MusicLM има способност целосно да го трансформира музичкиот бизнис како што се развива технологијата.
Музика генерирана од вештачка интелигенција со нијанси слични на луѓето
За да произведе песни кои имаат смисла врз основа на темелни описи, MusicLM беше обучен на голема база на податоци од 280,000 часа музика. На пример, можете да креирате „мелодична дабстеп мелодија со длабок бас и софистицирани ритми на тапани“. Или, би можеле да побарате да создаде „примамлива поп песна со волшебен гитарски риф и силен вокалист“. Вашата имагинација е граница во овој случај.
Произведените песни наликуваат на оние компонирани од човечки музичари. Примероците на MusicLM се крајно зачудувачки. Вистина е особено имајќи предвид дека нема човек вклучен во процесот на составување. MusicLM може да повторува нијансирани аспекти како што се музички рифови, мелодии и емоции. Освен тоа, работи дури и кога се дадени комплицирани и експлицитни спецификации.
Важни карактеристики
Сликарство Наслов Кондиционирање
Наслов за сликање Кондиционирањето е функција на MusicLM. Можете да произведувате музика врз основа на текстуален опис или „наслов“ на слика. Ова имплицира дека MusicLM е способен да создава музика што ги доловува емоциите, расположенијата и идеите изразени на сликата. Оваа способност е многу корисна за правење музика за филмови, видео игри, и сите видови визуелни медиуми.
приказната на владата
Функцијата Режим на приказна зема текст на приказна како влез. Оттука, создава придружна музика во заднина. Корисниците можат да ја користат оваа функција за да создадат саундтрак за приказна, видео игра или филм со прикажување на сценариото или емотивниот тон.
Режимот на приказна е корисна алатка за медиумски уметници. Така, може да генерира широк спектар на музички стилови и инструменти. Приказниот режим на MusicLM го зголемува емоционалното влијание на сцената. Значи, гледачите можат да имаат дополнителен степен на потопување во приказната.
Ниво на искуство на музичар
Можете да ја прилагодите тежината на креираната музика. Корисниците можат да избираат помеѓу три нивоа врз основа на нивното ниво на вештина. Исто така, тие можат да го наведат претпочитаниот степен на сложеност: почетник, среден или напреден.
Оваа функција ви помага ако имате малку музичка експертиза и сакате да експериментирате со нови композиции. Меѓутоа, ако сте искусен музичар, можете да создадете софистицирана и суптилна музика. Целта на MusicLM со оваа функција е да обезбеди достапно искуство за сите корисници.
Различност на генерациите
Со функцијата Generation Diversity, можете да произведете многу верзии на песна од истиот влез. И, може да имате различен опсег на излези. Ова имплицира дека вештачката интелигенција може да генерира повеќе верзии на песна.
Освен тоа, има алтернативни мелодии или прогресија на акордите, а сепак се задржуваат основниот стил и структура на песната. Оваа функција му помага на музичкото создавање на вештачката интелигенција да биде покреативно. Оттука, го прави создавањето музика поаналогно на човечкото пишување песни.
Можни ограничувања на MusicLM
Google сè уште не го направи MusicLM достапен за пошироката јавност бидејќи сè уште е во развој. Оттука, сè уште не можете да дадете одредени примероци од видовите музика што MusicLM може да ги произведе. Понатаму, сè уште е малку непознато какви ограничувања би можел да има MusicLM.
Бидејќи технологијата е сè уште во раните фази, може да има одредени ограничувања на калибарот на музиката што се произведува или нејзиниот капацитет да се справи со одредени влезови.
Нарушениот квалитет на произведените примероци е еден од клучните недостатоци. Ова е неопходен нуспроизвод на процедурата за обука што се користи за развој на MusicLM.
Друг недостаток е тоа што, и покрај техничката способност на MusicLM да произведува вокали. Ова вклучува хорски песни. „Текстовите“ произведени од MusicLM понекогаш изгледаат како глупости. Освен тоа, може да биде тешко да се разберат. Сепак, MusicLM сè уште е во развој и овие проблеми може да се подобрат.
Конечни забелешки
Конечно, веруваме дека технологијата на Google MusicLM е интересна и фасцинантна. Зачудувачки е што вештачката интелигенција може да прави музика во различни стилови, со повисоко ниво на реализам. MusicLM има потенцијал да го промени музичкиот бизнис. И, возбудени сме да гледаме како се развива оваа технологија.
Оставете Одговор