Google mengumumkan MusicLM, kecerdasan buatan yang mencipta muzik daripada perkataan yang anda taip, seperti DALL-E 2. Ia ialah model bahasa yang dicipta oleh Google Research. Selain itu, mereka telah mereka bentuknya secara eksklusif untuk penciptaan muzik.
Dan, ia telah dilatih pada set data fail muzik yang luas dan boleh menghasilkan muzik dalam pelbagai gaya dan bentuk. Jika anda berminat dalam muzik; maka anda harus menyemak apa yang akan ditawarkan oleh MusicLM.
Dengan MusicLM anda menghasilkan muzik dalam beberapa teknik dan bentuk. Contohnya, anda boleh mencipta kepingan piano, rentak gendang dan melodi untuk lirik.
Selain itu, anda boleh memperhalusi gaya tertentu atau memasukkan input yang disediakan pengguna. Ia bertujuan untuk menghasilkan muzik yang harmoni dan berirama padu. Jadi, mari kita selami dan lihat apa itu MusicLM.
Percubaan Sebelumnya
MusicLM bukanlah sistem muzik pertama yang dijana AI. Riffusion, Dance Diffusion, AudioML Google dan OpenAI's Jukebox adalah contoh pendekatan yang boleh dibandingkan. Walau bagaimanapun, sistem terdahulu ini telah dikekang oleh sekatan teknologi.
Selain itu, kekurangan data latihan mereka menyukarkan untuk mengarang lagu berkualiti tinggi. Walau bagaimanapun, MusicLM mempunyai kapasiti untuk mencipta muzik dengan tahap kecanggihan dan realisme yang lebih tinggi.
Gambaran Keseluruhan MusicLM
MusicLM mempelajari struktur dan gaya muzik. Oleh itu, ia dilatih pada set data MIDI dan fail muzik simbolik yang luas. Seperti program serupa, MusicLM dibina pada seni bina Transformer.
Menggunakan teknik perhatian kendiri untuk menumpukan pada komponen input tertentu, seni bina transformer MusicLM digunakan untuk mengekstrak struktur dan gaya muzik daripada set data yang besar. Hasilnya, anda boleh mencipta muzik padu secara harmoni dan berirama.
Dan, muzik ini boleh meniru organisasi input pengguna. Oleh itu, anda akan dapat memperoleh hasil muzik yang anda terangkan secara khusus kepada program ini.
Kejayaan sebelumnya model bahasa, seperti GPT-2 dan GPT-3, yang telah membuktikan keupayaan mereka untuk mencipta penulisan yang koheren dan lancar, memberi inspirasi kepada MusicLM. MusicLM, sebaliknya, ialah model bahasa pertama yang dibina secara eksklusif untuk penjanaan muzik.
Dan, kami fikir ia akan dianggap sebagai salah satu model yang paling canggih.
Bagaimana Ia Berfungsi?
DALL-E 2 dan MusicLM Google kecerdasan buatan berkongsi banyak persamaan struktur. Walau bagaimanapun, kali ini, penulisan anda disampaikan secara muzik dan bukannya visual. Pada ketika ini, anda boleh sama ada membina keseluruhan keseluruhan. Selain itu, anda boleh menjana irama menggunakan hanya satu instrumen.
Anda boleh melihat beberapa sampel kajian yang dibuat oleh pasukan AI Google pada halaman Github MusicLM. Walaupun AI masih dalam peringkat penyelidikan dan pembangunan, bunyi yang boleh dikeluarkan adalah resolusi tinggi. Juga, terdapat cadangan, seperti menyepadukan AI ini dengan ChatGPT. Penyepaduan ini boleh membawa kepada muzik yang lebih rumit dan kreatif.
Dari Berdengung hingga Memukul Melodi
MusicLM menggabungkan empat model AI yang berbeza: MuLan, AudioLM, w2v-BERT dan Soundstream. Walaupun setiap model ini mempunyai satu set keupayaan tersendiri. Walau bagaimanapun, apabila mereka disepadukan, mereka menghasilkan MusicLM!
Pemuzik dan profesional industri telah mengambil perhatian tentang kapasiti MusicLM untuk mengubah walaupun dengung dan murmur yang paling asas kepada keseluruhan lagu. Dengan menggabungkan dengan ChatGPT, ia boleh menghasilkan muzik yang unik.
Anda boleh mendengar dan meneroka muzik dan bunyi yang dicipta oleh MusicLM padanya laman web. Tetapi, perlu diingat bahawa ia kini dalam fasa ujian. Jelas sekali bahawa MusicLM mempunyai keupayaan untuk mengubah sepenuhnya perniagaan muzik seiring dengan perkembangan teknologi.
Muzik Dijana AI dengan Nuansa Seperti Manusia
Untuk menghasilkan lagu yang masuk akal berdasarkan penerangan yang teliti, MusicLM telah dilatih pada set data besar 280,000 jam muzik. Contohnya, anda boleh mencipta "lagu dubstep melodi dengan bes dalam dan irama dram yang canggih". Atau, anda boleh memintanya untuk mencipta "lagu pop yang menarik dengan riff gitar yang menawan dan vokalis yang kuat." Imaginasi anda adalah had dalam kes ini.
Lagu-lagu yang dihasilkan menyerupai yang digubah oleh pemuzik manusia. Sampel MusicLM sangat mengagumkan. Memang benar terutamanya memandangkan tiada manusia yang terlibat dalam proses gubahan. MusicLM boleh mengulangi aspek bernuansa seperti riff muzik, melodi dan emosi. Selain itu, ia berfungsi walaupun diberikan spesifikasi yang rumit dan eksplisit.
Ciri-ciri penting
Melukis Caption Conditioning
Painting Caption Conditioning ialah fungsi MusicLM. Anda boleh menghasilkan muzik berdasarkan penerangan teks atau "kapsyen" lukisan. Ini menunjukkan bahawa MusicLM mampu mencipta muzik yang menangkap emosi, perasaan dan idea yang dinyatakan dalam gambar. Keupayaan ini sangat membantu untuk membuat muzik untuk filem, permainan video, dan semua jenis media visual.
Mod Story
Ciri Mod Cerita mengambil teks cerita sebagai input. Oleh itu, ia mencipta muzik latar belakang yang mengiringi. Pengguna boleh menggunakan fungsi ini untuk membina runut bunyi untuk kisah, permainan video atau filem dengan menggambarkan senario atau nada emosi.
Mod Cerita ialah alat yang berguna untuk artis media. Oleh itu, ia boleh menjana pelbagai gaya dan instrumen muzik. Mod Kisah MusicLM dapat meningkatkan kesan emosi adegan. Oleh itu, penonton boleh mempunyai tahap rendaman tambahan dalam cerita.
Tahap Pengalaman Pemuzik
Anda boleh menyesuaikan kesukaran muzik yang dicipta. Pengguna boleh memilih antara tiga peringkat berdasarkan tahap kemahiran mereka. Selain itu, mereka boleh menentukan tahap kerumitan pilihan: pemula, pertengahan atau lanjutan.
Ciri ini membantu anda jika anda mempunyai sedikit kepakaran muzik dan ingin mencuba gubahan baharu. Walau bagaimanapun, jika anda seorang pemuzik berpengalaman, anda boleh mencipta muzik yang canggih dan halus. Matlamat MusicLM dengan ciri ini adalah untuk menyampaikan pengalaman yang boleh diakses untuk semua pengguna.
Kepelbagaian Generasi
Dengan fungsi Kepelbagaian Generasi, anda boleh menghasilkan banyak versi lagu daripada input yang sama. Dan, anda boleh mempunyai pelbagai output. Ini menunjukkan bahawa AI boleh menghasilkan berbilang versi lagu.
Selain itu, terdapat melodi alternatif atau janjang kord, sambil mengekalkan gaya dan struktur asas lagu. Ciri ini membantu penciptaan muzik AI menjadi lebih kreatif. Oleh itu, ia menjadikan penciptaan muzik lebih serupa dengan penulisan lagu manusia.
Kemungkinan Had MusicLM
Google belum lagi menyediakan MusicLM kepada orang ramai kerana ia masih dalam pembangunan. Oleh itu, anda masih belum boleh memberikan sampel tertentu jenis muzik yang boleh dihasilkan oleh MusicLM. Tambahan pula, masih tidak diketahui apakah sekatan yang mungkin ada pada MusicLM.
Memandangkan teknologi ini masih di peringkat awal, ia mungkin mempunyai sekatan tertentu pada kaliber muzik yang dihasilkan atau kapasitinya untuk mengendalikan input tertentu.
Kualiti terherot sampel yang dihasilkan adalah salah satu kelemahan utama. Ini adalah hasil sampingan yang diperlukan daripada prosedur latihan yang digunakan untuk membangunkan MusicLM.
Kelemahan lain ialah, walaupun MusicLM mempunyai keupayaan teknikal untuk mengeluarkan vokal. Ini termasuk lagu koir. "Lirik" yang dihasilkan oleh MusicLM kadangkala kelihatan seperti omong kosong. Selain itu, mereka boleh menjadi sukar untuk difahami. Walau bagaimanapun, MusicLM masih dalam pembangunan dan isu ini boleh diperbaiki.
Pernyataan Akhir
Akhir sekali, kami percaya bahawa teknologi yang mendasari Google MusicLM adalah menarik dan menarik. Sungguh mengagumkan bahawa AI boleh membuat muzik dalam pelbagai gaya, dengan tahap realisme yang lebih tinggi. MusicLM mempunyai potensi untuk mengubah perniagaan muzik. Dan, kami teruja untuk menonton bagaimana teknologi ini berkembang.
Sila tinggalkan balasan anda