Google mengumumkan MusicLM, kecerdasan buatan yang membuat musik dari kata-kata yang Anda ketik, seperti DALL-E 2. Ini adalah model bahasa yang dibuat oleh Google Research. Selain itu, mereka secara eksklusif mendesainnya untuk kreasi musik.
Dan, itu telah dilatih pada kumpulan data file musik yang luas dan dapat menghasilkan musik dalam berbagai gaya dan bentuk. Jika Anda tertarik dengan musik; maka Anda harus memeriksa apa yang akan ditawarkan MusicLM.
Dengan MusicLM Anda menghasilkan musik dalam beberapa teknik dan bentuk. Misalnya, Anda dapat membuat karya piano, ketukan drum, dan melodi untuk lirik.
Selain itu, Anda dapat menyempurnakan gaya tertentu atau menyertakan masukan yang diberikan pengguna. Ini dimaksudkan untuk menghasilkan musik yang harmonis dan ritmis yang kohesif. Jadi, mari selami dan lihat apa itu MusicLM.
Upaya Sebelumnya
MusicLM bukanlah sistem musik buatan AI pertama. Riffusion, Dance Diffusion, AudioML Google, dan OpenAI Jukebox adalah contoh pendekatan yang sebanding. Namun, sistem sebelumnya ini dibatasi oleh batasan teknologi.
Juga, kurangnya data pelatihan membuat sulit untuk membuat lagu berkualitas tinggi. Namun, MusicLM memiliki kapasitas untuk menciptakan musik dengan tingkat kecanggihan dan realisme yang lebih tinggi.
Ikhtisar MusikLM
MusicLM mempelajari struktur dan gaya musik. Oleh karena itu, ia dilatih pada kumpulan data besar MIDI dan file musik simbolik. Seperti program serupa lainnya, MusicLM dibangun di atas arsitektur Transformer.
Memanfaatkan teknik perhatian diri untuk berkonsentrasi pada komponen input tertentu, arsitektur transformator MusicLM digunakan untuk mengekstraksi struktur dan gaya musik dari kumpulan data besar. Hasilnya, Anda dapat membuat musik yang harmonis dan ritmis.
Dan, musik ini dapat meniru pengaturan masukan pengguna. Karenanya, Anda akan bisa mendapatkan hasil musik yang secara khusus Anda gambarkan untuk program tersebut.
Kesuksesan sebelumnya model bahasa, seperti GPT-2 dan GPT-3, yang telah membuktikan kemampuannya dalam membuat tulisan yang koheren dan lancar, menginspirasi MusicLM. MusicLM, di sisi lain, adalah model bahasa pertama yang dibuat khusus untuk generasi musik.
Dan, menurut kami ini akan dianggap sebagai salah satu model tercanggih.
Bagaimana Apakah Ini Bekerja?
DALL-E 2 dan Google's MusicLM kecerdasan buatan berbagi banyak kesamaan struktural. Namun kali ini, tulisan Anda disampaikan secara musikal daripada secara visual. Pada titik ini, Anda dapat membuat keseluruhan bagian sepenuhnya. Selain itu, Anda dapat menghasilkan ritme hanya dengan menggunakan satu instrumen.
Anda dapat melihat beberapa studi sampel yang dibuat oleh tim Google AI di halaman Github MusicLM. Meski AI masih dalam tahap penelitian dan pengembangan, suara yang dihasilkannya beresolusi tinggi. Juga, ada saran, seperti mengintegrasikan AI ini dengan ChatGPT. Integrasi ini dapat menghasilkan musik yang lebih rumit dan kreatif.
Dari Bersenandung hingga Memukul Melodi
MusicLM menggabungkan empat model AI yang berbeda: MuLan, AudioLM, w2v-BERT, dan Soundstream. Meskipun masing-masing model ini memiliki kemampuan yang berbeda. Namun, ketika terintegrasi, mereka menghasilkan MusicLM!
Musisi dan profesional industri telah memperhatikan kemampuan MusicLM untuk mengubah bahkan dengungan dan gumaman paling dasar menjadi nada utuh. Dengan menggabungkan dengan ChatGPT, dapat menghasilkan musik yang unik.
Anda dapat mendengarkan dan menjelajahi musik dan suara yang dibuat oleh MusicLM di dalamnya situs web. Tapi, perlu diingat bahwa saat ini sedang dalam tahap pengujian. Jelas bahwa MusicLM memiliki kemampuan untuk sepenuhnya mengubah bisnis musik seiring dengan perkembangan teknologi.
Musik yang Dihasilkan AI dengan Nuansa Seperti Manusia
Untuk menghasilkan lagu yang masuk akal berdasarkan deskripsi menyeluruh, MusicLM dilatih dengan kumpulan data besar berisi 280,000 jam musik. Misalnya, Anda dapat membuat "nada dubstep melodi dengan bas yang dalam dan ritme drum yang canggih". Atau, Anda dapat memintanya untuk membuat "lagu pop yang memikat dengan riff gitar yang menawan dan vokalis yang bertenaga". Imajinasi Anda adalah batasnya dalam hal ini.
Lagu-lagu yang dihasilkan mirip dengan yang dibuat oleh musisi manusia. Sampel MusicLM sangat mencengangkan. Memang benar terutama mengingat tidak ada manusia yang terlibat dalam proses komposisi. MusicLM dapat mengulang aspek bernuansa seperti riff musik, melodi, dan emosi. Selain itu, ini berfungsi bahkan ketika diberikan spesifikasi yang rumit dan eksplisit.
Fitur Penting
Lukisan Caption Conditioning
Painting Caption Conditioning adalah fungsi MusicLM. Anda dapat menghasilkan musik berdasarkan deskripsi tekstual atau "caption" dari sebuah lukisan. Ini menyiratkan bahwa MusicLM mampu menciptakan musik yang menangkap emosi, suasana hati, dan ide yang diekspresikan dalam sebuah gambar. Kemampuan ini sangat membantu untuk membuat musik untuk film, Video game, dan semua jenis media visual.
Story Mode
Fitur Story Mode mengambil teks cerita sebagai masukan. Oleh karena itu, ia menciptakan musik latar yang mengiringi. Pengguna dapat memanfaatkan fungsi ini untuk membuat soundtrack untuk dongeng, video game, atau film dengan menggambarkan skenario atau nada emosional.
Story Mode adalah alat praktis untuk seniman media. Dengan demikian, dapat menghasilkan berbagai gaya musik dan instrumen. Mode Kisah MusicLM dapat meningkatkan dampak emosional dari sebuah adegan. Jadi, pemirsa dapat memiliki tingkat pencelupan tambahan dalam cerita.
Tingkat Pengalaman Musisi
Anda dapat menyesuaikan tingkat kesulitan musik yang dibuat. Pengguna dapat memilih antara tiga level berdasarkan level keahlian mereka. Juga, mereka dapat menentukan tingkat kerumitan yang disukai: pemula, menengah, atau lanjutan.
Fitur ini membantu Anda jika Anda memiliki sedikit keahlian musik dan ingin bereksperimen dengan komposisi baru. Namun, jika Anda seorang musisi berpengalaman, Anda dapat menciptakan musik yang canggih dan halus. Tujuan MusicLM dengan fitur ini adalah untuk memberikan pengalaman yang dapat diakses oleh semua pengguna.
Keanekaragaman Generasi
Dengan fungsi Generation Diversity, Anda dapat membuat banyak versi lagu dari input yang sama. Dan, Anda dapat memiliki rentang keluaran yang bervariasi. Ini menyiratkan bahwa AI dapat menghasilkan banyak versi dari sebuah lagu.
Selain itu, ada melodi alternatif atau progresi akor, dengan tetap mempertahankan gaya dan struktur dasar lagu. Fitur ini membantu kreasi musik AI menjadi lebih kreatif. Oleh karena itu, membuat kreasi musik lebih dianalogikan dengan penulisan lagu manusia.
Kemungkinan Keterbatasan MusicLM
Google belum membuat MusicLM tersedia untuk masyarakat umum karena masih dalam pengembangan. Oleh karena itu, Anda belum dapat memberikan contoh khusus dari jenis musik yang dapat diproduksi oleh MusicLM. Selain itu, masih sedikit diketahui batasan apa yang mungkin dimiliki MusicLM.
Karena teknologinya masih dalam tahap awal, mungkin ada batasan tertentu pada kaliber musik yang dihasilkan atau kapasitasnya untuk menangani input tertentu.
Kualitas terdistorsi sampel yang dihasilkan adalah salah satu kelemahan utama. Ini adalah produk sampingan yang diperlukan dari prosedur pelatihan yang digunakan untuk mengembangkan MusicLM.
Kelemahan lainnya adalah, terlepas dari kemampuan teknis MusicLM untuk memproduksi vokal. Ini termasuk lagu paduan suara. “Lirik” yang diproduksi oleh MusicLM terkadang terdengar seperti omong kosong. Selain itu, mereka mungkin sulit untuk dipahami. Namun, MusicLM masih dalam pengembangan dan masalah ini dapat diperbaiki.
Keterangan Akhir
Terakhir, kami percaya bahwa teknologi yang mendasari Google MusicLM menarik dan memukau. Sungguh mengherankan bahwa AI dapat membuat musik dalam berbagai gaya, dengan tingkat realisme yang lebih tinggi. MusicLM berpotensi mengubah bisnis musik. Dan, kami sangat senang melihat bagaimana teknologi ini berkembang.
Tinggalkan Balasan