Google, DALL-E 2 gibi yazdığınız sözcüklerden müzik oluşturan yapay zeka MusicLM'yi duyurdu. Bu, Google Research tarafından oluşturulan bir dil modelidir. Ayrıca, onu müzik üretimi için özel olarak tasarladılar.
Ayrıca, geniş bir müzik dosyası veri kümesi üzerinde eğitilmiştir ve çeşitli stil ve formlarda müzik üretebilir. Müzikle ilgileniyorsanız; o zaman MusicLM'nin neler sunacağını kontrol etmelisiniz.
MusicLM ile bazı teknik ve formlarda müzik üretirsiniz. Örneğin, şarkı sözleri için piyano parçaları, davul vuruşları ve melodiler oluşturabilirsiniz.
Ayrıca, belirli stillere ince ayar yapabilir veya kullanıcı tarafından sağlanan girişi dahil edebilirsiniz. Harmonik ve ritmik olarak uyumlu bir müzik üretmek içindir. Öyleyse, konuya dalalım ve MusicLM'nin neyle ilgili olduğunu görelim.
Önceki Denemeler
MusicLM, AI tarafından üretilen ilk müzik sistemi değildir. Riffusion, Dance Difusion, Google AudioML ve OpenAI'ler müzik kutusu karşılaştırılabilir yaklaşımların örnekleridir. Ancak, bu önceki sistemler teknolojik kısıtlamalarla kısıtlandı.
Ayrıca, eğitim verilerinin olmaması, yüksek kaliteli melodiler bestelemeyi zorlaştırıyordu. Bununla birlikte, MusicLM, daha yüksek düzeyde karmaşıklık ve gerçekçilik ile müzik yaratma kapasitesine sahiptir.
MusicLM'ye Genel Bakış
MusicLM, müziğin yapısını ve tarzını öğrenir. Bu nedenle, geniş bir MIDI veri kümesi ve sembolik müzik dosyaları üzerinde eğitilir. MusicLM, benzer programları gibi Transformer mimarisi üzerine kuruludur.
Belirli girdi bileşenlerine konsantre olmak için kişisel dikkat tekniklerini kullanan MusicLM'nin dönüştürücü mimarisi, büyük bir veri kümesinden müziğin yapısını ve stilini çıkarmak için kullanılır. Sonuç olarak, armonik ve ritmik olarak uyumlu bir müzik yaratabilirsiniz.
Ve bu müzik, kullanıcı girişinin organizasyonunu taklit edebilir. Böylece, programa özel olarak tanımladığınız müzikal sonucu elde edebileceksiniz.
Bir önceki başarı dil modelleriTutarlı ve akıcı yazı yazma kapasitelerini kanıtlamış GPT-2 ve GPT-3 gibi, MusicLM'e ilham verdi. Öte yandan MusicLM, müzik kuşağı için özel olarak oluşturulmuş ilk dil modelidir.
Ve en sofistike modellerden biri olarak kabul edileceğini düşünüyoruz.
O nasıl çalışır?
DALL-E 2 ve Google'ın MusicLM'si yapay zeka birçok yapısal benzerliği paylaşır. Ancak bu kez yazınız görselden çok müzikal olarak aktarılıyor. Bu noktada, bir parçayı tamamen inşa edebilirsiniz. Ayrıca, sadece bir enstrüman kullanarak ritim oluşturabilirsiniz.
Google AI ekibi tarafından oluşturulan birkaç örnek çalışmayı MusicLM'nin Github sayfasında görüntüleyebilirsiniz. Yapay zeka henüz araştırma ve geliştirme aşamasında olmasına rağmen çıkarabileceği sesler yüksek çözünürlüklü. Ayrıca, bu yapay zekayı ChatGPT ile entegre etmek gibi öneriler de var. Bu entegrasyon daha karmaşık ve yaratıcı müziğe yol açabilir.
Uğultudan Hit Melodilere
MusicLM, dört farklı AI modelini birleştirir: MuLan, AudioLM, w2v-BERT ve Soundstream. Bu modellerin her birinin bir dizi ayırt edici özelliği olmasına rağmen. Ancak entegre olduklarında, MusicLM ile sonuçlandılar!
Müzisyenler ve sektör profesyonelleri, MusicLM'nin en temel uğultuları ve mırıltıları bile tam melodilere dönüştürme kapasitesinin farkına vardılar. ChatGPT ile birleşerek eşsiz müzikler üretebilir.
MusicLM tarafından oluşturulan müzikleri ve sesleri kendi üzerinde dinleyebilir ve keşfedebilirsiniz. Web sitesi. Ancak, şu anda test aşamasında olduğunu unutmayın. MusicLM'nin teknoloji geliştikçe müzik işini tamamen dönüştürme yeteneğine sahip olduğu aşikar.
İnsan Benzeri Nüanslarla Yapay Zeka Tarafından Oluşturulan Müzik
Kapsamlı açıklamalara dayalı anlamlı şarkılar üretmek için MusicLM, 280,000 saatlik müzikten oluşan geniş bir veri kümesi üzerinde eğitildi. Örneğin, “derin bir bas ve sofistike davul ritimleri ile melodik bir dubstep melodisi” oluşturabilirsiniz. Veya "büyüleyici bir gitar riffi ve güçlü bir vokalist ile baştan çıkarıcı bir pop şarkısı" yaratmasını isteyebilirsiniz. Bu durumda hayal gücünüz sınırdır.
Üretilen şarkılar, insan müzisyenlerin bestelediği şarkılara benziyor. MusicLM'nin örnekleri son derece şaşırtıcı. Özellikle kompozisyon sürecine hiç kimsenin dahil olmadığı düşünülürse doğrudur. MusicLM, müzikal riffler, melodiler ve duygular gibi nüanslı yönleri tekrarlayabilir. Ayrıca, karmaşık ve açık özellikler verildiğinde bile çalışır.
Önemli Özellikler
Resim Yazısı Koşullandırma
Resim Yazısı Koşullandırma bir MusicLM işlevidir. Bir resmin metinsel açıklamasına veya "başlığına" dayalı olarak müzik üretebilirsiniz. Bu, MusicLM'nin bir resimde ifade edilen duyguları, ruh hallerini ve fikirleri yakalayan müzikler yaratma yeteneğine sahip olduğu anlamına gelir. Bu yetenek, filmler için müzik yapmak için çok yararlıdır, video oyunlarıve her türlü görsel medya.
Story Mode
Öykü Modu özelliği, girdi olarak bir öykü metni alır. Bu nedenle, eşlik eden fon müziği oluşturur. Kullanıcılar, senaryoyu veya duygusal tonu tasvir ederek bir masal, video oyunu veya film için bir film müziği oluşturmak için bu işlevi kullanabilir.
Öykü Modu, medya sanatçıları için kullanışlı bir araçtır. Böylece, çok çeşitli müzik stilleri ve enstrümanlar üretebilir. MusicLM'nin Masal Modu, bir sahnenin duygusal etkisini artırır. Böylece, izleyiciler hikayeye ek bir derecede daldırılabilir.
Müzisyen Deneyim Seviyesi
Oluşturulan müziğin zorluğunu özelleştirebilirsiniz. Kullanıcılar, beceri seviyelerine göre üç seviye arasından seçim yapabilir. Ayrıca, tercih edilen karmaşıklık derecesini belirleyebilirler: başlangıç, orta veya ileri düzey.
Biraz müzik uzmanlığınız varsa ve yeni besteler denemek istiyorsanız bu özellik size yardımcı olur. Ancak deneyimli bir müzisyenseniz, sofistike ve incelikli bir müzik yaratabilirsiniz. MusicLM'nin bu özellikle amacı, tüm kullanıcılar için erişilebilir bir deneyim sunmaktır.
Kuşak Çeşitliliği
Generation Diversity işleviyle, aynı girdiden bir şarkının birçok versiyonunu üretebilirsiniz. Ve çok çeşitli çıktılara sahip olabilirsiniz. Bu, AI'nın bir şarkının birden fazla versiyonunu oluşturabileceği anlamına gelir.
Ayrıca, şarkının temel stilini ve yapısını korurken alternatif melodiler veya akor ilerlemeleri vardır. Bu özellik, yapay zekanın müzik oluşturmasının daha yaratıcı olmasına yardımcı olur. Bu nedenle, müzik yaratmayı insan şarkı yazımına daha benzer hale getirir.
MusicLM'nin Olası Sınırlamaları
Google, henüz geliştirme aşamasında olduğu için MusicLM'yi genel kullanıma sunmadı. Bu nedenle, MusicLM'nin üretebileceği müzik türlerinin belirli örneklerini henüz veremezsiniz. Ayrıca, MusicLM'nin hangi kısıtlamalara sahip olabileceği hala biraz bilinmiyor.
Teknoloji henüz ilk aşamalarında olduğu için, üretilen müziğin kalibresi veya belirli girdileri işleme kapasitesi üzerinde belirli kısıtlamalar olabilir.
Üretilen numunelerin bozuk kalitesi en önemli dezavantajlardan biridir. Bu, MusicLM'yi geliştirmek için kullanılan eğitim prosedürünün gerekli bir yan ürünüdür.
Diğer bir dezavantaj, MusicLM'nin vokal üretme konusundaki teknik yeteneğine rağmen. Buna koro şarkıları da dahildir. MusicLM tarafından üretilen "şarkı sözleri" bazen anlamsız geliyor. Ayrıca, anlaşılması zor olabilir. Ancak MusicLM hala geliştirme aşamasındadır ve bu sorunlar geliştirilebilir.
Son Sözler
Son olarak, Google MusicLM'nin altında yatan teknolojinin hem ilginç hem de büyüleyici olduğuna inanıyoruz. Bir yapay zekanın, daha yüksek bir gerçekçilik düzeyiyle çeşitli tarzlarda müzik yapabilmesi şaşırtıcı. MusicLM, müzik işini değiştirme potansiyeline sahiptir. Ve bu teknolojinin nasıl geliştiğini izlemekten heyecan duyuyoruz.
Yorum bırak