Google-მა გამოაცხადა MusicLM, ხელოვნური ინტელექტი, რომელიც ქმნის მუსიკას თქვენ მიერ აკრეფილი სიტყვებიდან, როგორიცაა DALL-E 2. ეს არის Google Research-ის მიერ შექმნილი ენის მოდელი. გარდა ამისა, მათ შექმნეს ის ექსკლუზიურად მუსიკის შესაქმნელად.
და ის გაწვრთნილი იყო მუსიკალური ფაილების უზარმაზარ ნაკრებზე და შეუძლია შექმნას მუსიკა სხვადასხვა სტილში და ფორმაში. თუ გაინტერესებთ მუსიკა; შემდეგ თქვენ უნდა შეამოწმოთ რას გთავაზობთ MusicLM.
MusicLM-ით თქვენ აწარმოებთ მუსიკას გარკვეული ტექნიკითა და ფორმით. მაგალითად, შეგიძლიათ შექმნათ ფორტეპიანოს ნაწარმოებები, დასარტყამების ბიტები და მელოდიები ლექსებისთვის.
ასევე, შეგიძლიათ დაარეგულიროთ გარკვეული სტილი ან შეიტანოთ მომხმარებლის მიერ მოწოდებული შეყვანა. ის მიზნად ისახავს მუსიკის შექმნას, რომელიც ჰარმონიულად და რიტმულად შეკრულია. ასე რომ, მოდით ჩავუღრმავდეთ და ვნახოთ, რას წარმოადგენს MusicLM.
წინა მცდელობები
MusicLM არ არის პირველი ხელოვნური ინტელექტის გენერირებული მუსიკალური სისტემა. Riffusion, Dance Diffusion, Google-ის AudioML და OpenAI's ჯუკბოქსი არის შედარებითი მიდგომების მაგალითები. თუმცა, ეს წინა სისტემები შეზღუდული იყო ტექნოლოგიური შეზღუდვებით.
ასევე, მათი ტრენინგის მონაცემების ნაკლებობამ გაართულა მაღალი ხარისხის ჰანგების შედგენა. თუმცა, MusicLM-ს აქვს შესაძლებლობა შექმნას მუსიკა უფრო მაღალი დონის დახვეწილობითა და რეალიზმით.
მიმოხილვა MusicLM
MusicLM სწავლობს მუსიკის სტრუქტურას და სტილს. აქედან გამომდინარე, ის სწავლობს MIDI-ს და სიმბოლური მუსიკალური ფაილების უზარმაზარ მონაცემთა ბაზას. მისი მსგავსი პროგრამების მსგავსად, MusicLM აგებულია ტრანსფორმერის არქიტექტურაზე.
მუსიკის სატრანსფორმატორო არქიტექტურა გამოიყენება მუსიკის სტრუქტურისა და სტილის ამოსაღებად დიდი მონაცემთა ნაკრებიდან. შედეგად, თქვენ შეგიძლიათ შექმნათ ჰარმონიულად და რიტმულად შეკრული მუსიკა.
და, ამ მუსიკას შეუძლია მიბაძოს მომხმარებლის შეყვანის ორგანიზებას. ამრიგად, თქვენ შეძლებთ მიიღოთ მუსიკალური შედეგი, რომელიც კონკრეტულად აღწერთ პროგრამას.
წარსულის წარმატება ენის მოდელები, როგორიცაა GPT-2 და GPT-3, რომლებმაც დაამტკიცეს თავიანთი უნარი შექმნან თანმიმდევრული და გამართული წერა, შთააგონეს MusicLM. MusicLM, მეორე მხრივ, არის პირველი ენობრივი მოდელი, რომელიც შეიქმნა ექსკლუზიურად მუსიკალური თაობისთვის.
და, ვფიქრობთ, ის ერთ-ერთ ყველაზე დახვეწილ მოდელად ჩაითვლება.
როგორ მუშაობს?
DALL-E 2 და Google-ის MusicLM ხელოვნური ინტელექტი იზიარებს უამრავ სტრუქტურულ მსგავსებას. თუმცა ამჯერად შენი ნაწერი მუსიკალურად არის გადმოცემული და არა ვიზუალურად. ამ ეტაპზე, თქვენ შეგიძლიათ მთლიანად ააწყოთ მთლიანი ნაწილი. ასევე, თქვენ შეგიძლიათ შექმნათ რიტმი მხოლოდ ერთი ინსტრუმენტის გამოყენებით.
თქვენ შეგიძლიათ ნახოთ Google AI გუნდის მიერ შექმნილი კვლევების რამდენიმე ნიმუში MusicLM-ის Github გვერდზე. მიუხედავად იმისა, რომ ხელოვნური ინტელექტი ჯერ კიდევ კვლევისა და განვითარების სტადიაშია, ხმები მას შეუძლია გამოიტანოს მაღალი გარჩევადობით. ასევე, იყო წინადადებები, როგორიცაა ამ AI-ს ინტეგრირება ChatGPT-თან. ამ ინტეგრაციამ შეიძლება გამოიწვიოს უფრო რთული და კრეატიული მუსიკა.
ჰუმინგიდან ჰიტ მელოდიებამდე
MusicLM აერთიანებს ოთხ განსხვავებულ AI მოდელს: MuLan, AudioLM, w2v-BERT და Soundstream. მიუხედავად იმისა, რომ თითოეულ ამ მოდელს აქვს გამორჩეული შესაძლებლობების ნაკრები. თუმცა, როდესაც ისინი გაერთიანდნენ, მათ მიიღეს MusicLM!
მუსიკოსებმა და ინდუსტრიის პროფესიონალებმა შეამჩნიეს MusicLM-ის შესაძლებლობა, გარდაქმნას თუნდაც ყველაზე ელემენტარული გუგუნი და დრტვინვა მთელ მელოდიებად. ChatGPT-თან კომბინაციით, მას შეუძლია შექმნას უნიკალური მუსიკა.
თქვენ შეგიძლიათ მოუსმინოთ და დაათვალიეროთ MusicLM-ის მიერ შექმნილი მუსიკა და ხმები მასზე ნახვა. მაგრამ, გახსოვდეთ, რომ ის ამჟამად ტესტირების ფაზაშია. აშკარაა, რომ MusicLM-ს აქვს უნარი მთლიანად გარდაქმნას მუსიკალური ბიზნესი ტექნოლოგიების განვითარებასთან ერთად.
ხელოვნური ინტელექტის მიერ გენერირებული მუსიკა ადამიანის მსგავსი ნიუანსებით
საფუძვლიან აღწერილობებზე დაფუძნებული სიმღერების შესაქმნელად, MusicLM ტრენინგს ჩაუტარდა 280,000 საათის მუსიკის დიდ მონაცემთა ბაზაზე. მაგალითად, შეგიძლიათ შექმნათ "მელოდიური დუბსტეპ მელოდია ღრმა ბასით და დახვეწილი დრამის რითმებით". ან, შეგიძლიათ სთხოვოთ, რომ შექმნათ „მიმზიდველი პოპ-სიმღერა მომხიბლავი გიტარის რიფით და ძლიერი ვოკალისტით“. თქვენი ფანტაზია ამ შემთხვევაში ზღვარია.
წარმოებული სიმღერები ადამიანის მუსიკოსების მიერ შექმნილ სიმღერებს წააგავს. MusicLM-ის ნიმუშები ძალიან გასაოცარია. მართალია, განსაკუთრებით იმის გათვალისწინებით, რომ კომპოზიციის პროცესში ადამიანი არ არის ჩართული. MusicLM-ს შეუძლია გაიმეოროს ისეთი ნიუანსური ასპექტები, როგორიცაა მუსიკალური რიფები, მელოდიები და ემოციები. გარდა ამისა, ის მუშაობს მაშინაც კი, როდესაც მოცემულია რთული და აშკარა სპეციფიკაციები.
მნიშვნელოვანი თვისებები
ფერწერა წარწერა კონდიცირება
Painting Caption Conditioning არის MusicLM ფუნქცია. თქვენ შეგიძლიათ შექმნათ მუსიკა ნახატის ტექსტური აღწერილობის ან „წარწერის“ საფუძველზე. ეს გულისხმობს, რომ MusicLM-ს შეუძლია შექმნას მუსიკა, რომელიც აღწერს სურათში გამოხატულ ემოციებს, განწყობებსა და იდეებს. ეს შესაძლებლობა ძალიან სასარგებლოა ფილმებისთვის მუსიკის შესაქმნელად, ვიდეო თამაშები, და ყველა სახის ვიზუალური მედია.
Story Mode
Story Mode ფუნქცია შესაყვანად იღებს სიუჟეტის ტექსტს. აქედან გამომდინარე, ის ქმნის თანმხლებ ფონურ მუსიკას. მომხმარებლებს შეუძლიათ გამოიყენონ ეს ფუნქცია ზღაპრის, ვიდეო თამაშის ან ფილმის საუნდტრეკის შესაქმნელად სცენარის ან ემოციური ტონის გამოსახვით.
Story Mode არის მოსახერხებელი ინსტრუმენტი მედია მხატვრებისთვის. ამრიგად, მას შეუძლია შექმნას მუსიკალური სტილისა და ინსტრუმენტების ფართო სპექტრი. MusicLM-ის ზღაპრის რეჟიმი გაზრდის სცენის ემოციურ გავლენას. ასე რომ, მაყურებელს შეუძლია სიუჟეტში ჩაძირვის დამატებითი ხარისხი.
მუსიკოსის გამოცდილების დონე
თქვენ შეგიძლიათ შეცვალოთ შექმნილი მუსიკის სირთულე. მომხმარებლებს შეუძლიათ აირჩიონ სამ დონეს შორის მათი ცოდნის დონის მიხედვით. ასევე, მათ შეუძლიათ მიუთითონ სირთულის სასურველი ხარისხი: დამწყები, შუალედური ან მოწინავე.
ეს ფუნქცია დაგეხმარებათ, თუ გაქვთ მცირე მუსიკალური გამოცდილება და გსურთ ახალი კომპოზიციების ექსპერიმენტები. თუმცა, თუ გამოცდილი მუსიკოსი ხართ, შეგიძლიათ შექმნათ დახვეწილი და დახვეწილი მუსიკა. MusicLM-ის მიზანი ამ ფუნქციით არის ყველა მომხმარებლისთვის ხელმისაწვდომი გამოცდილების მიწოდება.
თაობის მრავალფეროვნება
Generation Diversity ფუნქციით, თქვენ შეგიძლიათ შექმნათ სიმღერის მრავალი ვერსია ერთი და იგივე შეყვანიდან. და, თქვენ შეგიძლიათ გქონდეთ გამოსავლების მრავალფეროვანი დიაპაზონი. ეს გულისხმობს, რომ AI-მ შეიძლება შექმნას სიმღერის მრავალი ვერსია.
გარდა ამისა, არსებობს ალტერნატიული მელოდიები ან აკორდების პროგრესიები, მაგრამ მაინც ინარჩუნებს სიმღერის ძირითად სტილს და სტრუქტურას. ეს ფუნქცია ეხმარება ხელოვნური ინტელექტის მუსიკის შექმნას იყოს უფრო კრეატიული. მაშასადამე, ის მუსიკის შექმნას ადამიანის სიმღერების ანალოგს ხდის.
MusicLM-ის შესაძლო შეზღუდვები
Google-ს ჯერ არ გაუკეთებია MusicLM ფართო საზოგადოებისთვის ხელმისაწვდომი, რადგან ის ჯერ კიდევ დამუშავების პროცესშია. მაშასადამე, თქვენ ჯერ ვერ მოგცემთ მუსიკის სპეციფიკურ ნიმუშებს, რომელთა წარმოებაც MusicLM-ს შეუძლია. გარდა ამისა, ჯერ კიდევ ცოტა უცნობია, რა შეზღუდვები შეიძლება ჰქონდეს MusicLM-ს.
იმის გამო, რომ ტექნოლოგია ჯერ კიდევ ადრეულ სტადიაზეა, მას შეიძლება ჰქონდეს გარკვეული შეზღუდვები წარმოებული მუსიკის კალიბრზე ან მის უნარზე, გაუმკლავდეს კონკრეტულ შეყვანას.
წარმოებული ნიმუშების დამახინჯებული ხარისხი ერთ-ერთი მთავარი ნაკლია. ეს არის ტრენინგის პროცედურის აუცილებელი გვერდითი პროდუქტი, რომელიც გამოიყენება MusicLM-ის შესაქმნელად.
კიდევ ერთი ნაკლი არის ის, რომ მიუხედავად MusicLM-ის ტექნიკური შესაძლებლობისა ვოკალის წარმოების. ეს მოიცავს საგუნდო სიმღერებს. MusicLM-ის მიერ წარმოებული „სიმღერები“ ზოგჯერ სისულელედ გამოიყურება. გარდა ამისა, მათი გაგება რთულია. თუმცა, MusicLM ჯერ კიდევ განვითარების პროცესშია და ეს საკითხები შეიძლება გაუმჯობესდეს.
დასკვნითი შენიშვნა
და ბოლოს, ჩვენ გვჯერა, რომ Google MusicLM-ის საფუძველში არსებული ტექნოლოგია საინტერესო და მომხიბვლელია. გასაოცარია, რომ AI-ს შეუძლია მუსიკის შექმნა სხვადასხვა სტილში, რეალიზმის უფრო მაღალი დონით. MusicLM-ს აქვს პოტენციალი შეცვალოს მუსიკალური ბიზნესი. და ჩვენ აღფრთოვანებული ვართ იმის ყურებით, თუ როგორ ვითარდება ეს ტექნოლოგია.
დატოვე პასუხი