Google ने MusicLM, आर्टिफिशियल इंटेलिजेंस की घोषणा की, जो आपके द्वारा टाइप किए गए शब्दों से संगीत बनाता है, जैसे DALL-E 2। यह Google रिसर्च द्वारा बनाया गया एक भाषा मॉडल है। इसके अलावा, उन्होंने इसे विशेष रूप से संगीत निर्माण के लिए डिज़ाइन किया है।
और, इसे संगीत फ़ाइलों के विशाल डेटासेट पर प्रशिक्षित किया गया है और यह कई प्रकार की शैलियों और रूपों में संगीत का उत्पादन कर सकता है। यदि आप संगीत में रुचि रखते हैं; तो आपको यह जांचना चाहिए कि MusicLM क्या पेश करेगा।
MusicLM के साथ आप कुछ तकनीकों और रूपों में संगीत तैयार करते हैं। उदाहरण के लिए, आप गीतों के लिए पियानो के टुकड़े, ड्रम बीट्स और धुन बना सकते हैं।
साथ ही, आप कुछ शैलियों को फ़ाइन-ट्यून कर सकते हैं या उपयोगकर्ता द्वारा प्रदान किया गया इनपुट शामिल कर सकते हैं। यह संगीत का उत्पादन करने के लिए है जो सामंजस्यपूर्ण और लयबद्ध रूप से एकजुट हो। तो, आइए गोता लगाएँ और देखें कि MusicLM क्या है।
पिछले प्रयास
MusicLM पहला AI-जनित म्यूजिक सिस्टम नहीं है। रिफ्यूजन, डांस डिफ्यूजन, गूगल का ऑडियोएमएल और ओपनएआई ज्यूकबॉक्स तुलनीय दृष्टिकोण के उदाहरण हैं। हालाँकि, ये पूर्व प्रणालियाँ तकनीकी प्रतिबंधों से विवश हो गईं।
साथ ही, उनके प्रशिक्षण डेटा की कमी ने उच्च-गुणवत्ता वाली धुनों की रचना करना कठिन बना दिया। हालाँकि, MusicLM में बड़े स्तर के परिष्कार और यथार्थवाद के साथ संगीत बनाने की क्षमता है।
अवलोकन MusicLM
MusicLM संगीत की संरचना और शैली सीखता है। इसलिए, यह MIDI और प्रतीकात्मक संगीत फ़ाइलों के विशाल डेटासेट पर प्रशिक्षित हो जाता है। इसके समान कार्यक्रमों की तरह, MusicLM को ट्रांसफॉर्मर आर्किटेक्चर पर बनाया गया है।
विशेष इनपुट घटकों पर ध्यान केंद्रित करने के लिए स्व-ध्यान तकनीकों का उपयोग करते हुए, MusicLM के ट्रांसफ़ॉर्मर आर्किटेक्चर का उपयोग बड़े डेटासेट से संगीत की संरचना और शैली को निकालने के लिए किया जाता है। नतीजतन, आप सामंजस्यपूर्ण और लयबद्ध रूप से एकजुट संगीत बना सकते हैं।
और, यह संगीत उपयोगकर्ता इनपुट के संगठन की नकल कर सकता है। इसलिए, आप उस संगीतमय परिणाम को प्राप्त करने में सक्षम होंगे जिसका आप विशेष रूप से कार्यक्रम में वर्णन करते हैं।
पिछले की सफलता भाषा मॉडल, जैसे GPT-2 और GPT-3, जिन्होंने सुसंगत और धाराप्रवाह लेखन बनाने की अपनी क्षमता साबित की है, ने MusicLM को प्रेरित किया। दूसरी ओर, MusicLM पहला भाषाई मॉडल है जो विशेष रूप से संगीत पीढ़ी के लिए बनाया गया था।
और, हमें लगता है कि इसे सबसे परिष्कृत मॉडलों में से एक माना जाएगा।
यह कैसे काम करता है?
DALL-E 2 और Google का MusicLM कृत्रिम बुद्धिमत्ता बहुत सी संरचनात्मक समानताएं साझा करें। हालांकि, इस बार, आपका लेखन दृष्टिगत रूप से नहीं बल्कि संगीतमय रूप से व्यक्त किया गया है। इस बिंदु पर, आप या तो पूरी तरह से एक पूरे टुकड़े का निर्माण कर सकते हैं। साथ ही, आप केवल एक वाद्य का उपयोग करके लय उत्पन्न कर सकते हैं।
आप MusicLM के Github पेज पर Google AI टीम द्वारा बनाए गए कई नमूना अध्ययन देख सकते हैं। भले ही एआई अभी भी अनुसंधान और विकास के चरण में है, यह उच्च रिज़ॉल्यूशन वाली आवाज़ें निकाल सकता है। साथ ही, इस AI को ChatGPT के साथ एकीकृत करने जैसे सुझाव भी दिए गए हैं। यह एकीकरण अधिक जटिल और रचनात्मक संगीत को जन्म दे सकता है।
हमिंग से हिट मेलोडीज़ तक
MusicLM चार अलग-अलग AI मॉडल को जोड़ती है: MuLan, AudioLM, w2v-BERT और साउंडस्ट्रीम। हालांकि इनमें से प्रत्येक मॉडल में विशिष्ट क्षमताओं का एक सेट है। हालाँकि, जब वे एकीकृत हो गए, तो उनका परिणाम MusicLM!
संगीतकारों और उद्योग के पेशेवरों ने MusicLM की सबसे बुनियादी गुंजन और बड़बड़ाहट को भी पूरी धुन में बदलने की क्षमता पर ध्यान दिया है। ChatGPT के साथ संयोजन करके, यह अद्वितीय संगीत उत्पन्न कर सकता है।
आप MusicLM द्वारा बनाए गए संगीत और ध्वनियों को सुन और एक्सप्लोर कर सकते हैं वेबसाइट . लेकिन, ध्यान रहे कि यह अभी टेस्टिंग फेज में है। यह स्पष्ट है कि जैसे-जैसे तकनीक विकसित होती है MusicLM में संगीत व्यवसाय को पूरी तरह से बदलने की क्षमता है।
मानव-जैसी बारीकियों के साथ एआई-जेनरेटेड संगीत
ऐसे गाने बनाने के लिए जो पूरी तरह से वर्णन के आधार पर अर्थपूर्ण हों, MusicLM को 280,000 घंटों के संगीत के एक बड़े डेटासेट पर प्रशिक्षित किया गया था। उदाहरण के लिए, आप "एक गहरी बास और परिष्कृत ड्रम लय के साथ एक मेलोडिक डबस्टेप ट्यून" बना सकते हैं। या, आप इसे "मनमोहक गिटार रिफ़ और एक ज़बरदस्त गायक के साथ एक मोहक पॉप गीत" बनाने के लिए कह सकते हैं। इस मामले में आपकी कल्पना की सीमा है।
निर्मित गीत मानव संगीतकारों द्वारा रचित गीतों से मिलते जुलते हैं। MusicLM के नमूने अत्यंत आश्चर्यजनक हैं। यह विशेष रूप से सच है कि रचना प्रक्रिया में कोई मानव शामिल नहीं है। MusicLM बारीक पहलुओं को दोहरा सकता है जैसे कि संगीत की धुनें, धुनें और भावनाएं। इसके अलावा, यह जटिल और स्पष्ट विनिर्देशों के बावजूद भी काम करता है।
महत्वपूर्ण विशेषताएं
पेंटिंग कैप्शन कंडीशनिंग
पेंटिंग कैप्शन कंडीशनिंग एक MusicLM फ़ंक्शन है। आप किसी पेंटिंग के शाब्दिक विवरण या "कैप्शन" के आधार पर संगीत तैयार कर सकते हैं। इसका तात्पर्य यह है कि MusicLM ऐसा संगीत बनाने में सक्षम है जो किसी चित्र में व्यक्त भावनाओं, मनोदशाओं और विचारों को कैप्चर करता है। फिल्मों के लिए संगीत बनाने के लिए यह क्षमता बहुत मददगार है, वीडियो गेम, और सभी प्रकार के विज़ुअल मीडिया।
स्टोरी मोड
स्टोरी मोड फीचर इनपुट के रूप में स्टोरी टेक्स्ट लेता है। इसलिए, यह पृष्ठभूमि संगीत के साथ बनाता है। उपयोगकर्ता इस फ़ंक्शन का उपयोग किसी कहानी, वीडियो गेम या मूवी के लिए परिदृश्य या भावनात्मक स्वर का चित्रण करके साउंडट्रैक बनाने के लिए कर सकते हैं।
स्टोरी मोड मीडिया कलाकारों के लिए एक उपयोगी टूल है। इस प्रकार, यह संगीत शैलियों और उपकरणों की एक विस्तृत श्रृंखला उत्पन्न कर सकता है। MusicLM का टेल मोड दृश्य के भावनात्मक प्रभाव को बढ़ाता है। इसलिए, दर्शकों को कहानी में अतिरिक्त मात्रा में तल्लीनता मिल सकती है।
संगीतकार अनुभव स्तर
आप निर्मित संगीत की कठिनाई को अनुकूलित कर सकते हैं। उपयोगकर्ता अपने कौशल स्तर के आधार पर तीन स्तरों के बीच चयन कर सकते हैं। इसके अलावा, वे जटिलता की पसंदीदा डिग्री निर्दिष्ट कर सकते हैं: शुरुआती, मध्यवर्ती या उन्नत।
यदि आपके पास थोड़ी संगीत विशेषज्ञता है और नई रचनाओं के साथ प्रयोग करना चाहते हैं तो यह सुविधा आपकी मदद करती है। हालाँकि, यदि आप एक अनुभवी संगीतकार हैं, तो आप परिष्कृत और सूक्ष्म संगीत बना सकते हैं। इस सुविधा के साथ MusicLM का लक्ष्य सभी उपयोगकर्ताओं के लिए सुलभ अनुभव प्रदान करना है।
पीढ़ी विविधता
जनरेशन डायवर्सिटी फ़ंक्शन के साथ, आप एक ही इनपुट से एक गीत के कई संस्करण तैयार कर सकते हैं। और, आपके पास आउटपुट की एक विविध श्रेणी हो सकती है। इसका तात्पर्य है कि एआई एक गीत के कई संस्करण उत्पन्न कर सकता है।
इसके अलावा, गीत की मूल शैली और संरचना को बनाए रखते हुए, वैकल्पिक धुन या तार प्रगति होती है। यह सुविधा एआई के संगीत निर्माण को और अधिक रचनात्मक बनाने में मदद करती है। इसलिए, यह संगीत रचना को मानव गीत लेखन के समान बनाता है।
MusicLM की संभावित सीमाएँ
Google ने अभी तक MusicLM को आम जनता के लिए उपलब्ध नहीं कराया है क्योंकि यह अभी भी विकास में है। इसलिए, आप अभी तक संगीत के उस प्रकार के विशिष्ट नमूने नहीं दे सकते हैं जिसे MusicLM उत्पन्न कर सकता है। इसके अलावा, यह अभी भी थोड़ा अज्ञात है कि MusicLM पर क्या प्रतिबंध हो सकते हैं।
जैसा कि तकनीक अभी भी अपने शुरुआती चरण में है, इसमें उत्पादित संगीत की क्षमता या विशेष इनपुट को संभालने की क्षमता पर कुछ प्रतिबंध हो सकते हैं।
उत्पादित नमूनों की विकृत गुणवत्ता प्रमुख कमियों में से एक है। यह MusicLM को विकसित करने के लिए उपयोग की जाने वाली प्रशिक्षण प्रक्रिया का एक आवश्यक उपोत्पाद है।
एक और कमी यह है कि MusicLM की वोकल्स बनाने की तकनीकी क्षमता के बावजूद। इसमें गाना बजानेवालों के गाने शामिल हैं। MusicLM द्वारा निर्मित "गीत" कभी-कभी अस्पष्ट लगते हैं। इसके अलावा, उन्हें समझना मुश्किल हो सकता है। हालाँकि, MusicLM अभी भी विकास में है और इन मुद्दों में सुधार किया जा सकता है।
अंतिम टिप्पणी
अंत में, हम मानते हैं कि Google MusicLM में अंतर्निहित तकनीक दिलचस्प और आकर्षक दोनों है। यह आश्चर्यजनक है कि एआई उच्च स्तर के यथार्थवाद के साथ विभिन्न शैलियों में संगीत बना सकता है। MusicLM में संगीत व्यवसाय को बदलने की क्षमता है। और, हम यह देखने के लिए उत्साहित हैं कि यह तकनीक कैसे विकसित होती है।
एक जवाब लिखें