Google ने MusicLM ची घोषणा केली, कृत्रिम बुद्धिमत्ता जी तुम्ही टाइप करता त्या शब्दांमधून संगीत तयार करते, जसे की DALL-E 2. हे Google संशोधनाद्वारे तयार केलेले एक भाषा मॉडेल आहे. याशिवाय, त्यांनी ते केवळ संगीत निर्मितीसाठी डिझाइन केले आहे.
आणि, त्याला संगीत फाइल्सच्या विशाल डेटासेटवर प्रशिक्षित केले गेले आहे आणि विविध शैली आणि फॉर्ममध्ये संगीत तयार करू शकते. तुम्हाला संगीतात रस असेल तर; मग तुम्ही म्युझिकएलएम काय ऑफर करेल ते तपासावे.
MusicLM सह तुम्ही काही तंत्रे आणि फॉर्ममध्ये संगीत तयार करता. उदाहरणार्थ, तुम्ही पियानोचे तुकडे, ड्रम बीट्स आणि गाण्याचे बोल तयार करू शकता.
तसेच, तुम्ही विशिष्ट शैलींमध्ये छान-ट्यून करू शकता किंवा वापरकर्त्याने प्रदान केलेले इनपुट समाविष्ट करू शकता. हे सुसंवादी आणि तालबद्धपणे एकसंध संगीत तयार करण्यासाठी आहे. चला तर मग, म्युझिकएलएम काय आहे ते पाहू या.
मागील प्रयत्न
MusicLM ही AI-व्युत्पन्न केलेली पहिली संगीत प्रणाली नाही. रिफ्यूजन, डान्स डिफ्यूजन, गुगलचे ऑडिओएमएल आणि ओपनएआय ज्यूकबॉक्स तुलनात्मक दृष्टिकोनांची उदाहरणे आहेत. तथापि, या पूर्वीच्या प्रणाली तांत्रिक निर्बंधांमुळे मर्यादित झाल्या.
तसेच, त्यांच्या प्रशिक्षण डेटाच्या अभावामुळे उच्च-गुणवत्तेचे सूर तयार करणे कठीण झाले. तथापि, म्युझिकएलएममध्ये परिष्कार आणि वास्तववादाच्या मोठ्या पातळीसह संगीत तयार करण्याची क्षमता आहे.
विहंगावलोकन MusicLM
MusicLM संगीताची रचना आणि शैली शिकते. म्हणून, त्याला MIDI आणि प्रतीकात्मक संगीत फाइल्सच्या विशाल डेटासेटवर प्रशिक्षण दिले जाते. त्याच्या तत्सम कार्यक्रमांप्रमाणे, MusicLM ट्रान्सफॉर्मर आर्किटेक्चरवर तयार केले आहे.
विशिष्ट इनपुट घटकांवर लक्ष केंद्रित करण्यासाठी स्वयं-लक्ष तंत्राचा वापर करून, म्युझिकएलएमच्या ट्रान्सफॉर्मर आर्किटेक्चरचा वापर मोठ्या डेटासेटमधून संगीताची रचना आणि शैली काढण्यासाठी केला जातो. परिणामी, तुम्ही सुसंवादी आणि तालबद्ध संगीत तयार करू शकता.
आणि, हे संगीत वापरकर्त्याच्या इनपुटच्या संघटनेची नक्कल करू शकते. म्हणून, आपण कार्यक्रमाचे वर्णन केलेले संगीतमय परिणाम प्राप्त करण्यास सक्षम असाल.
पूर्वीचे यश भाषा मॉडेल, जसे की GPT-2 आणि GPT-3, ज्यांनी सुसंगत आणि अस्खलित लेखन तयार करण्याची त्यांची क्षमता सिद्ध केली आहे, MusicLM ला प्रेरणा दिली. दुसरीकडे, MusicLM हे पहिले भाषेचे मॉडेल आहे जे केवळ संगीत पिढीसाठी तयार केले गेले होते.
आणि, आम्हाला वाटते की हे सर्वात अत्याधुनिक मॉडेलपैकी एक मानले जाईल.
हे कस काम करत?
DALL-E 2 आणि Google चे MusicLM कृत्रिम बुद्धिमत्ता बरीच संरचनात्मक समानता सामायिक करा. यावेळेस तुमचे लिखाण दृश्यानुरूप न सांगता संगीतमय पद्धतीने मांडले आहे. या टप्प्यावर, आपण एकतर संपूर्ण तुकडा पूर्णपणे तयार करू शकता. तसेच, तुम्ही फक्त एक वाद्य वापरून ताल निर्माण करू शकता.
तुम्ही म्युझिकएलएमच्या गिथब पेजवर Google AI टीमने तयार केलेले अनेक नमुना अभ्यास पाहू शकता. जरी AI अद्याप संशोधन आणि विकासाच्या टप्प्यात आहे, तरीही ते काढू शकणारे आवाज उच्च रिझोल्यूशन आहेत. तसेच, या AI ला ChatGPT सह समाकलित करण्यासारख्या सूचना देण्यात आल्या आहेत. या एकत्रीकरणामुळे अधिक क्लिष्ट आणि सर्जनशील संगीत होऊ शकते.
हमिंग पासून हिट मेलोडीज पर्यंत
म्युझिकएलएम चार वेगळ्या AI मॉडेल्सना एकत्र करते: MuLan, AudioLM, w2v-BERT आणि Soundstream. जरी या प्रत्येक मॉडेलमध्ये विशिष्ट क्षमतांचा संच आहे. तथापि, जेव्हा ते एकत्र आले, तेव्हा त्यांचा परिणाम म्युझिकएलएममध्ये झाला!
संगीतकार आणि उद्योग व्यावसायिकांनी अगदी मूलभूत गुंजणे आणि गुणगुणांना संपूर्ण ट्यूनमध्ये रूपांतरित करण्याच्या MusicLM च्या क्षमतेची दखल घेतली आहे. ChatGPT सह एकत्रित करून, ते अद्वितीय संगीत तयार करू शकते.
तुम्ही त्यावर MusicLM द्वारे तयार केलेले संगीत आणि आवाज ऐकू आणि एक्सप्लोर करू शकता वेबसाइट. परंतु, हे लक्षात ठेवा की ते सध्या चाचणी टप्प्यात आहे. हे उघड आहे की तंत्रज्ञान विकसित होत असताना म्युझिक एलएममध्ये संगीत व्यवसाय पूर्णपणे बदलण्याची क्षमता आहे.
मानवासारख्या बारकावे असलेले AI-व्युत्पन्न संगीत
संपूर्ण वर्णनावर आधारित अर्थपूर्ण गाणी तयार करण्यासाठी, MusicLM ला 280,000 तासांच्या संगीताच्या मोठ्या डेटासेटवर प्रशिक्षण देण्यात आले. उदाहरणार्थ, तुम्ही “डीप बेस आणि अत्याधुनिक ड्रम तालांसह एक मधुर डबस्टेप ट्यून” तयार करू शकता. किंवा, तुम्ही "मनमोहक गिटार रिफ आणि जबरदस्त गायक असलेले एक मोहक पॉप गाणे" तयार करण्यास सांगू शकता. या प्रकरणात तुमची कल्पनाशक्ती मर्यादा आहे.
उत्पादित गाणी मानवी संगीतकारांनी रचलेल्या गाण्यांसारखी असतात. MusicLM चे नमुने अत्यंत चकित करणारे आहेत. हे विशेषतः खरे आहे की रचना प्रक्रियेत कोणताही मनुष्य गुंतलेला नाही. म्युझिकएलएम म्युझिकल रिफ, स्वर आणि भावना यासारख्या सूक्ष्म पैलूंची पुनरावृत्ती करू शकते. याशिवाय, क्लिष्ट आणि स्पष्ट वैशिष्ट्ये दिली तरीही ते कार्य करते.
महत्वाची वैशिष्ट्ये
चित्रकला मथळा कंडिशनिंग
पेंटिंग कॅप्शन कंडिशनिंग हे म्युझिकएलएम फंक्शन आहे. तुम्ही मजकूर वर्णनावर किंवा पेंटिंगच्या "मथळा" वर आधारित संगीत तयार करू शकता. याचा अर्थ असा होतो की म्युझिकएलएम चित्रात व्यक्त केलेल्या भावना, मूड आणि कल्पना कॅप्चर करणारे संगीत तयार करण्यास सक्षम आहे. ही क्षमता चित्रपटांसाठी संगीत तयार करण्यासाठी खूप उपयुक्त आहे, व्हिडिओ गेम, आणि सर्व प्रकारचे व्हिज्युअल मीडिया.
कथा मोड
स्टोरी मोड वैशिष्ट्य इनपुट म्हणून कथा मजकूर घेते. त्यामुळे ते पार्श्वसंगीत सोबत तयार करते. वापरकर्ते परिस्थिती किंवा भावनिक टोन चित्रित करून कथा, व्हिडिओ गेम किंवा चित्रपटासाठी साउंडट्रॅक तयार करण्यासाठी या कार्याचा वापर करू शकतात.
स्टोरी मोड मीडिया कलाकारांसाठी एक सुलभ साधन आहे. अशा प्रकारे, ते संगीत शैली आणि यंत्रांची विस्तृत श्रेणी निर्माण करू शकते. MusicLM च्या टेल मोडमुळे एखाद्या दृश्याचा भावनिक प्रभाव वाढतो. त्यामुळे, प्रेक्षकांना कथेमध्ये अतिरिक्त प्रमाणात विसर्जन करता येईल.
संगीतकार अनुभव पातळी
तुम्ही तयार केलेल्या संगीताची अडचण सानुकूलित करू शकता. वापरकर्ते त्यांच्या कौशल्य पातळीवर आधारित तीन स्तरांमधून निवडू शकतात. तसेच, ते जटिलतेची प्राधान्यकृत डिग्री निर्दिष्ट करू शकतात: नवशिक्या, मध्यवर्ती किंवा प्रगत.
जर तुमच्याकडे थोडे संगीत कौशल्य असेल आणि नवीन रचनांचा प्रयोग करायचा असेल तर हे वैशिष्ट्य तुम्हाला मदत करते. तथापि, आपण अनुभवी संगीतकार असल्यास, आपण अत्याधुनिक आणि सूक्ष्म संगीत तयार करू शकता. या वैशिष्ट्यासह MusicLM चे ध्येय सर्व वापरकर्त्यांसाठी प्रवेशयोग्य अनुभव प्रदान करणे आहे.
पिढी विविधता
जनरेशन डायव्हर्सिटी फंक्शनसह, तुम्ही एकाच इनपुटमधून गाण्याच्या अनेक आवृत्त्या तयार करू शकता. आणि, तुमच्याकडे आउटपुटची विविध श्रेणी असू शकते. याचा अर्थ असा होतो की AI गाण्याच्या अनेक आवृत्त्या तयार करू शकते.
याशिवाय, गाण्याची मूळ शैली आणि रचना कायम ठेवताना पर्यायी धुन किंवा स्वरांची प्रगती आहे. हे वैशिष्ट्य AI च्या संगीत निर्मितीला अधिक सर्जनशील होण्यास मदत करते. म्हणूनच, ते संगीत निर्मितीला मानवी गीतलेखनाशी अधिक अनुरूप बनवते.
MusicLM च्या संभाव्य मर्यादा
Google ने अद्याप म्युझिकएलएम सामान्य लोकांसाठी उपलब्ध करून दिलेले नाही कारण ते अद्याप विकसित होत आहे. म्हणूनच, म्युझिकएलएम कोणत्या प्रकारच्या संगीताची निर्मिती करू शकते याचे विशिष्ट नमुने तुम्ही अद्याप देऊ शकत नाही. शिवाय, MusicLM वर कोणते निर्बंध असू शकतात हे अद्याप थोडेसे अज्ञात आहे.
तंत्रज्ञान अद्याप त्याच्या सुरुवातीच्या टप्प्यात असल्याने, तयार केलेल्या संगीताच्या कॅलिबरवर किंवा विशिष्ट इनपुट हाताळण्याची क्षमता यावर काही निर्बंध असू शकतात.
उत्पादित नमुन्यांची विकृत गुणवत्ता ही मुख्य कमतरतांपैकी एक आहे. हे MusicLM विकसित करण्यासाठी वापरल्या जाणार्या प्रशिक्षण प्रक्रियेचे आवश्यक उपउत्पादन आहे.
आणखी एक कमतरता म्हणजे, म्युझिकएलएमची व्होकल्स तयार करण्याची तांत्रिक क्षमता असूनही. यामध्ये गायक-संगीताचा समावेश आहे. म्युझिकएलएम द्वारे निर्मित "गीत" कधीकधी अस्पष्ट वाटतात. याव्यतिरिक्त, ते समजणे कठीण होऊ शकते. तथापि, MusicLM अद्याप विकासात आहे आणि या समस्या सुधारल्या जाऊ शकतात.
अंतिम शेरा
शेवटी, आम्हाला विश्वास आहे की Google MusicLM अंतर्गत तंत्रज्ञान मनोरंजक आणि आकर्षक आहे. हे आश्चर्यकारक आहे की एआय विविध शैलींमध्ये संगीत बनवू शकते, उच्च पातळीच्या वास्तववादासह. MusicLM मध्ये संगीत व्यवसाय बदलण्याची क्षमता आहे. आणि, हे तंत्रज्ञान कसे विकसित होते हे पाहण्यासाठी आम्ही उत्सुक आहोत.
प्रत्युत्तर द्या