گوگل اعلان ڪيو MusicLM، مصنوعي ذهانت جيڪا توهان جي ٽائپ ڪيل لفظن مان موسيقي ٺاهي ٿي، جهڙوڪ DALL-E 2. اهو هڪ ٻولي ماڊل آهي جيڪو گوگل ريسرچ پاران ٺاهيو ويو آهي. ان کان سواء، انهن خاص طور تي ان کي موسيقي جي تخليق لاء ٺهيل آهي.
۽، ان کي موسيقي فائلن جي وسيع ڊيٽا سيٽ تي تربيت ڏني وئي آهي ۽ مختلف اندازن ۽ شڪلن ۾ موسيقي پيدا ڪري سگهي ٿي. جيڪڏھن توھان موسيقي ۾ دلچسپي رکو ٿا؛ پوء توهان کي چيڪ ڪرڻ گهرجي ته ڇا موسيقي ايل ايم پيش ڪندي.
MusicLM سان توهان ڪجهه ٽيڪنالاجي ۽ شڪلن ۾ موسيقي پيدا ڪندا آهيو. مثال طور، توهان پيانو جا ٽڪرا ٺاهي سگهو ٿا، ڊرم بيٽس، ۽ غزلن لاءِ راڳ.
انهي سان گڏ، توهان ڪجهه خاص اندازن کي ٺيڪ ڪري سگهو ٿا يا صارف پاران مهيا ڪيل ان پٽ شامل ڪري سگهو ٿا. اهو موسيقي پيدا ڪرڻ جو مطلب آهي جيڪو همراه ۽ تال سان گڏ آهي. تنهن ڪري، اچو ته اندر وڃو ۽ ڏسو ته موسيقي ايل ايم ڇا آهي.
اڳيون ڪوششون
MusicLM پهريون AI-generated ميوزڪ سسٽم ناهي. Riffusion, Dance Diffusion, Google's AudioML, and OpenAI's جوڪبوڪس تقابلي طريقن جا مثال آهن. بهرحال، اهي اڳوڻو سسٽم ٽيڪنالاجي پابنديون طرفان محدود ٿي ويا.
انهي سان گڏ، انهن جي تربيتي ڊيٽا جي کوٽ کي اعلي معيار جي آوازن کي گڏ ڪرڻ ڏکيو ڪيو. بهرحال، ميوزڪ ايل ايم وٽ موسيقي پيدا ڪرڻ جي صلاحيت آهي نفيس ۽ حقيقت پسندي جي وڏي سطح سان.
MusicLM جو جائزو
موسيقي ايل ايم موسيقي جي ساخت ۽ انداز سکي ٿي. انهيء ڪري، اهو MIDI ۽ علامتي ميوزڪ فائلن جي وسيع ڊيٽا سيٽ تي تربيت حاصل ڪري ٿو. ان جي ساڳي پروگرامن وانگر، ميوزڪ ايل ايم ٽرانسفارمر آرڪيٽيڪچر تي ٺهيل آهي.
خاص ان پٽ اجزاء تي توجه ڏيڻ لاءِ خود ڌيان ڏيڻ واري ٽيڪنالاجي کي استعمال ڪندي، ميوزڪ ايل ايم جي ٽرانسفارمر آرڪيٽيڪچر کي استعمال ڪيو ويندو آهي موسيقي جي ساخت ۽ انداز کي وڏي ڊيٽا سيٽ مان ڪڍڻ لاءِ. نتيجي طور، توهان ٺاهي سگهو ٿا harmonically ۽ rhythmically cohesive موسيقي.
۽، هي ميوزڪ صارف ان پٽ جي تنظيم کي نقل ڪري سگهي ٿو. ان ڪري، توھان حاصل ڪري سگھوٿا موسيقيءَ جو نتيجو جيڪو توھان خاص طور تي پروگرام ۾ بيان ڪيو آھي.
اڳوڻن جي ڪاميابي ٻوليء جا ماڊل، جهڙوڪ GPT-2 ۽ GPT-3، جن ثابت ڪيو آهي ته انهن جي همعصر ۽ رواني لکڻ جي صلاحيت، متاثر ٿيل MusicLM. موسيقي ايل ايم، ٻئي طرف، پهرين ٻولي ماڊل آهي جيڪا خاص طور تي موسيقي جي نسل لاء ٺهيل هئي.
۽، اسان سوچيو ٿا ته اهو سڀ کان وڌيڪ نفيس ماڊل مان هڪ سمجهيو ويندو.
اهو ڪيئن ڪم آهي؟
DALL-E 2 ۽ گوگل جو ميوزڪ ايل ايم مصنوعي انٽيلي جنس ڪيتريون ئي ساخت جي هڪجهڙائي حصيداري ڪريو. هن ڀيري، جيتوڻيڪ، توهان جي لکڻين کي بصري جي بدران موسيقي سان پهچايو ويو آهي. هن نقطي تي، توهان يا ته مڪمل طور تي هڪ مڪمل ٽڪرو ٺاهي سگهو ٿا. انهي سان گڏ، توهان صرف هڪ اوزار استعمال ڪندي تال پيدا ڪري سگهو ٿا.
توھان ڏسي سگھوٿا ڪيترائي نمونا مطالعو جيڪي گوگل AI ٽيم پاران ٺاھيل آھن MusicLM جي Github صفحي تي. جيتوڻيڪ AI اڃا تائين تحقيق ۽ ترقي واري مرحلي ۾ آهي، آواز اهو ڪري سگهي ٿو اعلي ريزوليوشن. انهي سان گڏ، تجويزون ڏنيون ويون آهن، جهڙوڪ هي AI کي ChatGPT سان ضم ڪرڻ. هي انضمام وڌيڪ پيچيده ۽ تخليقي ميوزڪ جي اڳواڻي ڪري سگهي ٿو.
هومنگ کان هٽ ميلوڊيز تائين
MusicLM چار مختلف AI ماڊلز کي گڏ ڪري ٿو: MuLan، AudioLM، w2v-BERT، ۽ Soundstream. جيتوڻيڪ انهن ماڊلز مان هر هڪ مخصوص صلاحيتن جو هڪ سيٽ آهي. بهرحال، جڏهن اهي ضم ٿي ويا، انهن جي نتيجي ۾ موسيقي ايل ايم!
موسيقارن ۽ صنعت جي ماهرن MusicLM جي صلاحيت جو نوٽيس ورتو آهي ته جيئن سڀ کان وڌيڪ بنيادي آواز ۽ گوڙ کي مڪمل آوازن ۾ تبديل ڪري. ChatGPT سان گڏ گڏ ڪندي، اهو منفرد ميوزڪ پيدا ڪري سگهي ٿو.
توھان ٻڌي سگھوٿا ۽ ڳولي سگھوٿا موسيقي ۽ آوازن کي موسيقي ايل ايم پاران ٺاھيل ان تي ويب سائيٽ. پر، ذهن ۾ رکو ته اهو في الحال جاچ واري مرحلي ۾ آهي. اهو ظاهر آهي ته ميوزڪ ايل ايم کي مڪمل طور تي موسيقي جي ڪاروبار کي تبديل ڪرڻ جي صلاحيت آهي جيئن ٽيڪنالاجي ترقي ڪري ٿي.
AI-generated music with human-like Nuances
مڪمل وضاحتن جي بنياد تي احساس پيدا ڪرڻ لاءِ گيت تيار ڪرڻ لاءِ، ميوزڪ ايل ايم کي 280,000 ڪلاڪن جي موسيقي جي وڏي ڊيٽا سيٽ تي تربيت ڏني وئي. مثال طور، توهان ٺاهي سگهو ٿا ”هڪ سريلي ڊب اسٽيپ ٽيون هڪ گہرے باس ۽ نفيس ڊرم تال سان“. يا، توهان ان لاءِ پڇي سگهو ٿا ”هڪ دلڪش پاپ گيت هڪ دلڪش گٽار رف ۽ هڪ زبردست ڳائڻي سان“ ٺاهڻ لاءِ. توهان جي تخيل هن معاملي ۾ حد آهي.
پيدا ٿيل گيت اهڙا آهن جيڪي انساني موسيقارن پاران ترتيب ڏنل آهن. موسيقي ايل ايم جا نمونا انتهائي حيران ڪندڙ آهن. اهو سچ آهي خاص طور تي ڏنو ويو آهي ته ڪو به انسان شامل ناهي تخليق جي عمل ۾. موسيقي ايل ايم ننڍڙن پهلوئن کي ورجائي سگھي ٿو جهڙوڪ ميوزڪ رف، راڳ، ۽ جذبات. ان کان سواء، اهو ڪم ڪري ٿو جيتوڻيڪ جڏهن پيچيده ۽ واضح وضاحتون ڏنيون وڃن.
اهم خاصيتون
پينٽنگ ڪيپشن ڪنڊيشننگ
پينٽنگ ڪيپشن ڪنڊيشننگ هڪ ميوزڪ ايل ايم فنڪشن آهي. توھان موسيقي پيدا ڪري سگھو ٿا ھڪڙي متن جي وضاحت يا ”ڪيپشن“ جي بنياد تي مصوري جي. ان جو مطلب اهو آهي ته موسيقي ايل ايم ميوزڪ ٺاهڻ جي قابل آهي جيڪا تصوير ۾ اظهار ڪيل جذبات، موڊ ۽ خيالن کي پڪڙي ٿي. اها صلاحيت فلمن لاءِ ميوزڪ ٺاهڻ لاءِ تمام مددگار آهي، وڊيو گيمز، ۽ سڀني قسمن جي بصري ميڊيا.
داستان جو طريقو
ڪهاڻي موڊ خصوصيت هڪ ڪهاڻي متن کي ان پٽ طور وٺندو آهي. ان ڪري، اهو پس منظر جي موسيقي سان گڏ ٺاهي ٿو. صارف هن فنڪشن کي استعمال ڪري سگھن ٿا هڪ سائونڊ ٽريڪ ٺاهڻ لاءِ ڪهاڻي، وڊيو گيم، يا فلم جي منظرنامي يا جذباتي ڍنگ کي ظاهر ڪندي.
ڪهاڻي موڊ ميڊيا فنڪارن لاء هڪ آسان اوزار آهي. اهڙيء طرح، اهو موسيقي انداز ۽ آلات جي هڪ وسيع رينج پيدا ڪري سگهي ٿو. موسيقي ايل ايم جي ٽيل موڊ هڪ منظر جي جذباتي اثر کي وڌائڻ لاء حاصل ڪري ٿي. تنهن ڪري، ناظرین کي ڪهاڻي ۾ وسعت جو اضافي درجو حاصل ڪري سگهي ٿو.
موسيقي جي تجربي جي سطح
توهان ٺاهيل ميوزڪ جي مشڪل کي ترتيب ڏئي سگهو ٿا. صارف انهن جي مهارت جي سطح جي بنياد تي ٽن سطحن جي وچ ۾ چونڊ ڪري سگهن ٿا. انهي سان گڏ، اهي پيچيدگي جي ترجيحي درجي جي وضاحت ڪري سگھن ٿا: شروعاتي، وچولي، يا ترقي يافته.
هي خصوصيت توهان جي مدد ڪري ٿي جيڪڏهن توهان وٽ ٿورڙي موسيقي جي ماهر آهي ۽ توهان نئين ڪمپوزيشن سان تجربو ڪرڻ چاهيو ٿا. بهرحال، جيڪڏهن توهان هڪ تجربيڪار موسيقار آهيو، ته توهان نفيس ۽ ذهين ميوزڪ ٺاهي سگهو ٿا. هن خصوصيت سان موسيقي ايل ايم جو مقصد سڀني استعمال ڪندڙن لاءِ هڪ قابل رسائي تجربو پهچائڻ آهي.
نسل جي تنوع
Generation Diversity فنڪشن سان، توهان هڪ ئي ان پٽ مان هڪ گيت جا ڪيترائي ورجن ٺاهي سگهو ٿا. ۽، توهان حاصل ڪري سگهو ٿا مختلف قسم جي پيداوار. انهي جو مطلب اهو آهي ته AI هڪ گيت جا ڪيترائي نسخو ٺاهي سگھي ٿي.
ان کان سواء، اتي متبادل راڳ يا chord ترقي آهن، جڏهن ته اڃا تائين گيت جي بنيادي انداز ۽ ساخت کي برقرار رکندي آهي. هي خصوصيت AI جي موسيقي جي تخليق کي وڌيڪ تخليقي ٿيڻ ۾ مدد ڪري ٿي. انهيءَ ڪري، اهو موسيقيءَ جي تخليق کي انساني گيتن جي لکڻين سان وڌيڪ مشابهت رکي ٿو.
MusicLM جي ممڪن حدون
گوگل اڃا تائين موسيقي ايل ايم کي عام عوام لاءِ دستياب نه ڪيو آهي ڇاڪاڻ ته اهو اڃا ترقي ۾ آهي. تنهن ڪري، توهان اڃا تائين خاص نموني نه ڏئي سگهو ٿا موسيقي جي قسمن جا جيڪي MusicLM پيدا ڪري سگھن ٿا. ان کان علاوه، اهو اڃا تائين اڻڄاتل آهي ته ڇا پابنديون MusicLM ٿي سگهي ٿي.
جيئن ته ٽيڪنالاجي اڃا تائين پنهنجي شروعاتي مرحلن ۾ آهي، اهو ٿي سگهي ٿو ته موسيقي جي معيار تي ڪجهه پابنديون آهن جيڪي پيدا ڪيا ويا آهن يا خاص ان پٽ کي سنڀالڻ جي صلاحيت آهي.
پيدا ٿيل نمونن جي خراب ٿيل معيار هڪ اهم خرابين مان هڪ آهي. هي موسيقي ايل ايم کي ترقي ڪرڻ لاءِ استعمال ٿيندڙ تربيتي طريقيڪار جو هڪ لازمي جز آهي.
هڪ ٻي خرابي اها آهي ته، موسيقي ايل ايم جي ٽيڪنيڪل صلاحيت جي باوجود آواز ٺاهڻ جي. هن ۾ ڪوئر گيت شامل آهن. MusicLM پاران تيار ڪيل ”لغت“ ڪڏهن ڪڏهن عجيب لڳندا آهن. ان کان سواء، انهن کي سمجهڻ ڏکيو ٿي سگهي ٿو. بهرحال، MusicLM اڃا ترقي ۾ آهي ۽ اهي مسئلا بهتر ٿي سگهن ٿا.
حتمي تبصرا
آخرڪار، اسان يقين رکون ٿا ته ٽيڪنالاجي گوگل ميوزڪ ايل ايم جي تحت دلچسپ ۽ دلچسپ آهي. اها حيرت انگيز آهي ته هڪ AI مختلف اندازن ۾ ميوزڪ ٺاهي سگهي ٿو، حقيقيت جي اعلي سطح سان. موسيقي ايل ايم کي موسيقي جي ڪاروبار کي تبديل ڪرڻ جي صلاحيت آهي. ۽، اسان کي ڏسڻ لاء پرجوش آهيون ته هي ٽيڪنالاجي ڪيئن ترقي ڪري ٿي.
جواب ڇڏي وڃو