ګوګل د میوزیک ایل ایم اعلان وکړ، مصنوعي ذهانت چې د هغه کلمو څخه میوزیک رامینځته کوي چې تاسو یې ټایپ کوئ ، لکه DALL-E 2. دا د ژبې ماډل دی چې د ګوګل څیړنې لخوا رامینځته شوی. سربیره پردې ، دوی دا په ځانګړي ډول د میوزیک رامینځته کولو لپاره ډیزاین کړی.
او، دا د میوزیک فایلونو په پراخه ډیټاسیټ کې روزل شوی او کولی شي په یو لړ سټایلونو او ډولونو کې میوزیک تولید کړي. که تاسو د موسیقۍ سره علاقه لرئ؛ بیا تاسو باید وګورئ چې میوزیک ایل ایم به څه وړاندیز وکړي.
د MusicLM سره تاسو په ځینو تخنیکونو او بڼو کې میوزیک تولید کوئ. د مثال په توګه، تاسو کولی شئ د سندرو لپاره د پیانو ټوټې، د ډرم بیټونه، او خټکي جوړ کړئ.
همچنان ، تاسو کولی شئ ځینې سټایلونو ته ښه ټون وکړئ یا د کارونکي لخوا چمتو شوي ان پټ شامل کړئ. دا د میوزیک تولید لپاره دی چې په همغږي او تال سره همغږي وي. نو، راځئ چې ډوب کړو او وګورو چې MusicLM څه شی دی.
پخوانۍ هڅې
میوزیک ایل ایم لومړی د AI لخوا رامینځته شوی میوزیک سیسټم ندی. Riffusion، Dance Diffusion، د ګوګل آډیو ایم ایل، او OpenAI's جوک بوکس د پرتلې طریقې بیلګې دي. په هرصورت، دا مخکیني سیسټمونه د تخنیکي محدودیتونو له امله محدود شوي.
همدارنګه، د دوی د روزنې ډیټا نشتوالی د لوړ کیفیت غږونو ترتیب کول ستونزمن کړي. په هرصورت، میوزیک ایل ایم د لوړې کچې پیچلتیا او ریالیزم سره د میوزیک رامینځته کولو ظرفیت لري.
عمومي کتنه MusicLM
میوزیک ایل ایم د میوزیک جوړښت او سټایل زده کوي. له همدې امله ، دا د MIDI او سمبولیک میوزیک فایلونو پراخه ډیټاسیټ باندې روزل کیږي. د دې ورته برنامو په څیر ، میوزیک ایل ایم د ټرانسفارمر معمارۍ باندې جوړ شوی.
د ځانګړي ان پټ اجزاو تمرکز کولو لپاره د ځان پاملرنې تخنیکونو کارول ، د میوزیک ایل ایم ټرانسفارمر جوړښت د لوی ډیټاسیټ څخه د میوزیک جوړښت او سټایل ایستلو لپاره کارول کیږي. د پایلې په توګه، تاسو کولی شئ په همغږي او تالیک ډول همغږي میوزیک رامینځته کړئ.
او، دا میوزیک کولی شي د کارونکي ان پټ تنظیم تنظیم کړي. لدې امله ، تاسو به وکولی شئ د میوزیک پایله ترلاسه کړئ چې تاسو په ځانګړي توګه برنامه ته تشریح کوئ.
د تیرو بریاوو د ژبې موډلونه، لکه GPT-2 او GPT-3، کوم چې د همغږي او روان لیکلو رامینځته کولو لپاره د دوی ظرفیت ثابت کړی ، میوزیک ایل ایم هڅولی. له بلې خوا میوزیک ایل ایم د لومړۍ ژبې ماډل دی چې په ځانګړي ډول د میوزیک نسل لپاره جوړ شوی و.
او، موږ فکر کوو چې دا به یو له خورا پیچلي ماډلونو څخه وګڼل شي.
دا څنګه کار کوی؟
DALL-E 2 او د ګوګل د موسیقۍ ایل ایم مصنوعي هوښیارتیا ډیری ساختماني ورته والی شریکوي. دا ځل، که څه هم، ستاسو لیکنه د لید پر ځای په موسیقۍ سره لیږدول کیږي. په دې وخت کې، تاسو کولی شئ په بشپړه توګه ټوله ټوټه جوړه کړئ. همچنان ، تاسو کولی شئ یوازې د یوې وسیلې په کارولو سره تال رامینځته کړئ.
تاسو ممکن د میوزیک ایل ایم ګیتوب پا pageه کې د ګوګل AI ټیم لخوا رامینځته شوي ډیری نمونې مطالعات وګورئ. که څه هم AI لاهم د څیړنې او پراختیا په مرحله کې دی، هغه غږونه چې دا کولی شي لوړ ریزولوشن وي. همچنان ، وړاندیزونه شتون لري ، لکه د ChatGPT سره د دې AI ادغام. دا ادغام کولی شي ډیر پیچلي او تخلیقي میوزیک رامینځته کړي.
له همنګ څخه تر هیټ میلوډیز پورې
میوزیک ایل ایم څلور جلا AI ماډلونه ترکیب کوي: MuLan، AudioLM، w2v-BERT، او Soundstream. که څه هم د دې ماډلونو هر یو ځانګړی وړتیاوې لري. په هرصورت، کله چې دوی مدغم شول، دوی د میوزیک ایل ایم پایله درلوده!
موسیقارانو او د صنعت متخصصینو د میوزیک ایل ایم ظرفیت ته پام کړی چې حتی خورا لومړني غږونه او غږونه په ټول غږونو بدل کړي. د ChatGPT سره یوځای کولو سره، دا کولی شي ځانګړې میوزیک تولید کړي.
تاسو کولی شئ په دې کې د میوزیک ایل ایم لخوا رامینځته شوي میوزیک او غږونه واورئ او وپلټئ ویب پاڼه. مګر، په یاد ولرئ چې دا اوس مهال د ازموینې په مرحله کې دی. دا څرګنده ده چې میوزیک ایل ایم د دې وړتیا لري چې د میوزیک سوداګرۍ په بشپړ ډول بدل کړي لکه څنګه چې ټیکنالوژي وده کوي.
د انسان په څیر نزاکتونو سره د AI لخوا رامینځته شوی میوزیک
د سندرو تولید لپاره چې د بشپړ توضیحاتو پراساس معنی لري ، میوزیک ایل ایم د 280,000 ساعتونو میوزیک لوی ډیټاسیټ کې روزل شوی و. د مثال په توګه، تاسو کولی شئ "د ژور باس او پیچلي ډرم تالونو سره یو خوندور ډبسټپ ټون" جوړ کړئ. یا، تاسو کولی شئ د دې لپاره وغواړئ چې "د زړه راښکونکي ګیتار رف او ځواکمن غږ سره یو زړه راښکونکي پاپ سندره جوړه کړئ." ستاسو تصور په دې قضیه کې حد دی.
تولید شوي سندرې د انساني موسیقارانو لخوا ترتیب شوي سندرې سره ورته دي. د میوزیک ایل ایم نمونې خورا حیرانونکې دي. دا ریښتیا ده په ځانګړې توګه د دې لپاره چې د جوړښت په پروسه کې هیڅ انسان دخیل نه وي. میوزیک ایل ایم کولی شي خورا مهم اړخونه تکرار کړي لکه د میوزیک ریفونه ، غږونه او احساسات. سربیره پردې ، دا حتی کار کوي کله چې پیچلي او څرګند مشخصات ورکړل شي.
مهم خصوصیات
د انځورګرۍ کیپشن کنډیشن
د انځور کولو کیپشن کنډیشن کول د میوزیک ایل ایم فعالیت دی. تاسو کولی شئ د متني توضیحاتو یا د نقاشۍ "سرلیک" پراساس میوزیک تولید کړئ. دا پدې معنی ده چې میوزیک ایل ایم د دې وړتیا لري چې میوزیک رامینځته کړي چې احساسات ، مزاج او نظرونه په عکس کې څرګند کړي. دا وړتیا د فلمونو لپاره د موسیقۍ جوړولو لپاره خورا ګټوره ده، ويډيو ګېم، او هر ډول بصری رسنۍ.
کیسه اکر
د کیسې حالت فیچر د کیسې متن د ان پټ په توګه اخلي. له همدې امله ، دا د شالید میوزیک سره رامینځته کوي. کاروونکي کولی شي دا فنکشن د سناریو یا احساساتي ټون په ښودلو سره د کیسې ، ویډیو لوبې یا فلم لپاره د غږ ټریک جوړولو لپاره وکاروي.
د کیسې حالت د میډیا هنرمندانو لپاره یوه اسانه وسیله ده. پدې توګه ، دا کولی شي د میوزیک سټایلونو او وسیلو پراخه لړۍ رامینځته کړي. د میوزیک ایل ایم کیسه حالت د یوې صحنې احساساتي اغیزه ډیروي. نو ، لیدونکي کولی شي په کیسه کې د ډوبیدو اضافي درجې ولري.
د موسیقۍ د تجربې کچه
تاسو کولی شئ د رامینځته شوي میوزیک مشکل تنظیم کړئ. کاروونکي کولی شي د دوی د مهارت کچې پراساس د دریو کچو ترمنځ انتخاب وکړي. همدارنګه، دوی کولی شي د پیچلتیا غوره درجه مشخص کړي: پیل کونکی، منځنی، یا پرمختللی.
دا فیچر تاسو سره مرسته کوي که تاسو د موسیقۍ لږ مهارت لرئ او غواړئ د نوي کمپوزونو سره تجربه وکړئ. په هرصورت، که تاسو تجربه لرونکی موسیقار یاست، تاسو کولی شئ پیچلي او فرعي میوزیک جوړ کړئ. د دې خصوصیت سره د میوزیک ایل ایم هدف د ټولو کاروونکو لپاره د لاسرسي وړ تجربه وړاندې کول دي.
د نسل تنوع
د نسل تنوع فعالیت سره، تاسو کولی شئ د ورته ان پټ څخه د سندرې ډیری نسخې تولید کړئ. او، تاسو کولی شئ د محصول مختلف لړۍ ولرئ. دا پدې معنی ده چې AI ممکن د سندرې ډیری نسخې رامینځته کړي.
برسېره پردې، د سندرو بنسټیز سټایل او جوړښت ساتل په داسې حال کې چې د سندرو بدیل یا د غږ پرمختګونه شتون لري. دا خصوصیت د AI میوزیک رامینځته کولو کې مرسته کوي چې ډیر تخلیقي وي. له همدې امله ، دا د میوزیک رامینځته کول د انسان سندرې لیکلو ته ډیر ورته کوي.
د میوزیک ایل ایم احتمالي محدودیتونه
ګوګل لا تر اوسه د عامو خلکو لپاره MusicLM نه دی چمتو کړی ځکه چې دا لاهم د پراختیا په حال کې دی. له همدې امله، تاسو نشئ کولی د موسیقۍ ډولونو ځانګړي نمونې ورکړئ چې میوزیک ایل ایم تولید کولی شي. سربیره پردې ، دا لاهم یو څه نامعلوم دی چې د میوزیک ایل ایم کوم محدودیتونه درلودلی شي.
لکه څنګه چې ټیکنالوژي لاهم په خپلو لومړیو مرحلو کې ده، دا کولی شي د موسیقۍ په وړتیا باندې ځینې محدودیتونه ولري چې تولید کیږي یا دا د ځانګړو معلوماتو اداره کولو ظرفیت لري.
د تولید شوي نمونو تحریف کیفیت یو له مهمو نیمګړتیاوو څخه دی. دا د روزنې پروسې یو اړین محصول دی چې د MusicLM پراختیا لپاره کارول کیږي.
بله نیمګړتیا دا ده چې د موسیقۍ ایل ایم تخنیکي وړتیا سره سره د غږونو تولید لپاره. پدې کې د کویر سندرې شاملې دي. د میوزیک ایل ایم لخوا تولید شوي "غزلونه" ځینې وختونه د ګبر په څیر ښکاري. سربیره پردې، دوی د پوهیدلو لپاره ستونزمن کیدی شي. په هرصورت، MusicLM لاهم په پراختیا کې دی او دا مسلې ښه کیدی شي.
وروستۍ څرګندونې
په نهایت کې ، موږ باور لرو چې د ګوګل میوزیک ایل ایم لاندې ټیکنالوژي دواړه په زړه پوري او زړه راښکونکي دي. دا د حیرانتیا خبره ده چې AI کولی شي په مختلف سټایلونو کې میوزیک رامینځته کړي ، د لوړې کچې ریالیزم سره. میوزیک ایل ایم د میوزیک سوداګرۍ بدلولو احتمال لري. او، موږ لیواله یو چې وګورو چې دا ټیکنالوژي څنګه وده کوي.
یو ځواب ورکړئ ووځي