DALL-E 2 ကဲ့သို့ သင်ရိုက်သော စကားလုံးများမှ ဂီတကို ဖန်တီးပေးသည့် ဉာဏ်ရည်တု MusicLM ကို Google မှ ကြေညာခဲ့သည်။ ၎င်းသည် Google Research မှ ဖန်တီးထားသော ဘာသာစကားပုံစံတစ်ခုဖြစ်သည်။ ထို့အပြင် ၎င်းတို့သည် ဂီတဖန်တီးမှုအတွက် သီးသန့်ဒီဇိုင်းထုတ်ထားသည်။
ထို့အပြင် ၎င်းသည် ဂီတဖိုင်များ၏ များပြားလှသော ဒေတာအစုအဝေးတွင် လေ့ကျင့်သင်ကြားထားပြီး ဂီတပုံစံများနှင့် ပုံစံအမျိုးမျိုးဖြင့် ထုတ်လုပ်နိုင်သည်။ ဂီတကို စိတ်ဝင်စားတယ်ဆိုရင်၊ ထို့နောက် MusicLM က ဘာကမ်းလှမ်းမည်ကို စစ်ဆေးသင့်သည်။
MusicLM ဖြင့် သင်သည် အချို့သော နည်းပညာများနှင့် ပုံစံများဖြင့် တေးဂီတကို ထုတ်လုပ်သည်။ ဥပမာအားဖြင့်၊ သင်သည် သီချင်းစာသားအတွက် စန္ဒယားအပိုင်းများ၊ ဒရမ်စည်းချက်များနှင့် တေးသွားများကို ဖန်တီးနိုင်သည်။
ထို့အပြင်၊ သင်သည် အချို့သောစတိုင်များကို ကောင်းစွာချိန်ညှိနိုင်သည် သို့မဟုတ် အသုံးပြုသူမှပေးသော ထည့်သွင်းမှုကို ထည့်သွင်းနိုင်သည်။ ဟန်ချက်ညီညီနှင့် စည်းချက်ညီညီ ပေါင်းစပ်ထားသော ဂီတကို ထုတ်လုပ်ရန် ရည်ရွယ်သည်။ ဒီတော့ MusicLM က ဘာအကြောင်းတွေလဲဆိုတာ ဝင်ကြည့်လိုက်ရအောင်။
ယခင်ကြိုးစားမှု
MusicLM သည် AI မှထုတ်လုပ်သော ပထမဆုံးဂီတစနစ်မဟုတ်ပါ။ Riffusion၊ Dance Diffusion၊ Google ၏ AudioML နှင့် OpenAI များ ဖျော်ဖြေရေး နှိုင်းယှဉ်နိုင်သော ချဉ်းကပ်နည်းများ ဥပမာများဖြစ်သည်။ သို့သော် ဤယခင်စနစ်များသည် နည်းပညာဆိုင်ရာ ကန့်သတ်ချက်များကြောင့် ကန့်သတ်ချုပ်ချယ်ခံခဲ့ရသည်။
ထို့အပြင် ၎င်းတို့၏ လေ့ကျင့်ရေးဒေတာ ချို့တဲ့မှုကြောင့် အရည်အသွေးမြင့် သံစဉ်များကို ရေးစပ်ရန် ခက်ခဲစေသည်။ သို့သော်၊ MusicLM သည် ပိုမိုဆန်းပြားပြီး လက်တွေ့ဆန်မှုအဆင့်ဖြင့် ဂီတကို ဖန်တီးနိုင်စွမ်းရှိသည်။
ခြုံငုံသုံးသပ်ချက် MusicLM
MusicLM သည် ဂီတဖွဲ့စည်းပုံနှင့် စတိုင်ကို လေ့လာသည်။ ထို့ကြောင့်၊ ၎င်းသည် MIDI ၏ များပြားလှသော ဒေတာအစုံနှင့် သင်္ကေတဂီတဖိုင်များကို လေ့ကျင့်သင်ကြားပေးပါသည်။ ၎င်း၏ အလားတူပရိုဂရမ်များကဲ့သို့ MusicLM သည် Transformer ဗိသုကာလက်ရာပေါ်တွင် တည်ဆောက်ထားသည်။
သီးသန့်ထည့်သွင်းထားသော အစိတ်အပိုင်းများပေါ်တွင် အာရုံစူးစိုက်နိုင်ရန် ကိုယ့်ကိုယ်ကိုယ် အာရုံစူးစိုက်မှုဆိုင်ရာ နည်းပညာများကို အသုံးပြု၍ MusicLM ၏ ထရန်စဖော်မာဗိသုကာကို ဒေတာအတွဲကြီးတစ်ခုမှ ဂီတဖွဲ့စည်းပုံနှင့် စတိုင်ကို ထုတ်ယူရန်အတွက် အသုံးပြုပါသည်။ ရလဒ်အနေဖြင့် သင်သည် ဟန်ချက်ညီညီနှင့် စည်းချက်ညီညီ ပေါင်းစပ်ထားသော ဂီတကို ဖန်တီးနိုင်သည်။
ထို့အပြင်၊ ဤဂီတသည် အသုံးပြုသူထည့်သွင်းမှု၏ အဖွဲ့အစည်းကို အတုယူနိုင်သည်။ ထို့ကြောင့်၊ အစီအစဉ်တွင် သင်ဖော်ပြသည့် ဂီတရလဒ်ကို သင်ရရှိနိုင်မည်ဖြစ်သည်။
ယခင်အောင်မြင်မှု ဘာသာစကားမော်ဒယ်များစည်းလုံးညီညွတ်ပြီး ကျွမ်းကျင်စွာရေးသားဖန်တီးနိုင်မှုကို သက်သေပြခဲ့သော GPT-2 နှင့် GPT-3 ကဲ့သို့သော၊ MusicLM ကို လှုံ့ဆော်ပေးခဲ့သည်။ အခြားတစ်ဖက်တွင် MusicLM သည် ဂီတမျိုးဆက်အတွက် သီးသန့်တည်ဆောက်ထားသည့် ပထမဆုံးဘာသာစကားပုံစံဖြစ်သည်။
ပြီးတော့၊ အဲဒါကို အဆန်းပြားဆုံး မော်ဒယ်တွေထဲက တစ်ခုအဖြစ် မှတ်ယူမယ်လို့ ကျွန်တော်တို့ထင်ပါတယ်။
ဒါကဘယ်လိုမျိုးအလုပ်လုပ်သလဲ?
DALL-E 2 နှင့် Google ၏ MusicLM ဉာဏ်ရည်တု structural တူညီမှုများစွာကိုမျှဝေပါ။ သို့သော် ယခုတစ်ကြိမ်တွင် သင်၏အရေးအသားသည် အမြင်အာရုံထက် ဂီတဖြင့် ထုတ်လွှင့်သည်။ ဤအချိန်တွင် သင်သည် အစိတ်အပိုင်းတစ်ခုလုံးကို လုံးလုံးတည်ဆောက်နိုင်သည်။ တူရိယာတစ်ခုတည်းကို အသုံးပြု၍ စည်းချက်ညီညီ ဖန်တီးနိုင်သည်။
MusicLM ၏ Github စာမျက်နှာတွင် Google AI အဖွဲ့မှ ဖန်တီးထားသော နမူနာလေ့လာမှုများစွာကို သင်ကြည့်ရှုနိုင်ပါသည်။ AI သည် သုတေသနနှင့် ဖွံ့ဖြိုးတိုးတက်ရေး အဆင့်တွင် ရှိနေသော်လည်း ၎င်းကို ပြုလုပ်နိုင်သည့် အသံများသည် ကြည်လင်ပြတ်သားမှု မြင့်မားသည်။ ထို့အပြင်၊ ဤ AI ကို ChatGPT နှင့် ပေါင်းစည်းခြင်းကဲ့သို့သော အကြံပြုချက်များလည်း ရှိပါသည်။ ဤပေါင်းစပ်မှုသည် ပိုမိုရှုပ်ထွေးပြီး တီထွင်ဖန်တီးနိုင်သော ဂီတကို ဖြစ်ပေါ်စေနိုင်သည်။
Humming မှ Hit Melodies အထိ
MusicLM သည် MuLan၊ AudioLM၊ w2v-BERT နှင့် Soundstream လေးခုကို ပေါင်းစပ်ထားသည်။ ဤမော်ဒယ်များတစ်ခုစီတွင်ထူးခြားသောစွမ်းရည်များရှိသည်။ သို့သော် ပေါင်းစပ်လိုက်သောအခါတွင် MusicLM ကို ဖြစ်ပေါ်စေခဲ့သည်။
ဂီတပညာရှင်များနှင့် လုပ်ငန်းကျွမ်းကျင်ပညာရှင်များသည် MusicLM ၏ အခြေခံအကျဆုံး ဟစ်အော်သံများနှင့် ညည်းညူသံများကိုပင် တီးလုံးအဖြစ်သို့ ပြောင်းလဲရန် MusicLM ၏ စွမ်းရည်ကို သတိပြုမိကြသည်။ ChatGPT နှင့် ပေါင်းစပ်ခြင်းဖြင့် ထူးခြားသော တေးဂီတကို ထုတ်လုပ်နိုင်သည်။
MusicLM မှ ဖန်တီးထားသော တေးဂီတနှင့် အသံများကို ၎င်းတွင် နားထောင်ပြီး စူးစမ်းနိုင်ပါသည်။ က်ဘ်ဆိုက်. သို့သော် ၎င်းသည် လက်ရှိ စမ်းသပ်ဆဲအဆင့်တွင် ရှိနေကြောင်း သတိပြုပါ။ MusicLM သည် နည်းပညာဖွံ့ဖြိုးတိုးတက်လာသည်နှင့်အမျှ ဂီတလုပ်ငန်းကို လုံးလုံးလျားလျား ပြောင်းလဲနိုင်စွမ်းရှိကြောင်း ထင်ရှားပါသည်။
လူနှင့်တူသော အချိုးအစားများဖြင့် AI မှထုတ်လုပ်ထားသော ဂီတ
စေ့စေ့စပ်စပ်ဖော်ပြချက်များအပေါ်အခြေခံ၍ အဓိပ္ပာယ်ရှိသောသီချင်းများထုတ်လုပ်ရန် MusicLM သည် ဂီတနာရီပေါင်း 280,000 ဒေတာအစုံအလင်ဖြင့် လေ့ကျင့်သင်ကြားခဲ့သည်။ ဥပမာအားဖြင့်၊ သင်သည် "နက်နဲသောဘေ့စ်နှင့် ဆန်းပြားသော ဒရမ်စည်းချက်များဖြင့် မြူးထူးသော dubstep တေးသွားကို ဖန်တီးနိုင်သည်။ သို့မဟုတ် စွဲမက်ဖွယ်ကောင်းသော ဂစ်တာသံနှင့် ပြင်းပြင်းထန်ထန် တေးသံရှင်တို့နှင့်အတူ စွဲမက်ဖွယ်ကောင်းသော ပေါ့ပ်သီချင်းကို ဖန်တီးရန် ၎င်းကို တောင်းဆိုနိုင်သည်။ ဤကိစ္စတွင် သင့်စိတ်ကူးသည် အကန့်အသတ်ဖြစ်သည်။
ထုတ်လုပ်ထားသော သီချင်းများသည် လူသားဂီတသမားများ ရေးစပ်ထားသော သီချင်းများနှင့် ဆင်တူသည်။ MusicLM ၏နမူနာများသည် အလွန်အံ့သြဖွယ်ကောင်းသည်။ အထူးသဖြင့် ဖွဲ့စည်းမှုဖြစ်စဉ်တွင် လူသားပါဝင်ပတ်သက်မှု မရှိခြင်းမှာ အမှန်ပင်ဖြစ်သည်။ MusicLM သည် ဂီတသံစဉ်များ၊ တေးသွားများနှင့် စိတ်ခံစားမှုများကဲ့သို့ ကွဲပြားသော အသွင်အပြင်များကို ထပ်တလဲလဲ ပြုလုပ်နိုင်သည်။ ထို့အပြင်၊ ရှုပ်ထွေးပြီး ရှင်းလင်းပြတ်သားသော သတ်မှတ်ချက်များ ပေးထားသည့်တိုင် ၎င်းသည် အလုပ်လုပ်သည်။
အရေးကြီးအင်္ဂါရပ်များ
ပန်းချီစာတန်းများ အေးစက်နေသည်။
Painting Caption Conditioning သည် MusicLM လုပ်ဆောင်ချက်တစ်ခုဖြစ်သည်။ ပန်းချီကားတစ်ချပ်၏ စာသားဖော်ပြချက် သို့မဟုတ် "စာတန်း" ကို အခြေခံ၍ တေးဂီတကို ထုတ်လုပ်နိုင်သည်။ ယင်းက MusicLM သည် ရုပ်ပုံတစ်ခုတွင် ဖော်ပြထားသည့် စိတ်ခံစားမှုများ၊ စိတ်ခံစားချက်များနှင့် စိတ်ကူးစိတ်သန်းများကို ဖမ်းယူဖမ်းယူနိုင်သော ဂီတကို ဖန်တီးနိုင်စွမ်းရှိကြောင်း ဆိုလိုသည်။ ဤစွမ်းရည်သည် ရုပ်ရှင်များအတွက် သီချင်းဖန်တီးရာတွင် အလွန်အထောက်အကူဖြစ်စေသည်၊ ဗီဒီယိုဂိမ်းများနှင့် အမြင်အာရုံ မီဒီယာ အမျိုးမျိုး။
ဇာတ်လမ်း Mode ကို
Story Mode လုပ်ဆောင်ချက်သည် ဇာတ်လမ်းစာသားကို ထည့်သွင်းမှုအဖြစ် ယူသည်။ ထို့ကြောင့် ၎င်းသည် တွဲဖက်နောက်ခံတေးဂီတကို ဖန်တီးသည်။ အသုံးပြုသူများသည် ဇာတ်လမ်း သို့မဟုတ် စိတ်ခံစားမှုလေသံကို သရုပ်ဖော်ခြင်းဖြင့် ပုံပြင်၊ ဗီဒီယိုဂိမ်း သို့မဟုတ် ရုပ်ရှင်အတွက် တေးသွားတည်ဆောက်ရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။
Story Mode သည် မီဒီယာအနုပညာရှင်များအတွက် အသုံးဝင်သောကိရိယာတစ်ခုဖြစ်သည်။ ထို့ကြောင့်၊ ၎င်းသည် ကျယ်ပြန့်သော ဂီတစတိုင်များနှင့် တူရိယာများကို ထုတ်လုပ်နိုင်သည်။ MusicLM ၏ ပုံပြင်မုဒ်သည် မြင်ကွင်းတစ်ခု၏ စိတ်ခံစားမှုဆိုင်ရာ အကျိုးသက်ရောက်မှုကို တိုးမြှင့်ပေးပါသည်။ ထို့ကြောင့်၊ ကြည့်ရှုသူများသည် ဇာတ်လမ်းတွင် နှစ်မြှုပ်မှု အတိုင်းအတာတစ်ခု ထပ်မံရရှိနိုင်ပါသည်။
ဂီတပညာရှင်အဆင့်
ဖန်တီးထားသောဂီတ၏အခက်အခဲကို သင်စိတ်ကြိုက်ပြင်ဆင်နိုင်သည်။ အသုံးပြုသူများသည် ၎င်းတို့၏ကျွမ်းကျင်မှုအဆင့်ပေါ်မူတည်၍ အဆင့်သုံးဆင့်ကြား ရွေးချယ်နိုင်သည်။ ထို့အပြင်၊ ၎င်းတို့သည် နှစ်သက်ရာရှုပ်ထွေးမှုအဆင့်ကို သတ်မှတ်နိုင်သည်- စတင်သူ၊ အလယ်အလတ် သို့မဟုတ် အဆင့်မြင့်သည်။
သင့်တွင် ဂီတကျွမ်းကျင်မှုအနည်းငယ်ရှိပြီး သီကုံးမှုအသစ်များကို စမ်းသပ်လိုပါက ဤအင်္ဂါရပ်က သင့်အား ကူညီပေးပါသည်။ ဒါပေမယ့် သင်ဟာ အတွေ့အကြုံရှိတဲ့ ဂီတပညာရှင်ဆိုရင်၊ ဆန်းပြားပြီး သိမ်မွေ့တဲ့ ဂီတကို ဖန်တီးနိုင်ပါတယ်။ ဤအင်္ဂါရပ်ဖြင့် MusicLM ၏ ရည်မှန်းချက်မှာ အသုံးပြုသူအားလုံးအတွက် လက်လှမ်းမီနိုင်သော အတွေ့အကြုံကို ပေးအပ်ရန်ဖြစ်သည်။
မျိုးဆက်ကွဲပြားမှု
Generation Diversity လုပ်ဆောင်ချက်ဖြင့် သင်သည် တူညီသောထည့်သွင်းမှုမှ သီချင်းဗားရှင်းများစွာကို ထုတ်လုပ်နိုင်သည်။ ပြီးတော့၊ သင့်မှာ မတူညီတဲ့ output အမျိုးမျိုးကို ရနိုင်ပါတယ်။ ဆိုလိုသည်မှာ AI သည် သီချင်းတစ်ပုဒ်၏ ဗားရှင်းများစွာကို ထုတ်လုပ်နိုင်သည်ဟု ဆိုလိုသည်။
ထို့အပြင်၊ သီချင်း၏အခြေခံစတိုင်နှင့်ဖွဲ့စည်းပုံကိုဆက်လက်ထိန်းသိမ်းထားစဉ်တွင်အခြားတေးသွားများသို့မဟုတ် chord တိုးတက်မှုများရှိသည်။ ဤအင်္ဂါရပ်သည် AI ၏ဂီတဖန်တီးမှုကို ပိုမိုဖန်တီးနိုင်စေရန် ကူညီပေးသည်။ ထို့ကြောင့် ဂီတဖန်တီးမှုသည် လူသားသီချင်းရေးခြင်းနှင့် ပို၍ဆင်တူစေသည်။
MusicLM ၏ဖြစ်နိုင်သောကန့်သတ်ချက်များ
Google သည် ဖွံ့ဖြိုးတိုးတက်ဆဲဖြစ်သောကြောင့် MusicLM ကို အများသူငှာအသုံးပြုနိုင်အောင် မပြုလုပ်ရသေးပါ။ ထို့ကြောင့် MusicLM မှ ထုတ်လုပ်နိုင်သော ဂီတအမျိုးအစားများ၏ သီးခြားနမူနာများကို သင်မပေးနိုင်သေးပါ။ ထို့အပြင် MusicLM တွင် မည်သည့်ကန့်သတ်ချက်များ ရှိနိုင်သည်ကို မသိရသေးပါ။
နည်းပညာသည် ၎င်း၏အစောပိုင်းအဆင့်တွင်ရှိနေဆဲဖြစ်သောကြောင့်၊ ၎င်းတွင်ထုတ်လုပ်ထားသောဂီတ၏လုပ်ရည်ကိုင်ရည် သို့မဟုတ် သီးခြားထည့်သွင်းမှုများကိုကိုင်တွယ်နိုင်မှုစွမ်းရည်အပေါ်အချို့သောကန့်သတ်ချက်များရှိနိုင်သည်။
ထုတ်လုပ်သောနမူနာများ၏ ပုံပျက်ပန်းပျက် အရည်အသွေးသည် အဓိက အားနည်းချက်များထဲမှ တစ်ခုဖြစ်သည်။ ၎င်းသည် MusicLM ဖွံ့ဖြိုးတိုးတက်ရန်အတွက် အသုံးပြုသည့် လေ့ကျင့်ရေးလုပ်ငန်းစဉ်၏ လိုအပ်သောရလဒ်တစ်ခုဖြစ်သည်။
နောက်အားနည်းချက်တစ်ခုကတော့ MusicLM ရဲ့ နည်းပညာပိုင်းအရ အဆိုကိုထုတ်လုပ်နိုင်စွမ်းရှိပေမဲ့။ ဤတွင် choir သီချင်းများ ပါဝင်သည်။ MusicLM မှထုတ်လုပ်သော “သီချင်းစာသားများ” သည် တစ်ခါတစ်ရံတွင် တဖွဖွပြောနေပုံရသည်။ ထို့အပြင် ၎င်းတို့သည် နားလည်ရခက်နိုင်သည်။ သို့သော် MusicLM သည် ဖွံ့ဖြိုးတိုးတက်ဆဲဖြစ်ပြီး ဤပြဿနာများကို မြှင့်တင်နိုင်ပါသည်။
နိဂုံးချုပ်
နောက်ဆုံးတွင်၊ Google MusicLM ၏အခြေခံနည်းပညာသည် စိတ်ဝင်စားစရာကောင်းပြီး စွဲဆောင်မှု နှစ်ခုစလုံးရှိသည်ဟု ကျွန်ုပ်တို့ယုံကြည်ပါသည်။ AI သည် ပိုမိုမြင့်မားသော realism အဆင့်ဖြင့် စတိုင်အမျိုးမျိုးဖြင့် တေးဂီတကို ဖန်တီးနိုင်သည်မှာ အံ့ဩစရာပင်။ MusicLM သည် ဂီတလုပ်ငန်းကို ပြောင်းလဲရန် အလားအလာရှိသည်။ နောက်ပြီး ဒီနည်းပညာ ဘယ်လိုပြောင်းလဲလာမလဲဆိုတာကို စောင့်ကြည့်ရဦးမှာပါ။
တစ်ဦးစာပြန်ရန် Leave