DALL-E 2 പോലെ നിങ്ങൾ ടൈപ്പ് ചെയ്യുന്ന വാക്കുകളിൽ നിന്ന് സംഗീതം സൃഷ്ടിക്കുന്ന മ്യൂസിക്എൽഎം, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഗൂഗിൾ പ്രഖ്യാപിച്ചു. ഗൂഗിൾ റിസർച്ച് സൃഷ്ടിച്ച ഒരു ഭാഷാ മാതൃകയാണിത്. കൂടാതെ, അവർ ഇത് സംഗീതം സൃഷ്ടിക്കാൻ മാത്രമായി രൂപകൽപ്പന ചെയ്തിട്ടുണ്ട്.
കൂടാതെ, മ്യൂസിക് ഫയലുകളുടെ ഒരു വലിയ ഡാറ്റാസെറ്റിൽ ഇത് പരിശീലിപ്പിക്കപ്പെട്ടിരിക്കുന്നു, കൂടാതെ നിരവധി ശൈലികളിലും രൂപങ്ങളിലും സംഗീതം നിർമ്മിക്കാൻ കഴിയും. നിങ്ങൾക്ക് സംഗീതത്തിൽ താൽപ്പര്യമുണ്ടെങ്കിൽ; അതിനുശേഷം MusicLM എന്താണ് വാഗ്ദാനം ചെയ്യുന്നതെന്ന് നിങ്ങൾ പരിശോധിക്കണം.
MusicLM ഉപയോഗിച്ച് നിങ്ങൾ ചില ടെക്നിക്കുകളിലും രൂപങ്ങളിലും സംഗീതം നിർമ്മിക്കുന്നു. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് പിയാനോ കഷണങ്ങൾ, ഡ്രംസ് ബീറ്റുകൾ, വരികൾക്കായി മെലഡികൾ എന്നിവ സൃഷ്ടിക്കാൻ കഴിയും.
കൂടാതെ, നിങ്ങൾക്ക് ചില ശൈലികൾ നന്നായി ട്യൂൺ ചെയ്യാനോ ഉപയോക്താവ് നൽകുന്ന ഇൻപുട്ട് ഉൾപ്പെടുത്താനോ കഴിയും. യോജിപ്പും താളാത്മകവുമായ സംഗീതം ഉൽപ്പാദിപ്പിക്കാനാണ് ഇത് ഉദ്ദേശിക്കുന്നത്. അതിനാൽ, മ്യൂസിക്എൽഎം എന്താണെന്ന് നോക്കാം.
മുമ്പത്തെ ശ്രമങ്ങൾ
മ്യൂസിക് എൽഎം ആദ്യത്തെ AI- ജനറേറ്റഡ് മ്യൂസിക് സിസ്റ്റമല്ല. റിഫ്യൂഷൻ, ഡാൻസ് ഡിഫ്യൂഷൻ, ഗൂഗിളിന്റെ ഓഡിയോഎംഎൽ, ഓപ്പൺഎഐ ജൂക്ബോക്സ് താരതമ്യപ്പെടുത്താവുന്ന സമീപനങ്ങളുടെ ഉദാഹരണങ്ങളാണ്. എന്നിരുന്നാലും, ഈ മുൻ സംവിധാനങ്ങൾ സാങ്കേതിക നിയന്ത്രണങ്ങളാൽ പരിമിതപ്പെട്ടു.
കൂടാതെ, അവരുടെ പരിശീലന ഡാറ്റയുടെ അഭാവം ഉയർന്ന നിലവാരമുള്ള ട്യൂണുകൾ രചിക്കുന്നത് ബുദ്ധിമുട്ടാക്കി. എന്നിരുന്നാലും, കൂടുതൽ സങ്കീർണ്ണതയും യാഥാർത്ഥ്യബോധവും ഉപയോഗിച്ച് സംഗീതം സൃഷ്ടിക്കാനുള്ള ശേഷി MusicLM-നുണ്ട്.
അവലോകനം MusicLM
MusicLM സംഗീതത്തിന്റെ ഘടനയും ശൈലിയും പഠിക്കുന്നു. അതിനാൽ, MIDI, പ്രതീകാത്മക സംഗീത ഫയലുകളുടെ ഒരു വലിയ ഡാറ്റാസെറ്റിൽ ഇത് പരിശീലിപ്പിക്കപ്പെടുന്നു. സമാനമായ പ്രോഗ്രാമുകൾ പോലെ, മ്യൂസിക്എൽഎം ട്രാൻസ്ഫോർമർ ആർക്കിടെക്ചറിലാണ് നിർമ്മിച്ചിരിക്കുന്നത്.
പ്രത്യേക ഇൻപുട്ട് ഘടകങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നതിന് സ്വയം-ശ്രദ്ധാ സാങ്കേതിക വിദ്യകൾ ഉപയോഗപ്പെടുത്തി, ഒരു വലിയ ഡാറ്റാസെറ്റിൽ നിന്ന് സംഗീതത്തിന്റെ ഘടനയും ശൈലിയും വേർതിരിച്ചെടുക്കാൻ MusicLM-ന്റെ ട്രാൻസ്ഫോർമർ ആർക്കിടെക്ചർ ഉപയോഗിക്കുന്നു. തൽഫലമായി, നിങ്ങൾക്ക് യോജിപ്പും താളാത്മകവുമായ സംഗീതം സൃഷ്ടിക്കാൻ കഴിയും.
കൂടാതെ, ഈ സംഗീതത്തിന് ഉപയോക്തൃ ഇൻപുട്ടിന്റെ ഓർഗനൈസേഷനെ അനുകരിക്കാനാകും. അതിനാൽ, പ്രോഗ്രാമിൽ നിങ്ങൾ പ്രത്യേകമായി വിവരിക്കുന്ന സംഗീത ഫലം നിങ്ങൾക്ക് ലഭിക്കും.
മുമ്പത്തെ വിജയം ഭാഷാ മാതൃകകൾ, യോജിച്ചതും ഒഴുക്കുള്ളതുമായ എഴുത്ത് സൃഷ്ടിക്കാനുള്ള കഴിവ് തെളിയിച്ച GPT-2, GPT-3 എന്നിവ MusicLM-നെ പ്രചോദിപ്പിച്ചു. മ്യൂസിക് എൽഎം, മ്യൂസിക് ജനറേഷനു വേണ്ടി മാത്രമായി നിർമ്മിച്ച ആദ്യത്തെ ഭാഷാ മോഡലാണ്.
കൂടാതെ, ഇത് ഏറ്റവും സങ്കീർണ്ണമായ മോഡലുകളിലൊന്നായി കണക്കാക്കുമെന്ന് ഞങ്ങൾ കരുതുന്നു.
അതെങ്ങനെയാണ് പ്രവര്ത്തിക്കുന്നത്?
DALL-E 2, Google-ന്റെ MusicLM നിർമ്മിത ബുദ്ധി ഒരുപാട് ഘടനാപരമായ സമാനതകൾ പങ്കിടുന്നു. ഈ സമയം, നിങ്ങളുടെ എഴുത്ത് ദൃശ്യപരമല്ല, മറിച്ച് സംഗീതാത്മകമാണ്. ഈ ഘട്ടത്തിൽ, നിങ്ങൾക്ക് ഒന്നുകിൽ ഒരു മുഴുവൻ ഭാഗം പൂർണ്ണമായും നിർമ്മിക്കാൻ കഴിയും. കൂടാതെ, ഒരു ഉപകരണം ഉപയോഗിച്ച് നിങ്ങൾക്ക് താളം സൃഷ്ടിക്കാൻ കഴിയും.
MusicLM-ന്റെ Github പേജിൽ Google AI ടീം സൃഷ്ടിച്ച നിരവധി സാമ്പിൾ പഠനങ്ങൾ നിങ്ങൾക്ക് കാണാൻ കഴിയും. AI ഇപ്പോഴും ഗവേഷണ-വികസന ഘട്ടത്തിലാണെങ്കിലും, ഉയർന്ന റെസല്യൂഷനുള്ള ശബ്ദങ്ങൾ അത് സൃഷ്ടിക്കാൻ കഴിയും. കൂടാതെ, ഈ AI-യെ ChatGPT-യുമായി സംയോജിപ്പിക്കുന്നതുപോലുള്ള നിർദ്ദേശങ്ങളും ഉണ്ടായിട്ടുണ്ട്. ഈ സംയോജനം കൂടുതൽ സങ്കീർണ്ണവും ക്രിയാത്മകവുമായ സംഗീതത്തിലേക്ക് നയിച്ചേക്കാം.
ഹമ്മിംഗ് മുതൽ ഹിറ്റ് മെലഡീസ് വരെ
MusicLM നാല് വ്യത്യസ്ത AI മോഡലുകൾ സംയോജിപ്പിക്കുന്നു: MuLan, AudioLM, w2v-BERT, സൗണ്ട്സ്ട്രീം. ഈ മോഡലുകളിൽ ഓരോന്നിനും വ്യതിരിക്തമായ കഴിവുകൾ ഉണ്ടെങ്കിലും. എന്നിരുന്നാലും, അവ സംയോജിപ്പിച്ചപ്പോൾ, അവ മ്യൂസിക്എൽഎം ആയിത്തീർന്നു!
ഏറ്റവും അടിസ്ഥാനപരമായ ഹമ്മുകളും പിറുപിറുപ്പുകളും പോലും മുഴുവൻ ട്യൂണുകളാക്കി മാറ്റാനുള്ള MusicLM-ന്റെ കഴിവ് സംഗീതജ്ഞരും വ്യവസായ പ്രൊഫഷണലുകളും ശ്രദ്ധിച്ചിട്ടുണ്ട്. ChatGPT-യുമായി സംയോജിപ്പിക്കുന്നതിലൂടെ, അതിന് തനതായ സംഗീതം സൃഷ്ടിക്കാൻ കഴിയും.
MusicLM സൃഷ്ടിച്ച സംഗീതവും ശബ്ദങ്ങളും നിങ്ങൾക്ക് കേൾക്കാനും പര്യവേക്ഷണം ചെയ്യാനും കഴിയും വെബ്സൈറ്റ്. പക്ഷേ, അത് ഇപ്പോൾ പരീക്ഷണ ഘട്ടത്തിലാണെന്ന് ഓർക്കുക. സാങ്കേതികവിദ്യ വികസിക്കുമ്പോൾ സംഗീത ബിസിനസ്സിനെ പൂർണ്ണമായും പരിവർത്തനം ചെയ്യാനുള്ള കഴിവ് MusicLM-ന് ഉണ്ടെന്നത് വ്യക്തമാണ്.
മനുഷ്യനെപ്പോലെയുള്ള സൂക്ഷ്മതകളുള്ള AI- ജനറേറ്റഡ് സംഗീതം
സമഗ്രമായ വിവരണങ്ങളെ അടിസ്ഥാനമാക്കി അർത്ഥവത്തായ ഗാനങ്ങൾ നിർമ്മിക്കുന്നതിന്, 280,000 മണിക്കൂർ സംഗീതത്തിന്റെ ഒരു വലിയ ഡാറ്റാസെറ്റിൽ മ്യൂസിക്എൽഎം പരിശീലിപ്പിക്കപ്പെട്ടു. ഉദാഹരണത്തിന്, നിങ്ങൾക്ക് "ഡീപ് ബാസും അത്യാധുനിക ഡ്രം റിഥവും ഉള്ള ഒരു മെലോഡിക് ഡബ്സ്റ്റെപ്പ് ട്യൂൺ" സൃഷ്ടിക്കാൻ കഴിയും. അല്ലെങ്കിൽ, "ആകർഷകമായ ഗിറ്റാർ റിഫും ശക്തമായ ഒരു ഗായകനുമുള്ള ഒരു മോഹിപ്പിക്കുന്ന പോപ്പ് ഗാനം" സൃഷ്ടിക്കാൻ നിങ്ങൾക്ക് ആവശ്യപ്പെടാം. ഈ കേസിൽ നിങ്ങളുടെ ഭാവനയാണ് പരിധി.
നിർമ്മിച്ച ഗാനങ്ങൾ മനുഷ്യ സംഗീതജ്ഞർ രചിച്ചവയോട് സാമ്യമുള്ളതാണ്. MusicLM-ന്റെ സാമ്പിളുകൾ അങ്ങേയറ്റം അമ്പരപ്പിക്കുന്നതാണ്. രചനാ പ്രക്രിയയിൽ ഒരു മനുഷ്യനും ഉൾപ്പെട്ടിട്ടില്ലെന്നത് പ്രത്യേകിച്ചും സത്യമാണ്. MusicLM-ന് മ്യൂസിക്കൽ റിഫുകൾ, മെലഡികൾ, വികാരങ്ങൾ എന്നിവ പോലുള്ള സൂക്ഷ്മമായ വശങ്ങൾ ആവർത്തിക്കാനാകും. കൂടാതെ, സങ്കീർണ്ണവും വ്യക്തവുമായ സവിശേഷതകൾ നൽകുമ്പോൾ പോലും ഇത് പ്രവർത്തിക്കുന്നു.
പ്രധാന സവിശേഷതകൾ
പെയിന്റിംഗ് അടിക്കുറിപ്പ് കണ്ടീഷനിംഗ്
പെയിന്റിംഗ് അടിക്കുറിപ്പ് കണ്ടീഷനിംഗ് ഒരു MusicLM ഫംഗ്ഷനാണ്. ഒരു പെയിന്റിംഗിന്റെ വാചക വിവരണമോ "അടിക്കുറിപ്പ്" അടിസ്ഥാനമാക്കിയോ നിങ്ങൾക്ക് സംഗീതം നിർമ്മിക്കാൻ കഴിയും. ഒരു ചിത്രത്തിൽ പ്രകടിപ്പിക്കുന്ന വികാരങ്ങൾ, മാനസികാവസ്ഥകൾ, ആശയങ്ങൾ എന്നിവ ഉൾക്കൊള്ളുന്ന സംഗീതം സൃഷ്ടിക്കാൻ MusicLM-ന് കഴിയുമെന്ന് ഇത് സൂചിപ്പിക്കുന്നു. സിനിമകൾക്ക് സംഗീതം സൃഷ്ടിക്കുന്നതിന് ഈ കഴിവ് വളരെ സഹായകരമാണ്, വീഡിയോ ഗെയിമുകൾ, എല്ലാത്തരം ദൃശ്യമാധ്യമങ്ങളും.
കഥ ഫാഷൻ
സ്റ്റോറി മോഡ് ഫീച്ചർ ഒരു സ്റ്റോറി ടെക്സ്റ്റ് ഇൻപുട്ടായി എടുക്കുന്നു. അതിനാൽ, അത് അനുബന്ധ പശ്ചാത്തല സംഗീതം സൃഷ്ടിക്കുന്നു. ഒരു കഥയ്ക്കോ വീഡിയോ ഗെയിമിനോ സിനിമയ്ക്കോ വേണ്ടിയുള്ള ഒരു ശബ്ദട്രാക്ക് സൃഷ്ടിക്കാൻ ഉപയോക്താക്കൾക്ക് ഈ ഫംഗ്ഷൻ ഉപയോഗപ്പെടുത്താം.
മീഡിയ ആർട്ടിസ്റ്റുകൾക്കുള്ള ഒരു ഹാൻഡി ടൂളാണ് സ്റ്റോറി മോഡ്. അതിനാൽ, ഇതിന് വിശാലമായ സംഗീത ശൈലികളും ഉപകരണങ്ങളും സൃഷ്ടിക്കാൻ കഴിയും. MusicLM-ന്റെ ടെയിൽ മോഡ് ഒരു സീനിന്റെ വൈകാരിക ആഘാതം വർദ്ധിപ്പിക്കുന്നു. അതിനാൽ, കാഴ്ചക്കാർക്ക് കഥയിൽ കൂടുതൽ മുഴുകാൻ കഴിയും.
സംഗീതജ്ഞരുടെ അനുഭവ നില
സൃഷ്ടിച്ച സംഗീതത്തിന്റെ ബുദ്ധിമുട്ട് നിങ്ങൾക്ക് ഇഷ്ടാനുസൃതമാക്കാൻ കഴിയും. ഉപയോക്താക്കൾക്ക് അവരുടെ നൈപുണ്യ നിലയെ അടിസ്ഥാനമാക്കി മൂന്ന് ലെവലുകൾ തിരഞ്ഞെടുക്കാം. കൂടാതെ, അവർക്ക് സങ്കീർണ്ണതയുടെ ഇഷ്ടപ്പെട്ട ബിരുദം വ്യക്തമാക്കാൻ കഴിയും: തുടക്കക്കാരൻ, ഇന്റർമീഡിയറ്റ് അല്ലെങ്കിൽ അഡ്വാൻസ്ഡ്.
നിങ്ങൾക്ക് കുറച്ച് സംഗീത വൈദഗ്ദ്ധ്യം ഉണ്ടെങ്കിൽ പുതിയ രചനകൾ പരീക്ഷിക്കാൻ ആഗ്രഹിക്കുന്നുണ്ടെങ്കിൽ ഈ ഫീച്ചർ നിങ്ങളെ സഹായിക്കുന്നു. എന്നിരുന്നാലും, നിങ്ങൾ പരിചയസമ്പന്നനായ ഒരു സംഗീതജ്ഞനാണെങ്കിൽ, നിങ്ങൾക്ക് സങ്കീർണ്ണവും സൂക്ഷ്മവുമായ സംഗീതം സൃഷ്ടിക്കാൻ കഴിയും. എല്ലാ ഉപയോക്താക്കൾക്കും ആക്സസ് ചെയ്യാവുന്ന അനുഭവം നൽകുക എന്നതാണ് ഈ ഫീച്ചറിലൂടെ MusicLM-ന്റെ ലക്ഷ്യം.
ജനറേഷൻ വൈവിധ്യം
ജനറേഷൻ ഡൈവേഴ്സിറ്റി ഫംഗ്ഷൻ ഉപയോഗിച്ച്, ഒരേ ഇൻപുട്ടിൽ നിന്ന് നിങ്ങൾക്ക് ഒരു പാട്ടിന്റെ നിരവധി പതിപ്പുകൾ നിർമ്മിക്കാൻ കഴിയും. കൂടാതെ, നിങ്ങൾക്ക് വൈവിധ്യമാർന്ന ഔട്ട്പുട്ടുകൾ ഉണ്ടായിരിക്കാം. AI ഒരു പാട്ടിന്റെ ഒന്നിലധികം പതിപ്പുകൾ സൃഷ്ടിച്ചേക്കാമെന്ന് ഇത് സൂചിപ്പിക്കുന്നു.
കൂടാതെ, പാട്ടിന്റെ അടിസ്ഥാന ശൈലിയും ഘടനയും നിലനിർത്തിക്കൊണ്ടുതന്നെ, ഇതര മെലഡികളോ കോർഡ് പുരോഗതികളോ ഉണ്ട്. ഈ ഫീച്ചർ AI-യുടെ സംഗീത സൃഷ്ടിയെ കൂടുതൽ ക്രിയാത്മകമാക്കാൻ സഹായിക്കുന്നു. അതിനാൽ, ഇത് സംഗീത സൃഷ്ടിയെ മനുഷ്യന്റെ ഗാനരചനയുമായി കൂടുതൽ സാമ്യമുള്ളതാക്കുന്നു.
MusicLM ന്റെ സാധ്യമായ പരിമിതികൾ
വികസിപ്പിച്ചുകൊണ്ടിരിക്കുന്നതിനാൽ ഗൂഗിൾ ഇതുവരെ മ്യൂസിക്എൽഎം പൊതുജനങ്ങൾക്ക് ലഭ്യമാക്കിയിട്ടില്ല. അതിനാൽ, MusicLM-ന് നിർമ്മിക്കാൻ കഴിയുന്ന തരത്തിലുള്ള സംഗീതത്തിന്റെ പ്രത്യേക സാമ്പിളുകൾ നിങ്ങൾക്ക് ഇതുവരെ നൽകാനാവില്ല. കൂടാതെ, MusicLM-ന് എന്ത് നിയന്ത്രണങ്ങളുണ്ടാകുമെന്ന് ഇപ്പോഴും അൽപ്പം അജ്ഞാതമാണ്.
സാങ്കേതികവിദ്യ ഇപ്പോഴും അതിന്റെ പ്രാരംഭ ഘട്ടത്തിലായതിനാൽ, ഉൽപ്പാദിപ്പിക്കുന്ന സംഗീതത്തിന്റെ കാലിബറിലോ പ്രത്യേക ഇൻപുട്ടുകൾ കൈകാര്യം ചെയ്യാനുള്ള ശേഷിയിലോ അതിന് ചില നിയന്ത്രണങ്ങൾ ഉണ്ടാകാം.
നിർമ്മിച്ച സാമ്പിളുകളുടെ വികലമായ ഗുണനിലവാരം പ്രധാന പോരായ്മകളിലൊന്നാണ്. മ്യൂസിക്എൽഎം വികസിപ്പിക്കുന്നതിന് ഉപയോഗിക്കുന്ന പരിശീലന പ്രക്രിയയുടെ ആവശ്യമായ ഉപോൽപ്പന്നമാണിത്.
വോക്കൽ നിർമ്മിക്കാനുള്ള മ്യൂസിക്എൽഎമ്മിന്റെ സാങ്കേതിക കഴിവ് ഉണ്ടായിരുന്നിട്ടും മറ്റൊരു പോരായ്മ. ഇതിൽ ഗായകസംഘ ഗാനങ്ങളും ഉൾപ്പെടുന്നു. മ്യൂസിക്എൽഎം നിർമ്മിച്ച "വരികൾ" ചിലപ്പോഴൊക്കെ വിഡ്ഢിത്തം പോലെ തോന്നും. കൂടാതെ, അവ മനസ്സിലാക്കാൻ പ്രയാസമായിരിക്കും. എന്നിരുന്നാലും, MusicLM ഇപ്പോഴും വികസനത്തിലാണ്, ഈ പ്രശ്നങ്ങൾ മെച്ചപ്പെടുത്താൻ കഴിയും.
അന്തിമ പരാമർശങ്ങൾ
അവസാനമായി, ഗൂഗിൾ മ്യൂസിക്എൽഎമ്മിന് അടിവരയിടുന്ന സാങ്കേതികവിദ്യ രസകരവും ആകർഷകവുമാണെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു. ഉയർന്ന തലത്തിലുള്ള റിയലിസത്തോടെ, വിവിധ ശൈലികളിൽ ഒരു AI-ക്ക് സംഗീതം സൃഷ്ടിക്കാൻ കഴിയുമെന്നത് ആശ്ചര്യകരമാണ്. മ്യൂസിക് എൽഎമ്മിന് സംഗീത ബിസിനസിനെ മാറ്റാനുള്ള കഴിവുണ്ട്. കൂടാതെ, ഈ സാങ്കേതികവിദ്യ എങ്ങനെ വികസിക്കുന്നുവെന്ന് കാണാൻ ഞങ്ങൾ ആവേശഭരിതരാണ്.
നിങ്ങളുടെ അഭിപ്രായങ്ങൾ രേഖപ്പെടുത്തുക