DALL-E 2 වැනි ඔබ ටයිප් කරන වචන වලින් සංගීතය නිර්මාණය කරන MusicLM, කෘතිම බුද්ධිය Google නිවේදනය කළේය. එය Google Research විසින් නිර්මාණය කරන ලද භාෂා ආකෘතියකි. ඊට අමතරව, ඔවුන් එය සංගීත නිර්මාණය සඳහා පමණක් නිර්මාණය කර ඇත.
තවද, එය සංගීත ගොනු විශාල දත්ත කට්ටලයක් මත පුහුණු කර ඇති අතර මෝස්තර සහ ආකෘති පරාසයක සංගීතය නිෂ්පාදනය කළ හැකිය. ඔබ සංගීතයට උනන්දුවක් දක්වන්නේ නම්; එවිට ඔබ MusicLM ලබා දෙන්නේ කුමක්දැයි පරීක්ෂා කළ යුතුය.
MusicLM සමඟින් ඔබ සමහර ශිල්පීය ක්රම සහ ආකාරවලින් සංගීතය නිෂ්පාදනය කරයි. උදාහරණයක් ලෙස, ඔබට පද සඳහා පියානෝ කෑලි, බෙර වාදනය සහ තනු නිර්මාණය කළ හැකිය.
එසේම, ඔබට ඇතැම් මෝස්තරවලට සියුම් ලෙස සකස් කිරීමට හෝ පරිශීලකයා විසින් සපයන ලද ආදානය ඇතුළත් කිරීමට හැකිය. එය සුසංයෝගයෙන් හා රිද්මයානුකූලව සමෝධානික සංගීතය නිෂ්පාදනය කිරීමට අදහස් කරයි. ඉතින්, අපි කිමිදී MusicLM යනු කුමක්දැයි බලමු.
පෙර උත්සාහයන්
MusicLM යනු AI-ජනනය කරන ලද පළමු සංගීත පද්ධතිය නොවේ. Riffusion, Dance Disffusion, Google's AudioML, සහ OpenAI's ජූක්බොක්ස් සංසන්දනාත්මක ප්රවේශයන් සඳහා උදාහරණ වේ. කෙසේ වෙතත්, මෙම පෙර පද්ධති තාක්ෂණික සීමාවන් මගින් සීමා විය.
එසේම, ඔවුන්ගේ පුහුණු දත්ත නොමැතිකම නිසා උසස් තත්ත්වයේ තනු නිර්මාණය කිරීමට අපහසු විය. කෙසේ වෙතත්, MusicLM ට වඩාත් සංකීර්ණ හා යථාර්ථවාදී සංගීතයක් නිර්මාණය කිරීමේ හැකියාව ඇත.
දළ විශ්ලේෂණය MusicLM
MusicLM සංගීතයේ ව්යුහය සහ ශෛලිය ඉගෙන ගනී. එබැවින්, එය MIDI සහ සංකේතාත්මක සංගීත ගොනු විශාල දත්ත කට්ටලයක් මත පුහුණු කරනු ලැබේ. එහි සමාන වැඩසටහන් මෙන්, MusicLM ට්රාන්ස්ෆෝමර් ගෘහ නිර්මාණ ශිල්පය මත ගොඩනගා ඇත.
විශේෂිත ආදාන සංරචක කෙරෙහි අවධානය යොමු කිරීම සඳහා ස්වයං-අවධානය ශිල්පීය ක්රම භාවිතා කරමින්, MusicLM හි ට්රාන්ස්ෆෝමර් ගෘහ නිර්මාණ ශිල්පය විශාල දත්ත කට්ටලයකින් සංගීතයේ ව්යුහය සහ ශෛලිය උපුටා ගැනීමට භාවිතා කරයි. එහි ප්රතිඵලයක් වශයෙන්, ඔබට සුසංයෝගයෙන් හා රිද්මයානුකූලව සමෝධානික සංගීතයක් නිර්මාණය කළ හැකිය.
තවද, මෙම සංගීතයට පරිශීලක ආදානයේ සංවිධානය අනුකරණය කළ හැකිය. එබැවින්, ඔබ වැඩසටහනට විශේෂයෙන් විස්තර කරන සංගීත ප්රතිඵලය ලබා ගැනීමට ඔබට හැකි වනු ඇත.
පෙර සාර්ථකත්වය භාෂා ආකෘති, GPT-2 සහ GPT-3 වැනි, සුසංයෝගී සහ චතුර ලෙස ලිවීමේ හැකියාව ඔප්පු කර ඇති, MusicLM ආභාෂය ලබා දුන්නේය. අනෙක් අතට MusicLM යනු සංගීත පරම්පරාව සඳහා පමණක් ගොඩනගා ඇති පළමු භාෂා ආකෘතියයි.
තවද, එය වඩාත් සංකීර්ණ මාදිලි වලින් එකක් ලෙස සලකනු ඇතැයි අපි සිතමු.
ඒක කොහොමද වැඩ කරන්නේ?
DALL-E 2 සහ Google's MusicLM කෘතිම බුද්ධිය ව්යුහාත්මක සමානකම් ගොඩක් බෙදාගන්න. කෙසේ වෙතත්, මෙවර ඔබේ ලිවීම දෘශ්යමය වශයෙන් නොව සංගීතයෙන් ප්රකාශ වේ. මෙම අවස්ථාවේදී, ඔබට සම්පූර්ණ කැබැල්ලක් සම්පූර්ණයෙන්ම සෑදිය හැකිය. එසේම, ඔබට එක් උපකරණයක් භාවිතයෙන් රිද්මය ජනනය කළ හැකිය.
MusicLM හි Github පිටුවෙහි Google AI කණ්ඩායම විසින් නිර්මාණය කරන ලද නියැදි අධ්යයන කිහිපයක් ඔබට නැරඹිය හැක. AI තවමත් පර්යේෂණ සහ සංවර්ධන මට්ටමේ පවතින නමුත්, එය කළ හැකි ශබ්ද ඉහළ විභේදන වේ. එසේම, මෙම AI ChatGPT සමඟ ඒකාබද්ධ කිරීම වැනි යෝජනා තිබේ. මෙම ඒකාබද්ධ කිරීම වඩාත් සංකීර්ණ හා නිර්මාණශීලී සංගීතයට හේතු විය හැක.
Humming සිට Hit Melodies දක්වා
MusicLM වෙනස් AI මාදිලි හතරක් ඒකාබද්ධ කරයි: MuLan, AudioLM, w2v-BERT, සහ Soundstream. මෙම සෑම මාදිලියකටම සුවිශේෂී හැකියාවන් සමූහයක් ඇතත්. කෙසේ වෙතත්, ඒවා ඒකාබද්ධ වූ විට, ඒවායේ ප්රතිඵලය වූයේ MusicLM!
සංගීතඥයින් සහ ක්ෂේත්ර වෘත්තිකයින් MusicLM හි මූලික හම් සහ මැසිවිලි පවා සම්පූර්ණ නාද බවට පරිවර්තනය කිරීමේ හැකියාව සැලකිල්ලට ගෙන ඇත. ChatGPT සමඟ ඒකාබද්ධ කිරීමෙන්, එය අද්විතීය සංගීතය නිෂ්පාදනය කළ හැකිය.
MusicLM විසින් නිර්මාණය කරන ලද සංගීතය සහ ශබ්ද ඔබට සවන් දීමට සහ ගවේෂණය කිරීමට හැකිය වෙබ් අඩවිය. නමුත් එය දැනට පරීක්ෂණ මට්ටමේ පවතින බව මතක තබා ගන්න. තාක්ෂණය දියුණු වන විට සංගීත ව්යාපාරය සම්පූර්ණයෙන්ම පරිවර්තනය කිරීමේ හැකියාව MusicLM සතුව ඇති බව පැහැදිලිය.
මානව-සමාන සූක්ෂ්මතා සහිත AI-උත්පාදිත සංගීතය
පරිපූර්ණ විස්තර මත පදනම්ව අර්ථවත් ගීත නිෂ්පාදනය කිරීම සඳහා, MusicLM පැය 280,000 ක විශාල දත්ත කට්ටලයක් මත පුහුණු කරන ලදී. උදාහරණයක් ලෙස, ඔබට "ගැඹුරු බාස් සහ නවීන බෙර රිද්මයක් සහිත තනු නිර්මාණය කළ හැකිය. එසේත් නැතිනම්, "ආකර්ශනීය ගිටාර් රිෆ් සහ බලවත් ගායන ශිල්පියෙකු සමඟ සිත් ඇදගන්නාසුළු පොප් ගීතයක්" නිර්මාණය කිරීමට ඔබට එය ඉල්ලා සිටිය හැකිය. මෙම නඩුවේ සීමාව ඔබේ පරිකල්පනයයි.
නිෂ්පාදනය කරන ලද ගීත මානව සංගීතඥයන් විසින් රචනා කරන ලද ගීතවලට සමානයි. MusicLM හි සාම්පල අතිශයින් විශ්මය ජනක ය. සංයුතියේ ක්රියාවලියට සම්බන්ධ මිනිසකු නොමැති වීම විශේෂයෙන්ම සත්යයකි. MusicLM හට සංගීත රිෆ්ස්, තනු සහ හැඟීම් වැනි සූක්ෂ්ම අංග පුනරාවර්තනය කළ හැකිය. ඊට අමතරව, එය සංකීර්ණ සහ පැහැදිලි පිරිවිතර ලබා දී ඇති විට පවා ක්රියා කරයි.
වැදගත් විශේෂාංග
සිතුවම් සිරස්තල කන්ඩිෂන් කිරීම
පින්තාරු කිරීම සිරස්තල සමීකරණය යනු MusicLM කාර්යයකි. ඔබට චිත්රයක පාඨමය විස්තරයක් හෝ "ශීර්ෂ පාඨයක්" මත පදනම්ව සංගීතය නිෂ්පාදනය කළ හැකිය. පින්තූරයක ප්රකාශිත හැඟීම්, මනෝභාවයන් සහ අදහස් ග්රහණය කර ගන්නා සංගීතය නිර්මාණය කිරීමට MusicLM සමත් බව මෙයින් ගම්ය වේ. චිත්රපට සඳහා සංගීතය නිර්මාණය කිරීමට මෙම හැකියාව බෙහෙවින් උපකාරී වේ. වීඩියෝ ක්රීඩා, සහ සියලු වර්ගවල දෘශ්ය මාධ්ය.
ස්ටෝරි විලාසිතාව
කතන්දර මාදිලියේ විශේෂාංගය ආදානය ලෙස කතන්දර පෙළක් ගනී. එබැවින්, එය පසුබිම් සංගීතය නිර්මාණය කරයි. පරිශීලකයින්ට සිද්ධියක්, වීඩියෝ ක්රීඩාවක් හෝ චිත්රපටයක් සඳහා ශබ්ද පථයක් තැනීමට මෙම ශ්රිතය භාවිතා කළ හැක.
කතන්දර මාදිලිය මාධ්ය කලාකරුවන් සඳහා පහසු මෙවලමකි. මේ අනුව, එය පුළුල් පරාසයක සංගීත ශෛලීන් සහ උපකරණ ජනනය කළ හැකිය. MusicLM හි Tale Mode දර්ශනයක චිත්තවේගීය බලපෑම වැඩි කරයි. එබැවින්, නරඹන්නන්ට කතාව තුළ අමතර ගිල්වීමක් තිබිය හැකිය.
සංගීතඥ අත්දැකීම් මට්ටම
ඔබට නිර්මාණය කළ සංගීතයේ දුෂ්කරතා අභිරුචිකරණය කළ හැකිය. පරිශීලකයින්ට ඔවුන්ගේ කුසලතා මට්ටම මත පදනම්ව මට්ටම් තුනක් තෝරා ගත හැකිය. එසේම, ඔවුන් කැමති සංකීර්ණත්වයේ මට්ටම නියම කළ හැකිය: ආරම්භක, අතරමැදි හෝ උසස්.
ඔබට කුඩා සංගීත ප්රවීණතාවයක් තිබේ නම් සහ නව රචනා සමඟ අත්හදා බැලීමට අවශ්ය නම් මෙම විශේෂාංගය ඔබට උපකාරී වේ. කෙසේ වෙතත්, ඔබ පළපුරුදු සංගීතඥයෙක් නම්, ඔබට නවීන හා සියුම් සංගීතය නිර්මාණය කළ හැකිය. මෙම විශේෂාංගය සමඟ MusicLM හි ඉලක්කය වන්නේ සියලුම පරිශීලකයින් සඳහා ප්රවේශ විය හැකි අත්දැකීමක් ලබා දීමයි.
පරම්පරාවේ විවිධත්වය
Generation Diversity ශ්රිතය සමඟින්, ඔබට එකම ආදානයකින් ගීතයක බොහෝ අනුවාද නිපදවිය හැක. තවද, ඔබට විවිධාකාර නිමැවුම් පරාසයක් තිබිය හැක. මෙයින් ඇඟවෙන්නේ AI විසින් ගීතයක බහු අනුවාද ජනනය කළ හැකි බවයි.
ඊට අමතරව, ගීතයේ මූලික විලාසය සහ ව්යුහය තවමත් තබා ගනිමින් විකල්ප තනු හෝ ස්වර ප්රගතිය ඇත. මෙම විශේෂාංගය AI හි සංගීත නිර්මාණය වඩාත් නිර්මාණශීලී වීමට උපකාරී වේ. එබැවින් එය සංගීත නිර්මාණය මානව ගීත රචනයට වඩා සමාන කරයි.
MusicLM හි ඇති විය හැකි සීමාවන්
එය තවමත් සංවර්ධනය වෙමින් පවතින බැවින් Google තවමත් MusicLM සාමාන්ය ජනතාවට ලබා දී නොමැත. එබැවින්, MusicLM හට නිපදවිය හැකි සංගීත වර්ගවල නිශ්චිත සාම්පල ඔබට තවමත් ලබා දිය නොහැක. තවද, MusicLM හට තිබිය හැකි සීමාවන් මොනවාද යන්න තවමත් තරමක් නොදන්නා කරුණකි.
තාක්ෂණය තවමත් එහි මුල් අවධියේ පවතින බැවින්, එයට නිපදවන සංගීතයේ ක්රමාංකනයට හෝ විශේෂිත යෙදවුම් හැසිරවීමේ හැකියාවට යම් සීමාවන් තිබිය හැකිය.
නිෂ්පාදනය කරන ලද සාම්පලවල විකෘති ගුණාත්මක භාවය ප්රධාන අඩුපාඩු වලින් එකකි. මෙය MusicLM සංවර්ධනය සඳහා භාවිතා කරන පුහුණු ක්රියා පටිපාටියේ අත්යවශ්ය අතුරු ඵලයකි.
තවත් අවාසියක් නම්, MusicLM හි ගායන නිෂ්පාදනය කිරීමේ තාක්ෂණික හැකියාව තිබියදීත්. මෙයට ගායක ගීත ඇතුළත් වේ. MusicLM විසින් නිෂ්පාදනය කරන ලද "ගීපද" සමහර විට මෝඩ ලෙස පෙනේ. ඊට අමතරව, ඒවා තේරුම් ගැනීමට අපහසු විය හැකිය. කෙසේ වෙතත්, MusicLM තවමත් සංවර්ධනය වෙමින් පවතින අතර මෙම ගැටළු වැඩිදියුණු කළ හැක.
අවසාන අදහස්
අවසාන වශයෙන්, Google MusicLM යටින් පවතින තාක්ෂණය සිත්ගන්නාසුළු මෙන්ම සිත් ඇදගන්නා සුළු බව අපි විශ්වාස කරමු. ඉහළ මට්ටමේ යථාර්ථවාදයක් සමඟින් AI හට විවිධ මෝස්තරවලින් සංගීතය නිර්මාණය කළ හැකි වීම පුදුම සහගතය. MusicLM සංගීත ව්යාපාරය වෙනස් කිරීමට හැකියාව ඇත. තවද, මෙම තාක්ෂණය පරිණාමය වන ආකාරය නැරඹීමට අපි උනන්දු වෙමු.
ඔබමයි