වසර ගණනාවක් තිස්සේ, ගැඹුරු ඉගෙනීම තාක්ෂණයේ සිරස්තල බවට පත් කරයි. තවද, ඒ මන්දැයි තේරුම් ගැනීම සරල ය.
කෘත්රිම බුද්ධියේ මෙම ශාඛාව සෞඛ්ය සේවයේ සිට බැංකුකරණය දක්වා ප්රවාහනය දක්වා ක්ෂේත්ර පරිවර්තනය කරමින් පෙර සිතාගත නොහැකි දියුණුවක් ඇති කරයි.
ගැඹුරු ඉගෙනීම ගොඩනගා ඇත්තේ අතිවිශාල දත්ත පරිමාවකින් සංකීර්ණ රටා උපුටා ගැනීමට සහ පුරෝකථනය කිරීමට ඉගෙන ගන්නා නවීන ඇල්ගොරිතම සමූහයක් මත ය.
අපි මෙම ලිපියේ හොඳම ගැඹුරු ඉගෙනුම් ඇල්ගොරිතම 15 දෙස බලමු, Convolutional Neural Networks සිට Generative Adversarial Networks සහ Long Short-Term Memory Networks.
මෙම සටහන ඔබ අයෙක්ද යන්න පිළිබඳ අත්යවශ්ය අවබෝධයක් ලබා දෙනු ඇත ආරම්භක හෝ ගැඹුරු ඉගෙනීමේ විශේෂඥයෙක්.
1. ට්රාන්ස්ෆෝමර් ජාල
ට්රාන්ස්ෆෝමර් ජාල පරිවර්තනය වී ඇත පරිගණක දැක්ම සහ ස්වභාවික භාෂා සැකසුම් (NLP) යෙදුම්. ඔවුන් පැමිණෙන දත්ත විශ්ලේෂණය කරන අතර දිගු දුර සම්බන්ධතා ග්රහණය කර ගැනීම සඳහා අවධානය යොමු කිරීමේ ක්රියාවලීන් භාවිතා කරයි. මෙය සාම්ප්රදායික අනුපිළිවෙලට අනුපිළිවෙලට වඩා වේගවත් කරයි.
ට්රාන්ස්ෆෝමර් ජාලයන් මුලින්ම විස්තර කළේ වස්වානි සහ වෙනත් අයගේ "අවධානය ඔබට අවශ්ය සියල්ල" ප්රකාශනයේ ය.
ඒවා කේතකයක් සහ විකේතකයක් (2017) සමන්විත වේ. ට්රාන්ස්ෆෝමර් මාදිලිය ඇතුළුව විවිධ NLP යෙදුම්වල කාර්ය සාධනය පෙන්නුම් කර ඇත මනෝ විශ්ලේෂණයකි, පෙළ වර්ගීකරණය සහ යන්ත්ර පරිවර්තනය.
පරිවර්තක මත පදනම් වූ ආකෘති යෙදුම් සඳහා පරිගණක දැක්මෙහි ද භාවිතා කළ හැක. ඔවුන්ට වස්තු හඳුනාගැනීම සහ රූප සටහන් කිරීම සිදු කළ හැක.
2. දිගු කෙටි කාලීන මතක ජාල (LSTMs)
දිගු කෙටි කාලීන මතක ජාල (LSTMs) යනු එක්තරා ආකාරයකි ස්නායු ජාලය විශේෂයෙන් අනුක්රමික ආදානය හැසිරවීමට ගොඩනගා ඇත. ඔවුන් "දිගු කෙටි කාලීන" ලෙස හඳුන්වනු ලබන්නේ ඔවුන්ට දිගු කලකට පෙර දැනුම සිහිපත් කරන අතරම අනවශ්ය තොරතුරු අමතක කළ හැකි බැවිනි.
LSTMs ජාලය තුළ තොරතුරු ගලායාම පාලනය කරන සමහර "දොරටු" හරහා ක්රියාත්මක වේ. තොරතුරු සැලකිය යුතු ලෙස විනිශ්චය කරනු ලබන්නේද නැද්ද යන්න මත පදනම්ව, මෙම දොරටුවලට එය ඇතුල් කිරීමට හෝ එය වළක්වා ගත හැකිය.
කථන හඳුනාගැනීම, ස්වභාවික භාෂා සැකසීම, සහ කාල ශ්රේණි පුරෝකථනය වැනි කාර්යයන් සඳහා තීරනාත්මක වන අතීත කාල පියවරවල තොරතුරු මතක තබා ගැනීමට හෝ අමතක කිරීමට මෙම තාක්ෂණය LSTM වලට හැකියාව ලබා දෙයි.
ඔබට ඇගයීමට හෝ පුරෝකථනය කළ යුතු අනුක්රමික දත්ත ඇති ඕනෑම අවස්ථාවක LSTMs අතිශයින්ම ප්රයෝජනවත් වේ. කථන වචන පෙළ බවට පරිවර්තනය කිරීම සඳහා හඬ හඳුනාගැනීමේ මෘදුකාංගවල ඒවා බොහෝ විට භාවිතා වේ කොටස් වෙළඳපොල පෙර දත්ත මත පදනම්ව අනාගත මිල ගණන් අනාවැකි කිරීමට විශ්ලේෂණය.
3. ස්වයං සංවිධාන සිතියම් (SOMs)
SOM යනු කෘත්රිම වර්ගයකි ඉගෙන ගත හැකි ස්නායු ජාලය සහ අඩු මාන පරිසරයක් තුළ සංකීර්ණ දත්ත නියෝජනය කරයි. ක්රමය ක්රියාත්මක වන්නේ අධිමාන ආදාන දත්ත ද්විමාන ජාලයක් බවට පරිවර්තනය කිරීමෙනි, එක් එක් ඒකකය හෝ නියුරෝන ආදාන අවකාශයේ වෙනස් කොටසක් නියෝජනය කරයි.
නියුරෝන එකට සම්බන්ධ වී ස්ථල විද්යාත්මක ව්යුහයක් නිර්මාණය කරයි, ඒවාට ආදාන දත්ත ඉගෙන ගැනීමට සහ සකස් කිරීමට ඉඩ සලසයි. එබැවින්, SOM පදනම් වී ඇත්තේ අධීක්ෂණය නොකළ ඉගෙනීම මත ය.
ඇල්ගොරිතම අවශ්ය නොවේ ලේබල් දත්ත ඉගෙන ගැනීමට. ඒ වෙනුවට, එය විචල්යයන් අතර රටා සහ සහසම්බන්ධතා සොයා ගැනීමට ආදාන දත්තවල සංඛ්යානමය ලක්ෂණ භාවිතා කරයි.
පුහුණු අවධියේදී, නියුරෝන ආදාන දත්තවල හොඳම ඇඟවීම වීමට තරඟ කරයි. තවද, ඔවුන් අර්ථවත් ව්යුහයක් බවට ස්වයං-සංවිධානය වේ. SOM වලට රූප සහ කථන හඳුනාගැනීම, දත්ත කැණීම සහ රටා හඳුනාගැනීම ඇතුළුව පුළුල් පරාසයක යෙදුම් තිබේ.
සඳහා ඔවුන් ප්රයෝජනවත් වේ සංකීර්ණ දත්ත දර්ශනය කිරීම, අදාළ දත්ත ලක්ෂ්ය පොකුරු කිරීම සහ අසාමාන්යතා හෝ පිටස්තරයන් හඳුනා ගැනීම.
4. ගැඹුරු ශක්තිමත් කිරීමේ ඉගෙනීම
ගැඹුරු ශක්තිමත් කිරීමේ ඉගෙනීම ප්රතිලාභ පද්ධතියක් මත පදනම්ව තීරණ ගැනීමට නියෝජිතයෙකු පුහුණු කරන යන්ත්ර ඉගෙනීමකි. එය ක්රියා කරන්නේ නියෝජිතයාට එහි වටපිටාව සමඟ අන්තර් ක්රියා කිරීමට සහ අත්හදා බැලීම් සහ දෝෂ හරහා ඉගෙන ගැනීමට ඉඩ දීමෙනි.
නියෝජිතයා එය කරන සෑම ක්රියාවක් සඳහාම ත්යාග ලබන අතර, එහි අරමුණ වන්නේ කාලයත් සමඟ එහි ප්රතිලාභ ප්රශස්ත කරන්නේ කෙසේදැයි ඉගෙන ගැනීමයි. ක්රීඩා කිරීමට, මෝටර් රථ පැදවීමට, සහ රොබෝවරුන් කළමනාකරණය කිරීමට පවා නියෝජිතයින්ට ඉගැන්වීමට මෙය භාවිතා කළ හැක.
Q-ඉගෙනීම යනු සුප්රසිද්ධ ගැඹුරු ශක්තිමත් කිරීමේ ඉගෙනුම් ක්රමයකි. එය ක්රියාත්මක වන්නේ යම් ප්රාන්තයක යම් ක්රියාවක් කිරීමේ වටිනාකම තක්සේරු කිරීම සහ නියෝජිතයා පරිසරය සමඟ අන්තර් ක්රියා කරන විට එම ඇස්තමේන්තුව යාවත්කාලීන කිරීමෙනි.
එවිට නියෝජිතයා මෙම ඇස්තමේන්තු භාවිතා කර විශාලතම ත්යාගය ලැබීමට බොහෝ දුරට ඉඩ ඇති ක්රියාව තීරණය කරයි. Q-Learning මගින් Atari ක්රීඩා කිරීමට නියෝජිතයින් දැනුවත් කිරීමට මෙන්ම දත්ත මධ්යස්ථානවල බලශක්ති භාවිතය වැඩි දියුණු කිරීමට භාවිතා කර ඇත.
Deep Q-Networks යනු තවත් ප්රසිද්ධ Deep Reinforcement Learning ක්රමයක් (DQN) වේ. DQNs Q-Learning වලට සමාන වේ, ඔවුන් වගුවකට වඩා ගැඹුරු ස්නායුක ජාලයක් භාවිතයෙන් ක්රියාකාරී අගයන් තක්සේරු කරයි.
මෙය ඔවුන්ට විකල්ප ක්රියා රාශියක් සමඟ දැවැන්ත, සංකීර්ණ සැකසුම් සමඟ කටයුතු කිරීමට හැකියාව ලබා දෙයි. Go සහ Dota 2 වැනි ක්රීඩා කිරීමට නියෝජිතයින් පුහුණු කිරීමට මෙන්ම ඇවිදීමට ඉගෙන ගත හැකි රොබෝවරුන් නිර්මාණය කිරීමට DQN භාවිතා කර ඇත.
5. පුනරාවර්තන ස්නායුක ජාල (RNNs)
RNNs යනු අභ්යන්තර තත්වයක් තබා ගනිමින් අනුක්රමික දත්ත සැකසීමට හැකි ස්නායු ජාලයකි. එය පොතක් කියවන පුද්ගලයෙකුට සමාන යැයි සලකන්න, එහිදී සෑම වචනයක්ම එයට පෙර පැමිණි ඒවාට සාපේක්ෂව ජීර්ණය වේ.
එබැවින් RNNs කථන හඳුනාගැනීම, භාෂා පරිවර්තනය, සහ වාක්ය ඛණ්ඩයක ඊළඟ වචනය පුරෝකථනය කිරීම වැනි කාර්යයන් සඳහා වඩාත් සුදුසු වේ.
RNNs ක්රියා කරන්නේ එක් එක් කාල පියවරේ ප්රතිදානය ඊළඟ වාර පියවරේ ආදානයට සම්බන්ධ කිරීමට ප්රතිපෝෂණ ලූප භාවිතා කිරීමෙනි. මෙමගින් ජාලයට අනාගත කාල පියවරයන් සඳහා එහි පුරෝකථන දැනුම් දීමට පූර්ව කාල පියවර තොරතුරු භාවිතා කිරීමට හැකියාව ලැබේ. අවාසනාවකට මෙන්, මෙයින් අදහස් වන්නේ RNNs අතුරුදහන් වන අනුක්රමික ගැටලුවට ගොදුරු විය හැකි බවත්, පුහුණුව සඳහා භාවිතා කරන ශ්රේණි ඉතා කුඩා වන අතර ජාලය දිගු කාලීන සබඳතා ඉගෙන ගැනීමට අරගල කරන බවත්ය.
මෙම පැහැදිලි බාධාව තිබියදීත්, RNNs පුළුල් පරාසයක යෙදුම්වල භාවිතය සොයාගෙන ඇත. මෙම යෙදුම්වලට ස්වභාවික භාෂා සැකසීම, කථන හඳුනාගැනීම සහ සංගීත නිෂ්පාදනය පවා ඇතුළත් වේ.
ගූගල් පරිවර්තකය, උදාහරණයක් ලෙස, භාෂා හරහා පරිවර්තනය කිරීමට RNN-පාදක පද්ධතියක් භාවිතා කරන අතර, Siri, අතථ්ය සහකාර, හඬ හඳුනා ගැනීමට RNN-පාදක පද්ධතියක් භාවිතා කරයි. කොටස් මිල පුරෝකථනය කිරීමට සහ යථාර්ථවාදී පෙළ සහ චිත්රක නිර්මාණය කිරීමට RNN භාවිතා කර ඇත.
6. කැප්සියුල ජාල
Capsule Networks යනු දත්තවල රටා සහ සහසම්බන්ධතා වඩාත් ඵලදායි ලෙස හඳුනාගත හැකි නව ආකාරයේ ස්නායුක ජාල නිර්මාණයකි. ඔවුන් නියුරෝන "කැප්සියුල" බවට සංවිධානය කරයි, එය ආදානයක ඇතැම් අංග සංකේත කරයි.
මේ ආකාරයෙන් ඔවුන්ට වඩාත් නිවැරදි අනාවැකි කිව හැකිය. කැප්සියුල ජාලයන් කැප්සියුල ස්ථර ගණනාවක් භාවිතා කරමින් ආදාන දත්ත වලින් ක්රමානුකූලව සංකීර්ණ ගුණාංග ලබා ගනී.
කැප්සියුල ජාලයේ තාක්ෂණය ඔවුන්ට ලබා දී ඇති ආදානයේ ධූරාවලි නිරූපණය ඉගෙන ගැනීමට හැකියාව ලබා දෙයි. කැප්සියුල අතර සන්නිවේදනය කිරීමෙන් පින්තූරයක් තුළ ඇති අයිතම අතර අවකාශීය සම්බන්ධතා නිසි ලෙස කේතනය කළ හැකිය.
වස්තු හඳුනාගැනීම, පින්තූර ඛණ්ඩනය සහ ස්වභාවික භාෂා සැකසීම කැප්සියුල ජාල වල යෙදුම් වේ.
Capsule Networks හි සේවයේ යෙදවීමට හැකියාව ඇත ස්වයංක්රීය රිය පැදවීම තාක්ෂණයන්. ඔවුන් මෝටර් රථ, මිනිසුන් සහ මාර්ග සංඥා වැනි අයිතම හඳුනා ගැනීමට සහ වෙන්කර හඳුනා ගැනීමට පද්ධතියට සහාය වේ. මෙම පද්ධතීන්ට තම පරිසරයේ ඇති වස්තූන්ගේ හැසිරීම් පිළිබඳව වඩාත් නිවැරදි පුරෝකථනයන් කිරීමෙන් ගැටුම් වළක්වා ගත හැකිය.
7. විචල්ය ස්වයංක්රීය සංකේත (VAEs)
VAEs යනු අධීක්ෂණය නොකළ ඉගෙනීම සඳහා භාවිතා කරන ගැඹුරු ඉගෙනුම් මෙවලමකි. දත්ත අඩු-මාන අවකාශයකට කේතනය කිරීමෙන් සහ එය නැවත මුල් ආකෘතියට විකේතනය කිරීමෙන්, ඔවුන් දත්තවල රටා හඳුනා ගැනීමට ඉගෙන ගත හැකිය.
ඔවුන් හාවෙකු තොප්පියක් බවට පත් කළ හැකි ඉන්ද්රජාලිකයෙකු හා පසුව හාවෙකු බවට පත් කළ හැකිය! VAEs යථාර්ථවාදී දෘශ්ය හෝ සංගීතය ජනනය කිරීම සඳහා ප්රයෝජනවත් වේ. තවද, මුල් දත්ත සමඟ සැසඳිය හැකි නව දත්ත නිෂ්පාදනය කිරීමට ඒවා භාවිතා කළ හැකිය.
VAEs රහස් කේත කඩ කරන්නාට සමාන වේ. ඔවුන්ට යටින් ඇති දේ සොයාගත හැකිය දත්ත ව්යුහය ප්රහේලිකාවක් බිඳ දමන ආකාරය මෙන් එය සරල බිටු වලට කැඩීමෙන්. ඔවුන් කොටස් නිරාකරණය කළ පසු මුල් පිටපත මෙන් පෙනෙන නව දත්ත ගොඩනැගීමට එම තොරතුරු භාවිතා කළ හැක.
මෙය අතිවිශාල ලිපිගොනු සම්පීඩනය කිරීමට හෝ නිශ්චිත ශෛලියකින් නැවුම් ග්රැෆික්ස් හෝ සංගීතය නිෂ්පාදනය කිරීමට පහසු විය හැක. VAEs හට ප්රවෘත්ති කථා හෝ සංගීත ගී පද වැනි නැවුම් අන්තර්ගතයන් ද නිපදවිය හැක.
8. උත්පාදක විරුද්ධවාදී ජාල (GANs)
GANs (Generative Adversarial Networks) යනු මුල් පිටපතට සමාන නව දත්ත උත්පාදනය කරන ගැඹුරු ඉගෙනුම් පද්ධතියක ආකාරයකි. ඒවා ක්රියාත්මක වන්නේ ජාල දෙකක් පුහුණු කිරීමෙනි: උත්පාදක යන්ත්රයක් සහ වෙනස් කොට සැලකීමේ ජාලයක්.
උත්පාදක යන්ත්රය මුල් පිටපත හා සැසඳිය හැකි නව දත්ත නිෂ්පාදනය කරයි.
තවද, වෙනස්කම් කරන්නා මුල් සහ සාදන ලද දත්ත අතර වෙනස හඳුනා ගැනීමට උත්සාහ කරයි. උත්පාදක යන්ත්රය වෙනස්කම් කරන්නා රැවටීමට උත්සාහ කරන අතර වෙනස්කම් කරන්නා මුල් දත්ත නිසි ලෙස හඳුනා ගැනීමට උත්සාහ කරමින් ජාල දෙක ඒකාබද්ධව පුහුණු කර ඇත.
GAN යනු ව්යාජකරුවෙකු සහ රහස් පරීක්ෂකයෙකු අතර හරස්කඩක් ලෙස සලකන්න. ජෙනරේටරය ව්යාජ ලෙස ක්රියා කරයි, මුල් පිටපතට සමාන නව කලා කෘති නිෂ්පාදනය කරයි.
වෙනස්කම් කරන්නා රහස් පරීක්ෂකයෙකු ලෙස ක්රියා කරයි, අව්යාජ කලා කෘති සහ ව්යාජ නිර්මාණ අතර වෙනස හඳුනා ගැනීමට උත්සාහ කරයි. ජාල දෙක ඒකාබද්ධව පුහුණු කර ඇති අතර, උත්පාදක යන්ත්රය විශ්වාස කළ හැකි ව්යාජ ඒවා සෑදීමේදී වැඩිදියුණු වන අතර වෙනස්කම් කරන්නා ඒවා හඳුනාගැනීමේදී වැඩිදියුණු වේ.
GAN වලට මිනිසුන්ගේ හෝ සතුන්ගේ යථාර්ථවාදී පින්තූර නිෂ්පාදනය කිරීමේ සිට නව සංගීතය හෝ ලිවීම් නිර්මාණය කිරීම දක්වා ප්රයෝජන කිහිපයක් ඇත. යන්ත්ර ඉගෙනීමේ ආකෘති පුහුණු කිරීම සඳහා විශාල දත්ත කට්ටලයක් තැනීම සඳහා නිපදවන ලද දත්ත සැබෑ දත්ත සමඟ ඒකාබද්ධ කිරීම ඇතුළත් දත්ත වැඩි කිරීම සඳහා ද ඒවා භාවිතා කළ හැකිය.
9. ගැඹුරු Q-ජාල (DQNs)
ගැඹුරු Q-ජාල (DQNs) යනු තීරණ ගැනීමේ ශක්තිමත් කිරීමේ ඉගෙනුම් ඇල්ගොරිතමයකි. ඒවා ක්රියාත්මක වන්නේ යම්කිසි තත්වයක් තුළ යම් ක්රියාවක් කිරීම සඳහා අපේක්ෂිත ප්රතිලාභය පුරෝකථනය කරන Q-Function ඉගෙනීමෙනි.
Q-කාර්යය අත්හදා බැලීම් සහ දෝෂය මගින් උගන්වනු ලැබේ, ඇල්ගොරිතම විවිධ ක්රියාවන් කිරීමට උත්සාහ කිරීම සහ ප්රතිඵල වලින් ඉගෙන ගැනීම.
එය a ලෙස සලකන්න වීඩියෝ ක්රීඩා චරිතය විවිධ ක්රියාවන් සමඟ අත්හදා බැලීම සහ සාර්ථකත්වයට මඟ පෙන්වන ඒවා සොයා ගැනීම! DQNs ගැඹුරු ස්නායු ජාලයක් භාවිතයෙන් Q-ක්රියාකාරීත්වය පුහුණු කරයි, ඒවා දුෂ්කර තීරණ ගැනීමේ කාර්යයන් සඳහා ඵලදායී මෙවලම් බවට පත් කරයි.
ඔවුන් ගෝ සහ චෙස් වැනි ක්රීඩාවලින් මෙන්ම රොබෝ තාක්ෂණයෙන් සහ ස්වයංක්රීයව ධාවනය වන මෝටර් රථවලින් මානව ශූරයන් පවා පරාජය කර ඇත. එබැවින්, සමස්තයක් වශයෙන්, DQNs කාලයත් සමඟ ඔවුන්ගේ තීරණ ගැනීමේ කුසලතා වැඩි දියුණු කිරීමට අත්දැකීම් වලින් ඉගෙන ගනිමින් ක්රියා කරයි.
10. රේඩියල් පාදක ක්රියාකාරී ජාල (RBFNs)
රේඩියල් බේසිස් Function Networks (RBFNs) යනු ශ්රිතයන් ආසන්න කිරීමට සහ වර්ගීකරණ කාර්යයන් සිදු කිරීමට භාවිතා කරන ස්නායුක ජාලයකි. ඒවා ක්රියාත්මක වන්නේ රේඩියල් පදනම් ශ්රිත එකතුවක් භාවිතයෙන් ආදාන දත්ත ඉහළ මාන අවකාශයක් බවට පරිවර්තනය කිරීමෙනි.
ජාලයේ ප්රතිදානය පදනම් ශ්රිතවල රේඛීය සංයෝගයක් වන අතර සෑම රේඩියල් පාදක ශ්රිතයක්ම ආදාන අවකාශයේ මධ්ය ලක්ෂ්යයක් නියෝජනය කරයි.
සංකීර්ණ ආදාන-ප්රතිදාන අන්තර්ක්රියා සහිත අවස්ථාවන් සඳහා RBFNs විශේෂයෙන් ඵලදායී වන අතර, අධීක්ෂණය සහ අධීක්ෂණය නොකළ ඉගෙනීම ඇතුළුව, පුළුල් පරාසයක ශිල්පීය ක්රම භාවිතයෙන් ඒවා ඉගැන්විය හැක. ඒවා මූල්ය අනාවැකිවල සිට පින්තූර සහ කථන හඳුනාගැනීමේ සිට වෛද්ය රෝග විනිශ්චය දක්වා ඕනෑම දෙයක් සඳහා භාවිතා කර ඇත.
RBFNs GPS පද්ධතියක් ලෙස සලකන්න, එය අභියෝගාත්මක භූමි ප්රදේශ හරහා ගමන් කිරීමට නැංගුරම් ලක්ෂ්ය මාලාවක් භාවිතා කරයි. ජාලයේ ප්රතිදානය යනු රේඩියල් පදනමේ ශ්රිත සඳහා පෙනී සිටින නැංගුරම් ලක්ෂ්යවල එකතුවකි.
අපට සංකීර්ණ තොරතුරු හරහා බ්රවුස් කළ හැකි අතර RBFN භාවිතා කිරීමෙන් යම් අවස්ථාවක් සිදු වන්නේ කෙසේද යන්න පිළිබඳ නිවැරදි අනාවැකි ජනනය කළ හැක.
11. බහු ස්ථර සංවේදනයන් (MLPs)
බහු ස්ථර පර්සෙප්ට්රෝනය (MLP) ලෙස හැඳින්වෙන ස්නායුක ජාලයේ සාමාන්ය ආකාරයක් වර්ගීකරණය සහ ප්රතිගමනය වැනි අධීක්ෂණ ඉගෙනුම් කාර්යයන් සඳහා භාවිතා වේ. ඒවා ක්රියා කරන්නේ සම්බන්ධිත නෝඩ් හෝ නියුරෝන ස්ථර කිහිපයක් ගොඩගැසීමෙන්, සෑම ස්ථරයක්ම ලැබෙන දත්ත රේඛීය නොවන ලෙස වෙනස් කිරීමෙනි.
MLP එකකදී, සෑම නියුරෝනයක්ම පහත ස්ථරයේ ඇති නියුරෝන වලින් ආදානය ලබා ගන්නා අතර ඉහල ස්ථරයේ ඇති නියුරෝන වෙත සංඥාවක් යවයි. සෑම නියුරෝනයකම ප්රතිදානය තීරණය කරනු ලබන්නේ සක්රීය කිරීමේ ශ්රිතයක් භාවිතයෙන් වන අතර එමඟින් ජාලයට රේඛීය නොවන බව ලබා දේ.
ඒවාට සැඟවුණු ස්ථර කිහිපයක් තිබිය හැකි බැවින් ආදාන දත්තවල සංකීර්ණ නිරූපණයන් ඉගෙන ගැනීමට ඔවුන්ට හැකියාව ඇත.
MLPs හැඟීම් විශ්ලේෂණය, වංචා හඳුනාගැනීම සහ හඬ සහ පින්තූර හඳුනාගැනීම වැනි විවිධ කාර්යයන් සඳහා යොදවා ඇත. MLPs දුෂ්කර නඩුවක් බිඳ දැමීම සඳහා එකට වැඩ කරන පරීක්ෂක කණ්ඩායමක් සමඟ සැසඳිය හැකිය.
එක් එක් විශේෂිත අංශයක් තිබියදීත්, ඔවුන්ට එකට කරුණු එකතු කර අපරාධය විසඳිය හැකිය.
12. Convolutional Neural Networks (CNNs)
රූප සහ වීඩියෝ සකසනු ලබන්නේ ස්නායු ජාලයක ආකාරයක් වන convolutional neural networks (CNNs) භාවිතයෙන්. ආදාන දත්ත වලින් සැලකිය යුතු ලක්ෂණ උකහා ගැනීම සඳහා ඉගෙන ගත හැකි පෙරහන් හෝ කර්නල් කට්ටලයක් භාවිතා කිරීමෙන් ඒවා ක්රියා කරයි.
පෙරහන් ආදාන පින්තූරය මත ලිස්සා යයි, රූපයේ අත්යවශ්ය අංග ග්රහණය කරන විශේෂාංග සිතියමක් තැනීම සඳහා කැළඹීම් ක්රියාත්මක කරයි.
CNN වලට පින්තූර ලක්ෂණ වල ධූරාවලි නිරූපණය ඉගෙන ගැනීමට හැකි වන බැවින්, අතිවිශාල දෘෂ්ය දත්ත පරිමාවන් සම්බන්ධ අවස්ථා සඳහා ඒවා විශේෂයෙන් උපකාරී වේ. වස්තු හඳුනාගැනීම, පින්තූර වර්ගීකරණය සහ මුහුණු හඳුනාගැනීම වැනි යෙදුම් කිහිපයක් ඒවා භාවිතා කර ඇත.
විශිෂ්ට කෘතියක් නිර්මාණය කිරීම සඳහා බුරුසු කිහිපයක් භාවිතා කරන පින්තාරුකරුවෙකු ලෙස CNN සලකන්න. සෑම බුරුසුවක්ම කර්නලයක් වන අතර, කලාකරුවා බොහෝ කර්නල් මිශ්ර කිරීමෙන් සංකීර්ණ, යථාර්ථවාදී රූපයක් ගොඩනගා ගත හැකිය. අපට ඡායාරූප වලින් සැලකිය යුතු ලක්ෂණ උකහා ගත හැකි අතර CNN භාවිතා කිරීමෙන් රූපයේ අන්තර්ගතය නිවැරදිව පුරෝකථනය කිරීමට ඒවා භාවිතා කළ හැකිය.
13. ගැඹුරු විශ්වාස ජාල (DBNs)
DBN යනු මානයන් අඩු කිරීම සහ විශේෂාංග ඉගෙනීම වැනි අධීක්ෂණය නොකළ ඉගෙනුම් කාර්යයන් සඳහා භාවිතා කරන ස්නායු ජාලයක ආකාරයකි. ආදාන දත්ත ප්රතිසංවිධානය කිරීමට ඉගෙන ගත හැකි ද්වි-ස්ථර ස්නායුක ජාල වන සීමා සහිත බෝල්ට්ස්මන් යන්ත්ර (RBMs) ස්ථර කිහිපයක් ගොඩගැසීමෙන් ඒවා ක්රියා කරයි.
DBNs අධි-මාන දත්ත ගැටළු සඳහා ඉතා ප්රයෝජනවත් වන්නේ ඒවාට ආදානයේ සංයුක්ත හා කාර්යක්ෂම නියෝජනයක් ඉගෙන ගත හැකි බැවිනි. ඒවා කටහඬ හඳුනාගැනීමේ සිට පින්තූර වර්ගීකරණය දක්වා මත්ද්රව්ය සොයාගැනීම දක්වා ඕනෑම දෙයක් සඳහා භාවිත කර ඇත.
උදාහරණයක් ලෙස, පර්යේෂකයන් විසින් estrogen ප්රතිග්රාහක සඳහා ඖෂධ අපේක්ෂකයින්ගේ බන්ධන සම්බන්ධතාවය තක්සේරු කිරීමට DBN භාවිතා කරන ලදී. DBN රසායනික ලක්ෂණ සහ බන්ධන සම්බන්ධතා එකතුවක් මත පුහුණු කරන ලද අතර, එය නව ඖෂධ අපේක්ෂකයින්ගේ බන්ධන සම්බන්ධතාවය නිවැරදිව පුරෝකථනය කිරීමට සමත් විය.
මෙය මත්ද්රව්ය සංවර්ධනය සහ අනෙකුත් අධිමාන දත්ත යෙදුම්වල DBN භාවිතය ඉස්මතු කරයි.
14. ස්වයංක්රීය කේතක
ස්වයංක්රීය කේතක යනු අධීක්ෂණය නොකළ ඉගෙනුම් කාර්යයන් සඳහා භාවිත කරන ස්නායුක ජාල වේ. ඒවා ආදාන දත්ත ප්රතිනිර්මාණය කිරීමට අදහස් කරන අතර, එයින් ගම්ය වන්නේ ඔවුන් තොරතුරු සංයුක්ත නිරූපණයකට කේතනය කිරීමට ඉගෙන ගෙන එය නැවත මුල් ආදානයට විකේතනය කරන බවයි.
දත්ත සම්පීඩනය, ශබ්දය ඉවත් කිරීම සහ විෂමතා හඳුනාගැනීම සඳහා ස්වයංක්රීය කේතක ඉතා ඵලදායී වේ. ඒවා විශේෂාංග ඉගෙනීම සඳහා ද භාවිතා කළ හැක, එහිදී ස්වයංක්රීය කේතකයේ සංයුක්ත නිරූපණය අධීක්ෂණ ඉගෙනුම් කාර්යයකට පෝෂණය වේ.
ස්වයංක්රීය සංකේතකයන් පන්තියේ සටහන් ගන්නා සිසුන් ලෙස සලකන්න. ශිෂ්යයා දේශනයට සවන් දෙන අතර වඩාත් අදාළ කරුණු සංක්ෂිප්තව හා කාර්යක්ෂමව සටහන් කරයි.
පසුව, ශිෂ්යයාට තම සටහන් භාවිතයෙන් පාඩම පාඩම් කර මතක තබා ගත හැකිය. අනෙක් අතට, ස්වයංක්රීය කේතකයක්, ආදාන දත්ත සංයුක්ත නිරූපණයකට කේතනය කරයි, එය පසුව විෂමතා හඳුනා ගැනීම හෝ දත්ත සම්පීඩනය වැනි විවිධ අරමුණු සඳහා භාවිතා කළ හැකිය.
15. සීමා කරන ලද Boltzmann යන්ත්ර (RBMs)
RBMs (සීමා සහිත Boltzmann යන්ත්ර) යනු අධීක්ෂණය නොකළ ඉගෙනුම් කාර්යයන් සඳහා භාවිතා කරන උත්පාදක ස්නායුක ජාලයකි. ඒවා සෑදී ඇත්තේ දෘශ්ය ස්ථරයකින් සහ සැඟවුණු ස්ථරයකින් වන අතර, එක් එක් ස්ථරයේ නියුරෝන සමඟ සම්බන්ධ වී ඇති නමුත් එකම ස්ථරය තුළ නොවේ.
පුහුණු දත්තවල සම්භාවිතාව ප්රශස්ත කිරීම සඳහා දෘශ්ය සහ සැඟවුණු ස්ථර අතර බර වෙනස් කිරීම ඇතුළත් වන ප්රතිවිරෝධතා අපසරනය ලෙස හැඳින්වෙන තාක්ෂණයක් භාවිතයෙන් RBM පුහුණු කරනු ලැබේ. RBMs විසින් උගත් බෙදාහැරීම් වලින් නියැදීමෙන් පුහුණු කිරීමෙන් පසු නැවුම් දත්ත නිර්මාණය කළ හැක.
රූප සහ කථන හඳුනාගැනීම, සහයෝගිතා පෙරීම සහ විෂමතා හඳුනාගැනීම RBM භාවිතා කර ඇති සියලුම යෙදුම් වේ. පරිශීලක හැසිරීම් වලින් රටා ඉගෙන ගැනීමෙන් ගැලපෙන නිර්දේශ නිර්මාණය කිරීම සඳහා නිර්දේශ පද්ධතිවල ද ඒවා භාවිතා කර ඇත.
ඉහළ මාන දත්තවල සංයුක්ත සහ කාර්යක්ෂම නිරූපණයක් නිර්මාණය කිරීම සඳහා විශේෂාංග ඉගෙනීමේදී RBMs ද භාවිතා කර ඇත.
ක්ෂිතිජයේ එතුම සහ පොරොන්දු වූ වර්ධනයන්
Convolutional Neural Networks (CNNs) සහ Recurrent Neural Networks (RNNs) වැනි ගැඹුරු ඉගෙනුම් ක්රම වඩාත් දියුණු කෘතිම බුද්ධි ප්රවේශයන් අතර වේ. CNNs පින්තූර සහ ශ්රව්ය හඳුනාගැනීම් පරිවර්තනය කර ඇති අතර RNN ස්වභාවික භාෂා සැකසීමේ සහ අනුක්රමික දත්ත විශ්ලේෂණයේ සැලකිය යුතු දියුණුවක් ලබා ඇත.
මෙම ප්රවේශයන් පරිණාමයේ මීළඟ පියවර වනුයේ ඒවායේ කාර්යක්ෂමතාව සහ පරිමාණය වැඩිදියුණු කිරීම කෙරෙහි අවධානය යොමු කිරීම, විශාල හා වඩාත් සංකීර්ණ දත්ත කට්ටල විශ්ලේෂණය කිරීමට ඉඩ සලසා දීම මෙන්ම ඒවායේ අර්ථකථනය සහ අඩු ලේබල් දත්ත වලින් ඉගෙන ගැනීමේ හැකියාව වැඩි දියුණු කිරීම කෙරෙහි අවධානය යොමු කිරීමට ඉඩ ඇත.
ගැඹුරු ඉගෙනීම දියුණු වන විට සෞඛ්ය සේවා, මූල්ය සහ ස්වයං පාලන පද්ධති වැනි ක්ෂේත්රවල ඉදිරි ගමනට ඉඩ සැලසීමේ හැකියාව ඇත.
ඔබමයි