ඉහළම 10 ගැඹුරු ඉගෙනුම් ආකෘති (2024)

පටුන[සඟවන්න][පෙන්වන්න]

1. Convolutional Neural Networks (CNNs)
2. දිගු කෙටි කාලීන මතක (LSTM) ජාල
3. උත්පාදක විරුද්ධවාදී ජාල (GANs)+-

අනාගතය මෙහි ඇත. තවද, මෙම අනාගතයේදී යන්ත්‍ර මිනිසුන් කරන ආකාරයටම ඔවුන් අවට ලෝකය වටහා ගනී. පරිගණකයට මෝටර් රථ ධාවනය කිරීමට, රෝග විනිශ්චය කිරීමට සහ අනාගතය නිවැරදිව පුරෝකථනය කිරීමට හැකිය.

මෙය විද්‍යා ප්‍රබන්ධයක් සේ පෙනෙන නමුත් ගැඹුරු ඉගෙනුම් ආකෘති එය යථාර්ථයක් බවට පත් කරයි.

මෙම සංකීර්ණ ඇල්ගොරිතම වල රහස් හෙළි කරයි කෘතිම බුද්ධිය, පරිගණක වලට ස්වයං-ඉගෙනීමට සහ සංවර්ධනය කිරීමට ඉඩ සලසයි. මෙම ලිපියෙන්, අපි ගැඹුරු ඉගෙනුම් ආකෘති ක්ෂේත්‍රය වෙත පිවිසෙන්නෙමු.

තවද, අපගේ ජීවිත විප්ලවීය කිරීමට ඔවුන්ට ඇති දැවැන්ත විභවයන් අපි විමර්ශනය කරන්නෙමු. මානව වර්ගයාගේ අනාගතය වෙනස් කරන අති නවීන තාක්ෂණය ගැන ඉගෙන ගැනීමට සූදානම් වන්න.

ගැඹුරු ඉගෙනීම 1

හරියටම ගැඹුරු ඉගෙනුම් ආකෘති යනු කුමක්ද?

ඔබ කවදා හෝ රූප දෙකක් අතර ඇති වෙනස්කම් හඳුනා ගත යුතු ක්‍රීඩාවක් ක්‍රීඩා කර තිබේද?

කෙසේ වෙතත් එය විනෝදජනකයි, එය දැඩි විය හැකිය, හරිද? පරිගණකයකට එම ක්‍රීඩාව කිරීමට ඉගැන්වීමට සහ සෑම අවස්ථාවකම ජයග්‍රහණය කිරීමට හැකි වීම ගැන සිතන්න. ගැඹුරු ඉගෙනුම් ආකෘති එය ඉටු කරයි!

ගැඹුරු ඉගෙනුම් ආකෘති රූප විශාල සංඛ්‍යාවක් පරීක්‍ෂා කර ඒවායේ පොදු දේ තීරණය කළ හැකි සුපිරි-ස්මාර්ට් යන්ත්‍රවලට සමාන වේ. ඔවුන් මෙය සාක්ෂාත් කරගනු ලබන්නේ පින්තූර විසුරුවා හැරීම සහ එක් එක් තනි තනිව අධ්යයනය කිරීමෙනි.

ඉන්පසු ඔවුන් තමන් ඉගෙන ගත් දේ යොදා ගනිමින් රටා හඳුනා ගැනීමට සහ ඔවුන් මින් පෙර කිසිදා නොදුටු නැවුම් රූප පිළිබඳ අනාවැකි පළ කරති.

ගැඹුරු ඉගෙනීමේ කාර්ය ප්‍රවාහය

ගැඹුරු ඉගෙනුම් ආකෘති යනු දැවැන්ත දත්ත කට්ටල වලින් සංකීර්ණ රටා සහ ලක්ෂණ ඉගෙන ගැනීමට සහ උකහා ගත හැකි කෘතිම ස්නායු ජාල වේ. මෙම ආකෘති සෑදී ඇත්තේ සම්බන්ධිත නෝඩ් හෝ නියුරෝන ස්ථර කිහිපයකින් වන අතර ඒවා ප්‍රතිදානයක් ජනනය කිරීම සඳහා ලැබෙන දත්ත විශ්ලේෂණය කර වෙනස් කරයි.

ගැඹුරු ඉගෙනුම් ආකෘති රූප හඳුනාගැනීම, කථන හඳුනාගැනීම, ස්වභාවික භාෂා සැකසීම සහ රොබෝ තාක්ෂණය වැනි විශාල නිරවද්‍යතාවයක් සහ නිරවද්‍යතාවයක් අවශ්‍ය රැකියා සඳහා විශේෂයෙන් හොඳින් ගැලපේ.

ඒවා ස්වයං-රිය පැදවීමේ මෝටර් රථවල සිට වෛද්‍ය රෝග විනිශ්චය, නිර්දේශ පද්ධති, සහ පුරෝකථන විශ්ලේෂණ.

ගැඹුරු ඉගෙනුම් ආකෘතියක් තුළ දත්ත ප්‍රවාහය නිදර්ශනය කිරීම සඳහා දෘශ්‍යකරණයේ සරල කළ අනුවාදයක් මෙන්න.

ආදාන දත්ත ආකෘතියේ ආදාන ස්තරය වෙත ගලා යයි, එය ප්‍රතිදාන අනාවැකියක් සැපයීමට පෙර සැඟවුණු ස්ථර ගණනාවක් හරහා දත්ත යවයි.

සෑම සැඟවුණු ස්ථරයක්ම අවසාන පුරෝකථනය සපයන ආදාන දත්ත ඊළඟ ස්ථරයට යැවීමට පෙර ගණිතමය මෙහෙයුම් මාලාවක් සිදු කරයි.

දැන් අපි බලමු ගැඹුරු ඉගෙනුම් ආකෘති මොනවාද සහ ඒවා අපගේ ජීවිතයට භාවිතා කරන්නේ කෙසේද කියා.

1. Convolutional Neural Networks (CNNs)

CNNs යනු පරිගණක දර්ශනයේ ක්ෂේත්‍රය පරිවර්තනය කර ඇති ගැඹුරු ඉගෙනුම් ආකෘතියකි. සීඑන්එන් රූප වර්ග කිරීමට, වස්තු හඳුනා ගැනීමට සහ රූප කොටස් කිරීමට භාවිතා කරයි. මානව දෘෂ්‍ය බාහිකයේ ව්‍යුහය සහ ක්‍රියාකාරිත්වය CNN හි සැලසුමට දැනුම් දුන්නේය.

ඔවුන් ක්‍රියා කරන්නේ කෙසේද?

CNN එකක් සෑදී ඇත්තේ සංකෝචන ස්ථර, සංචිත ස්ථර සහ සම්පුර්ණයෙන්ම සම්බන්ධිත ස්ථර ගණනාවකිනි. ආදානය යනු රූපයක් වන අතර ප්‍රතිදානය යනු රූපයේ පන්ති ලේබලයේ පුරෝකථනයකි.

CNN හි convolutional ස්ථර ආදාන පින්තූරය සහ පෙරහන් කට්ටලයක් අතර තිත් නිෂ්පාදනයක් සිදු කිරීමෙන් විශේෂාංග සිතියමක් ගොඩනඟයි. සංචිත ස්ථර මගින් විශේෂාංග සිතියමේ ප්‍රමාණය අඩු කිරීමෙන් එය අඩු කරයි.

අවසාන වශයෙන්, රූපයේ පන්ති ලේබලය පුරෝකථනය කිරීම සඳහා අංග සිතියම සම්පූර්ණයෙන්ම සම්බන්ධිත ස්ථර මගින් භාවිතා කරයි.

සීඑන්එන්

CNN වැදගත් වන්නේ ඇයි?

CNN අත්‍යවශ්‍ය වන්නේ මිනිසුන්ට දැකීමට අපහසු වන රූපවල රටා සහ ලක්ෂණ හඳුනා ගැනීමට ඔවුන්ට ඉගෙන ගත හැකි බැවිනි. විශාල දත්ත කට්ටල භාවිතයෙන් දාර, කොන් සහ වයනය වැනි ලක්ෂණ හඳුනා ගැනීමට CNN වලට ඉගැන්විය හැක. මෙම ගුණාංග ඉගෙනීමෙන් පසු, CNN වෙත නැවුම් ඡායාරූපවල ඇති වස්තූන් හඳුනා ගැනීමට ඒවා භාවිතා කළ හැකිය. CNNs විවිධ රූප හඳුනාගැනීමේ යෙදුම්වල අති නවීන කාර්ය සාධනය පෙන්නුම් කර ඇත.

අපි CNN භාවිතා කරන්නේ කොහේද?

සෞඛ්‍ය ආරක්ෂණය, මෝටර් රථ කර්මාන්තය සහ සිල්ලර වෙළඳාම යනු CNN භාවිතා කරන අංශ කිහිපයක් පමණි. සෞඛ්‍ය සේවා කර්මාන්තයේ දී, රෝග විනිශ්චය, ඖෂධ සංවර්ධනය සහ වෛද්‍ය රූප විශ්ලේෂණය සඳහා ඒවා ප්‍රයෝජනවත් විය හැකිය.

මෝටර් රථ අංශයේ, ඔවුන් මංතීරු හඳුනා ගැනීමට උපකාරී වේ, වස්තුව හඳුනාගැනීම, සහ ස්වයංක්‍රීය රිය පැදවීම. ඒවා දෘෂ්‍ය සෙවුම, රූප මත පදනම් වූ නිෂ්පාදන නිර්දේශ කිරීම සහ ඉන්වෙන්ටරි පාලනය සඳහා සිල්ලර වෙළඳාමේ ද බහුලව භාවිතා වේ.

උදාහරණ වශයෙන්; ඇතුළුව විවිධ යෙදුම්වල Google CNN භාවිතා කරයි ගූගල් ලෙන්ස්, හොඳින් කැමති රූප හඳුනාගැනීමේ මෙවලමක්. මෙම වැඩසටහන ඡායාරූප ඇගයීමට සහ පරිශීලකයින්ට තොරතුරු ලබා දීමට CNN භාවිතා කරයි.

උදාහරණයක් ලෙස, Google Lens හට, පින්තූරයක ඇති දේවල් හඳුනාගෙන, මල් වර්ගය වැනි ඒවා පිළිබඳ විස්තර ඉදිරිපත් කළ හැක.

Google Lense

එය පින්තූරයකින් උපුටා ගත් පාඨය බහු භාෂාවලට පරිවර්තනය කළ හැකිය. භාණ්ඩ නිවැරදිව හඳුනා ගැනීමට සහ ඡායාරූප වලින් ලක්ෂණ උකහා ගැනීමට CNN වල සහාය නිසා පාරිභෝගිකයින්ට ප්‍රයෝජනවත් තොරතුරු ලබා දීමට Google Lens හට හැකි වේ.

2. දිගු කෙටි කාලීන මතක (LSTM) ජාල

දිගු කෙටි කාලීන මතක (LSTM) ජාල නිර්මාණය කර ඇත්තේ නිත්‍ය පුනරාවර්තන ස්නායුක ජාල (RNNs) හි අඩුපාඩු මඟහරවා ගැනීම සඳහා ය. කාලය පුරාවට දත්ත අනුක්‍රමික සැකසීම ඉල්ලා සිටින කාර්යයන් සඳහා LSTM ජාල වඩාත් සුදුසු වේ.

ඒවා නිශ්චිත මතක සෛලයක් සහ ද්වාර යාන්ත්‍රණ තුනක් යොදා ගනිමින් ක්‍රියා කරයි.

ඔවුන් සෛලයට සහ ඉන් පිටතට තොරතුරු ගලායාම නියාමනය කරයි. ආදාන ද්වාරය, අමතක දොරටුව සහ ප්‍රතිදාන ද්වාරය එම දොරටු තුනයි.

ආදාන ද්වාරය මතක සෛලයට දත්ත ගලායාම නියාමනය කරයි, අමතක ගේට්ටුව සෛලයෙන් දත්ත මැකීම නියාමනය කරයි, ප්‍රතිදාන ද්වාරය සෛලයෙන් දත්ත ගලායාම නියාමනය කරයි.

ඔවුන්ගේ වැදගත්කම කුමක්ද?

LSTM ජාල ප්‍රයෝජනවත් වන්නේ දිගු කාලීන සබඳතා සමඟ දත්ත අනුපිළිවෙල සාර්ථකව නිරූපණය කිරීමට සහ පුරෝකථනය කිරීමට ඔවුන්ට හැකි බැවිනි. ඔවුන්ට පෙර යෙදවුම් පිළිබඳ තොරතුරු වාර්තා කර රඳවා තබා ගත හැකි අතර, අනාගත යෙදවුම් පිළිබඳ වඩාත් නිවැරදි අනාවැකි කිරීමට ඔවුන්ට ඉඩ සලසයි.

කථන හඳුනාගැනීම, අත් අකුරු හඳුනාගැනීම, ස්වභාවික භාෂා සැකසීම සහ පින්තූර සිරස්තල කිරීම LSTM ජාල භාවිතා කර ඇති යෙදුම් වලින් කිහිපයක් පමණි.

Lstm 1

අපි LSTM ජාල භාවිතා කරන්නේ කොහේද?

බොහෝ මෘදුකාංග සහ තාක්ෂණ යෙදුම් LSTM ජාල භාවිතා කරයි, කථන හඳුනාගැනීමේ පද්ධති, ස්වභාවික භාෂා සැකසුම් මෙවලම් වැනි මනෝ විශ්ලේෂණයකි, යන්ත්‍ර පරිවර්තන පද්ධති, සහ පෙළ සහ පින්තූර උත්පාදන පද්ධති.

ඒවා ස්වයං-රිය පදවන මෝටර් රථ සහ රොබෝවරුන් නිර්මාණය කිරීමේදී මෙන්ම මූල්‍ය ක්ෂේත්‍රයේ වංචා හඳුනා ගැනීමට සහ අපේක්ෂා කිරීමට ද යොදා ගෙන ඇත. කොටස් වෙළඳපොල චලනයන්.

3. උත්පාදක විරුද්ධවාදී ජාල (GANs)

GAN යනු a ගැඹුරු ඉගෙනුම ලබා දී ඇති දත්ත කට්ටලයකට සමාන නව දත්ත සාම්පල උත්පාදනය කිරීමට භාවිතා කරන තාක්ෂණය. GAN දෙක සෑදී ඇත ස්නායු ජාල: නව සාම්පල නිෂ්පාදනය කිරීමට ඉගෙන ගන්නා එකක් සහ අව්‍යාජ සහ ජනනය කරන ලද සාම්පල අතර වෙනස හඳුනා ගැනීමට ඉගෙන ගන්නා එකක්.

සමාන ප්‍රවේශයක් තුළ, උත්පාදක යන්ත්‍රයට සත්‍ය ඒවායින් වෙන්කර හඳුනාගත නොහැකි සාම්පල උත්පාදනය කළ හැකි වන තෙක් මෙම ජාල දෙක එකට පුහුණු කරනු ලැබේ.

අපි GAN භාවිතා කරන්නේ ඇයි?

උසස් තත්ත්වයේ නිෂ්පාදනය කිරීමට ඇති හැකියාව නිසා GANs වැදගත් වේ කෘතිම දත්ත පින්තූර සහ වීඩියෝ නිෂ්පාදනය, පෙළ උත්පාදනය සහ සංගීත උත්පාදනය ඇතුළු විවිධ යෙදුම් සඳහා භාවිතා කළ හැක.

GAN දත්ත උත්පාදනය සඳහා ද භාවිතා කර ඇත කෘතිම දත්ත සැබෑ ලෝක දත්ත අතිරේක කිරීමට සහ යන්ත්‍ර ඉගෙනුම් ආකෘතිවල කාර්ය සාධනය වැඩි දියුණු කිරීමට.

තවද, ආකෘති පුහුණු කිරීමට සහ අත්හදා බැලීම් අනුකරණය කිරීමට භාවිතා කළ හැකි කෘතිම දත්ත නිර්මාණය කිරීමෙන් GAN වලට වෛද්‍ය විද්‍යාව සහ ඖෂධ සංවර්ධනය වැනි අංශ පරිවර්තනය කිරීමේ හැකියාව ඇත.

ගැන්ස් 1

GAN වල යෙදුම්

GAN වලට දත්ත කට්ටල අතිරේක කිරීමට, නව පින්තූර හෝ චිත්‍රපට නිර්මාණය කිරීමට සහ විද්‍යාත්මක සමාකරණ සඳහා කෘතිම දත්ත උත්පාදනය කිරීමට පවා හැකිය. තවද, GANs හට විනෝදාස්වාදයේ සිට වෛද්‍ය විද්‍යාව දක්වා විවිධ යෙදුම්වල සේවයේ යෙදවීමේ හැකියාව ඇත.

වයස් සහ වීඩියෝ. උදාහරණයක් ලෙස, NVIDIA හි StyleGAN2, කීර්තිමත් පුද්ගලයින්ගේ සහ කලා කෘතිවල උසස් තත්ත්වයේ ඡායාරූප නිර්මාණය කිරීමට භාවිතා කර ඇත.

4. ගැඹුරු විශ්වාස ජාල (DBNs)

ගැඹුරු විශ්වාස ජාල (DBNs) වේ කෘතිම බුද්ධිය දත්තවල රටා හඳුනා ගැනීමට ඉගෙන ගත හැකි පද්ධති. ඔවුන් මෙය සාක්ෂාත් කරගනු ලබන්නේ දත්ත කුඩා හා කුඩා කොටස් වලට බෙදීමෙනි.

DBNs දත්ත මොනවාදැයි නොදන්වා ඉගෙන ගත හැකිය (මෙය "අධීක්ෂණය නොකළ ඉගෙනීම" ලෙස හැඳින්වේ). පුද්ගලයෙකුට හඳුනා ගැනීමට අපහසු හෝ කළ නොහැකි දත්තවල රටා හඳුනා ගැනීම සඳහා මෙය ඉතා වටිනා ඒවා බවට පත් කරයි.

DBNs වැදගත් වන්නේ කුමක් ද?

ධූරාවලි දත්ත නිරූපණයන් ඉගෙන ගැනීමට ඇති හැකියාව නිසා DBN වැදගත් වේ. වර්ගීකරණය, විෂමතා හඳුනා ගැනීම සහ මානයන් අඩු කිරීම වැනි විවිධ යෙදුම් සඳහා මෙම නිරූපණයන් භාවිත කළ හැක.

අවම ලේබල් දත්ත සහිත ගැඹුරු ඉගෙනුම් ආකෘතිවල කාර්ය සාධනය වැඩි කළ හැකි, අධීක්‍ෂණය නොකළ පූර්ව පුහුණුවක් ලබා ගැනීමට DBN වල ඇති හැකියාව සැලකිය යුතු ප්‍රතිලාභයකි.

ටෝකනය 1 4

DBN වල යෙදුම් මොනවාද?

වඩාත්ම වැදගත් යෙදුම් වලින් එකකි වස්තුව හඳුනාගැනීම, ගුවන් යානා, කුරුල්ලන් සහ මිනිසුන් වැනි ඇතැම් වර්ග හඳුනා ගැනීමට DBN භාවිතා කරයි. ඒවා රූප උත්පාදනය සහ වර්ගීකරණය, චිත්‍රපටවල චලන හඳුනාගැනීම සහ හඬ සැකසීම සඳහා ස්වභාවික භාෂා අවබෝධය සඳහා ද යොදා ගැනේ.

තවද, මිනිස් ඉරියව් තක්සේරු කිරීම සඳහා දත්ත කට්ටලවල DBN බහුලව භාවිතා වේ. DBN යනු සෞඛ්‍ය සේවා සහ බැංකුකරණය සහ තාක්ෂණය ඇතුළු විවිධ කර්මාන්ත සඳහා විශිෂ්ට මෙවලමකි.

5. Deep Reinforcement Learning Networks (DRLs)

ගැඹුරු ශක්තිමත් කිරීමේ ඉගෙනීම Networks (DRLs) නියෝජිතයින්ට අත්හදා බැලීම් සහ දෝෂයන් හරහා සංකීර්ණ පරිසරයක ඉගෙනීමට ඉඩ සැලසීම සඳහා ශක්තිමත් කිරීමේ ඉගෙනුම් ශිල්පීය ක්‍රම සමඟ ගැඹුරු ස්නායුක ජාල ඒකාබද්ධ කරයි.

DRLs භාවිතා කරන්නේ නියෝජිතයින්ට ඔවුන්ගේ වටපිටාව සමඟ අන්තර් ක්‍රියා කිරීමෙන් සහ ඔවුන්ගේ වැරදි වලින් ඉගෙනීමෙන් විපාක සංඥාවක් ප්‍රශස්ත කරන්නේ කෙසේද යන්න ඉගැන්වීමටය.

ඔවුන් කැපී පෙනෙන්නේ කුමක්ද?

ඒවා ක්‍රීඩා, රොබෝ තාක්ෂණය සහ ස්වයංක්‍රීය රිය පැදවීම ඇතුළු විවිධ යෙදුම්වල ඵලදායී ලෙස භාවිත කර ඇත. DRL වැදගත් වන්නේ ඒවාට අමු ඉන්ද්‍රිය ආදානයෙන් කෙලින්ම ඉගෙන ගත හැකි නිසා, පරිසරය සමඟ ඔවුන්ගේ අන්තර්ක්‍රියා මත පදනම්ව තීරණ ගැනීමට නියෝජිතයින්ට ඉඩ සලසයි.

වැදගත් යෙදුම්

ඩීආර්එල් සැබෑ ලෝක තත්වයන් තුළ භාවිතා කරනු ලබන්නේ ඔවුන්ට දුෂ්කර ගැටළු හැසිරවිය හැකි බැවිනි.

OpenAI's Gym ඇතුළු ප්‍රමුඛ මෘදුකාංග සහ තාක්ෂණික වේදිකා කිහිපයක DRL ඇතුළත් කර ඇත. යුනිටියේ ML නියෝජිතයන්, සහ Google's DeepMind Lab. AlphaGo, Google's විසින් ගොඩනගා ඇත Deepmind, උදාහරණයක් ලෙස, ලෝක ශූර මට්ටමේ Go බෝඩ් ක්‍රීඩාව කිරීමට DRL භාවිතා කරයි.

ඇල්ෆාගෝ

DRL හි තවත් භාවිතයක් වන්නේ රොබෝ විද්‍යාවේ වන අතර, එය දේවල් ග්‍රහණය කර ගැනීම හෝ කුට්ටි ගොඩගැසීම වැනි කාර්යයන් ක්‍රියාත්මක කිරීම සඳහා රොබෝ ආයුධවල චලනයන් පාලනය කිරීමට භාවිතා කරයි. DRL වලට බොහෝ භාවිතයන් ඇති අතර ඒවා සඳහා ප්‍රයෝජනවත් මෙවලමකි ඉගෙන ගැනීමට පුහුණු නියෝජිතයන් සහ සංකීර්ණ සැකසුම් තුළ තීරණ ගන්න.

6. ස්වයංක්‍රීය කේතක

Autoencoders යනු සිත්ගන්නාසුලු වර්ගයකි ස්නායු ජාලය එය විද්වතුන්ගේ සහ දත්ත විද්‍යාඥයින්ගේ උනන්දුව ඇති කර තිබේ. ඒවා මූලික වශයෙන් නිර්මාණය කර ඇත්තේ දත්ත සම්පීඩනය සහ ප්‍රතිසාධනය කරන්නේ කෙසේදැයි ඉගෙන ගැනීමටය.

ආදාන දත්ත ආදාන සහ ප්‍රතිදාන ස්ථරවලට වඩා අඩු නෝඩ් සහිත බාධක ස්ථරයකට සම්පීඩනය වන තෙක් දත්තවල මානය ක්‍රමයෙන් අඩු කරන ස්ථර අනුප්‍රාප්තිකයක් හරහා පෝෂණය වේ.

මෙම සම්පීඩිත නිරූපණය පසුව දත්තවල මානය එහි මුල් හැඩයට ක්‍රමයෙන් ඉහළ නංවන ස්ථර අනුක්‍රමයක් භාවිතයෙන් මුල් ආදාන දත්ත ප්‍රතිනිර්මාණය කිරීමට භාවිතා කරයි.

එය වැදගත් වන්නේ ඇයි?

ස්වයංක්‍රීය කේතක යනු තීරණාත්මක අංගයකි ගැඹුරු ඉගෙනුම ඔවුන් විශේෂාංග නිස්සාරණය සහ දත්ත අඩු කිරීම කළ හැකි නිසා.

ඔවුන්ට ලැබෙන දත්තවල ප්‍රධාන අංග හඳුනාගෙන ඒවා සම්පීඩිත ආකෘතියකට පරිවර්තනය කිරීමට හැකි වන අතර ඒවා වර්ගීකරණය, කණ්ඩායම් කිරීම හෝ නව දත්ත නිර්මාණය කිරීම වැනි වෙනත් කාර්යයන් සඳහා යෙදිය හැකිය.

පරිගණක දර්ශන පද්ධතිය

අපි Autoencoders භාවිතා කරන්නේ කොහේද?

විෂමතා හඳුනාගැනීම, ස්වභාවික භාෂා සැකසීම, සහ පරිගණක දැක්ම ස්වයංක්‍රීය කේතක භාවිතා කරන විෂයයන් කිහිපයක් පමණි. උදාහරණයක් ලෙස, ස්වයංක්‍රීය කේතක, රූප සම්පීඩනය, රූප ප්‍රතික්ෂේප කිරීම සහ පරිගණක දර්ශනයේ පින්තූර සංස්ලේෂණය සඳහා භාවිතා කළ හැක.

අපට ස්වභාවික භාෂා සැකසීමේදී පෙළ නිර්මාණය, පෙළ වර්ගීකරණය සහ පෙළ සාරාංශ කිරීම වැනි කාර්යයන් සඳහා ස්වයංක්‍රීය කේතක භාවිත කළ හැක. එය විෂමතා හඳුනාගැනීමේදී සම්මතයෙන් බැහැර වන දත්තවල විෂම ක්‍රියාකාරකම් හඳුනා ගත හැක.

7. කැප්සියුල ජාල

Capsule Networks යනු Convolutional Neural Networks (CNNs) සඳහා ආදේශකයක් ලෙස සංවර්ධනය කරන ලද නව ගැඹුරු ඉගෙනුම් ගෘහ නිර්මාණ ශිල්පයකි.

කැප්සියුල ජාලයන් පදනම් වී ඇත්තේ රූපයක යම් අයිතමයක පැවැත්ම හඳුනා ගැනීම සහ ඒවායේ ප්‍රතිදාන දෛශිකවලට දිශානතිය සහ පිහිටීම වැනි එහි ගුණාංග සංකේතනය කිරීම සඳහා වගකිව යුතු කැප්සියුල නම් වූ මොළයේ ඒකක කාණ්ඩගත කිරීමේ සංකල්පය මතය. එබැවින් CNN වලට වඩා හොඳින් අවකාශීය අන්තර්ක්‍රියා සහ ඉදිරිදර්ශන උච්චාවචනයන් කළමනාකරණය කිරීමට Capsule Networks හට හැකිය.

ඇයි අපි CNN වලට වඩා Capsule Networks තෝරා ගන්නේ?

කැප්සියුල ජාල ප්‍රයෝජනවත් වන්නේ ඒවා පින්තූරයක ඇති අයිතම අතර ධූරාවලි සම්බන්ධතා ග්‍රහණය කර ගැනීමේදී CNN හි දුෂ්කරතා ජය ගන්නා බැවිනි. CNN වලට විවිධ ප්‍රමාණයේ දේවල් හඳුනාගත හැකි නමුත් මෙම අයිතම එකිනෙක සම්බන්ධ වන ආකාරය ග්‍රහණය කර ගැනීමට අරගල කරයි.

අනෙක් අතට, Capsule Networks හට දේවල් සහ ඒවායේ කොටස් හඳුනා ගැනීමට ඉගෙන ගත හැකි අතර, ඒවා රූපයක අවකාශීය ලෙස ස්ථානගත කර ඇති ආකාරය, ඒවා පරිගණක දර්ශන යෙදුම් සඳහා ශක්‍ය තරඟකරුවෙකු බවට පත් කරයි.

යෙදුම් ක්ෂේත්‍ර

Capsule Networks දැනටමත් රූප වර්ගීකරණය, වස්තු හඳුනාගැනීම සහ පින්තූර ඛණ්ඩනය ඇතුළු විවිධ යෙදුම්වල හොඳ ප්‍රතිඵල පෙන්නුම් කර ඇත.

වෛද්‍ය ඡායාරූපවල ඇති දේවල් වෙන්කර හඳුනා ගැනීමට, චිත්‍රපටවල සිටින පුද්ගලයින් හඳුනා ගැනීමට සහ ද්විමාන රූපවලින් ත්‍රිමාණ ආකෘති නිර්මාණය කිරීමට පවා ඒවා භාවිත කර ඇත.

ඔවුන්ගේ කාර්ය සාධනය වැඩි කිරීම සඳහා, කැප්සියුල ජාල උත්පාදක එදිරිවාදී ජාල (GANs) සහ විචල්‍ය ස්වයංක්‍රීය කේතක (VAEs) වැනි අනෙකුත් ගැඹුරු ඉගෙනුම් ගෘහ නිර්මාණ සමඟ ඒකාබද්ධ කර ඇත. ගැඹුරු ඉගෙනීමේ විද්‍යාව පරිණාමය වන විට පරිගණක දර්ශන තාක්‍ෂණය වැඩිදියුණු කිරීමේදී කැප්සියුල ජාලයන් වැඩි වැඩියෙන් වැදගත් කාර්යභාරයක් ඉටු කරනු ඇතැයි පුරෝකථනය කර ඇත.

නිබබායෙල්

උදාහරණ වශයෙන්; නිබබෙල් නියුරෝඉමේජින් ගොනු වර්ග කියවීම සහ ලිවීම සඳහා ප්‍රසිද්ධ පයිතන් මෙවලමකි. රූප ඛණ්ඩනය සඳහා, එය කැප්සියුල ජාල භාවිතා කරයි.

8. අවධානය මත පදනම් වූ ආකෘති

අවධානය පාදක ආකෘති ලෙස හැඳින්වෙන ගැඹුරු ඉගෙනුම් ආකෘති, අවධානය යොමු කිරීමේ යාන්ත්‍රණ ලෙසද හැඳින්වේ, නිරවද්‍යතාවය වැඩි කිරීමට උත්සාහ කරයි. යන්ත්‍ර ඉගෙනුම් ආකෘති. මෙම ආකෘතීන් ක්‍රියා කරන්නේ ලැබෙන දත්තවල ඇතැම් විශේෂාංග කෙරෙහි අවධානය යොමු කිරීමෙනි, එහි ප්‍රතිඵලයක් ලෙස වඩාත් කාර්යක්ෂම සහ ඵලදායී සැකසුම් සිදුවේ.

යන්ත්‍ර පරිවර්තන සහ හැඟීම් විශ්ලේෂණය වැනි ස්වාභාවික භාෂා සැකසුම් කාර්යයන් වලදී, අවධානය යොමු කිරීමේ ක්‍රම තරමක් සාර්ථක බව පෙන්වා දී ඇත.

ඔවුන්ගේ වැදගත්කම කුමක්ද?

සංකීර්ණ දත්ත වඩාත් ඵලදායී හා කාර්යක්ෂමව සැකසීමට හැකි වන නිසා අවධානය මත පදනම් වූ ආකෘති ප්රයෝජනවත් වේ.

සාම්ප්රදායික ස්නායු ජාල සියලුම ආදාන දත්ත එක හා සමානව වැදගත් ලෙස ඇගයීමට ලක් කරයි, ප්‍රතිඵලයක් ලෙස මන්දගාමී සැකසුම් සහ නිරවද්‍යතාවය අඩු වේ. අවධානය යොමු කිරීමේ ක්‍රියාවලීන් ආදාන දත්තවල තීරණාත්මක අංශ කෙරෙහි අවධානය යොමු කරයි, වේගවත් හා වඩාත් නිවැරදි අනාවැකි සඳහා ඉඩ සලසයි.

භාවිත ක්ෂේත්‍ර

කෘත්‍රිම බුද්ධි ක්ෂේත්‍රය තුළ, අවධානය යොමු කිරීමේ යාන්ත්‍රණයන්ට ස්වභාවික භාෂා සැකසීම, පින්තූර සහ ශ්‍රව්‍ය හඳුනාගැනීම සහ රියදුරන් රහිත වාහන ඇතුළු පුළුල් පරාසයක යෙදුම් තිබේ.

උදාහරණයක් ලෙස, සංදර්භයට අත්‍යවශ්‍ය වන ඇතැම් වචන හෝ වාක්‍ය ඛණ්ඩ කෙරෙහි අවධානය යොමු කිරීමට පද්ධතියට ඉඩ දීමෙන් ස්වභාවික භාෂා සැකසීමේදී යන්ත්‍ර පරිවර්තන වැඩිදියුණු කිරීමට අවධානය යොමු කිරීමේ ක්‍රම භාවිතා කළ හැක.

ස්වයංක්‍රීය මෝටර් රථවල අවධානය යොමු කිරීමේ ක්‍රම මඟින් පද්ධතියට එහි වටපිටාවේ ඇති ඇතැම් අයිතම හෝ අභියෝග කෙරෙහි අවධානය යොමු කිරීමට සහාය විය හැක.

9. ට්රාන්ස්ෆෝමර් ජාල

ට්‍රාන්ස්ෆෝමර් ජාල යනු දත්ත අනුපිළිවෙල පරීක්ෂා කර නිෂ්පාදනය කරන ගැඹුරු ඉගෙනුම් ආකෘති වේ. ඒවා ක්‍රියා කරන්නේ එක් එක් මූලද්‍රව්‍ය ආදාන අනුක්‍රමය සැකසීමෙන් සහ එකම හෝ වෙනස් දිගකින් යුත් ප්‍රතිදාන අනුක්‍රමයක් නිපදවීමෙනි.

ට්‍රාන්ස්ෆෝමර් ජාල, සම්මත අනුපිළිවෙලින් අනුපිළිවෙලට ආකෘති මෙන් නොව, පුනරාවර්තන ස්නායුක ජාල (RNNs) භාවිතයෙන් අනුක්‍රම සකසන්නේ නැත. ඒ වෙනුවට, ඔවුන් අනුපිළිවෙලෙහි කොටස් අතර සම්බන්ධතා ඉගෙන ගැනීමට ස්වයං-අවධානය ක්රියාවලීන් භාවිතා කරයි.

ට්‍රාන්ස්ෆෝමර් ජාල වල වැදගත්කම කුමක්ද?

ට්‍රාන්ස්ෆෝමර් ජාල මෑත වසරවල ජනප්‍රියත්වයට පත්ව ඇත්තේ ස්වභාවික භාෂා සැකසුම් රැකියා වල වඩා හොඳ ක්‍රියාකාරීත්වයේ ප්‍රතිඵලයක් වශයෙනි.

භාෂා පරිවර්තනය, පෙළ සාරාංශ කිරීම සහ සංවාද නිෂ්පාදනය වැනි පෙළ-නිර්මාණ කාර්යයන් සඳහා ඒවා විශේෂයෙන් හොඳින් ගැලපේ.

ට්‍රාන්ස්ෆෝමර් ජාලයන් RNN මත පදනම් වූ ආකෘති වලට වඩා සැලකිය යුතු ලෙස කාර්යක්ෂම වන අතර, ඒවා මහා පරිමාණ යෙදුම් සඳහා වඩාත් කැමති තේරීමක් කරයි.

පරිගණක දෘෂ්ඨි පද්ධතිය 2

ඔබට ට්‍රාන්ස්ෆෝමර් ජාල සොයාගත හැක්කේ කොතැනින්ද?

ට්‍රාන්ස්ෆෝමර් ජාල පුළුල් පරාසයක යෙදුම්වල බහුලව භාවිතා වේ, විශේෂයෙන් ස්වාභාවික භාෂා සැකසුම්.

GPT (Generative Pre-trained Transformer) ශ්‍රේණිය යනු භාෂා පරිවර්තනය, පෙළ සාරාංශ කිරීම සහ chatbot උත්පාදනය වැනි කාර්යයන් සඳහා භාවිත කර ඇති ප්‍රමුඛ ට්‍රාන්ස්ෆෝමර් මත පදනම් වූ ආකෘතියකි.

BERT (ට්‍රාන්ස්ෆෝමර් වෙතින් ද්විපාර්ශ්වික කේතීකරණ නියෝජන) යනු ප්‍රශ්නවලට පිළිතුරු සැපයීම සහ හැඟීම් විශ්ලේෂණය වැනි ස්වභාවික භාෂා අවබෝධතා යෙදුම් සඳහා භාවිත කර ඇති තවත් පොදු ට්‍රාන්ස්ෆෝමර් මත පදනම් වූ ආකෘතියකි.

දෙකම GPT සහ BERT සමඟ නිර්මාණය කරන ලදී පයිටෝර්ච්, ට්‍රාන්ස්ෆෝමර් මත පදනම් වූ ආකෘති සංවර්ධනය කිරීම සඳහා ජනප්‍රිය වී ඇති විවෘත මූලාශ්‍ර ගැඹුරු ඉගෙනුම් රාමුවකි.

10. සීමා කරන ලද Boltzmann යන්ත්‍ර (RBMs)

Restricted Boltzmann Machines (RBMs) යනු උත්පාදක ආකාරයෙන් ඉගෙන ගන්නා අධීක්‍ෂණය නොකළ ස්නායුක ජාලයකි. ඉහළ-මාන දත්ත වලින් අත්‍යවශ්‍ය ලක්ෂණ ඉගෙන ගැනීමට සහ උකහා ගැනීමට ඔවුන්ට ඇති හැකියාව නිසා, ඔවුන් යන්ත්‍ර ඉගෙනීම සහ ගැඹුරු ඉගෙනීම යන ක්ෂේත්‍රවල පුළුල් ලෙස සේවයේ යොදවා ඇත.

RBM සෑදී ඇත්තේ දෘශ්‍ය සහ සැඟවුණු ස්ථර දෙකකින් වන අතර සෑම ස්ථරයක්ම බර දාරවලින් සම්බන්ධ වූ නියුරෝන සමූහයකින් සමන්විත වේ. RBM නිර්මාණය කර ඇත්තේ ආදාන දත්ත විස්තර කරන සම්භාවිතා ව්‍යාප්තියක් ඉගෙන ගැනීමටය.

සීමා කරන ලද Boltzmann යන්ත්‍ර මොනවාද?

RBMs ජනක ඉගෙනුම් උපාය මාර්ගයක් භාවිතා කරයි. RBM වල, දෘශ්‍ය ස්තරය ආදාන දත්ත පරාවර්තනය කරන අතර, තැන්පත් කරන ලද ස්ථරය ආදාන දත්තවල ලක්ෂණ සංකේත කරයි. දෘශ්ය සහ සැඟවුනු ස්ථරවල බර ඔවුන්ගේ සම්බන්ධකයේ ශක්තිය පෙන්නුම් කරයි.

RBMs ප්‍රතිවිරෝධතා අපසරනය ලෙස හඳුන්වන තාක්‍ෂණයක් භාවිතා කරමින් පුහුණුව අතරතුර ස්ථර අතර බර සහ නැඹුරුව සකස් කරයි. ප්රතිවිරෝධතා අපසරනය යනු ආකෘතියේ පුරෝකථනය කිරීමේ සම්භාවිතාව උපරිම කරන අධීක්ෂණය නොකළ ඉගෙනුම් උපාය මාර්ගයකි.

සීමා සහිත Boltzmann යන්ත්‍රවල වැදගත්කම කුමක්ද?

RBMs සැලකිය යුතු ය යන්ත්ර ඉගෙනීම සහ ගැඹුරු ඉගෙනීම ඔවුන්ට විශාල දත්ත ප්‍රමාණයකින් අදාළ ලක්ෂණ ඉගෙන ගැනීමට සහ උකහා ගත හැකි බැවිනි.

ඒවා පින්තූර සහ කථන හඳුනාගැනීම සඳහා ඉතා ඵලදායී වන අතර, ඒවා නිර්දේශ කිරීමේ පද්ධති, විෂමතා හඳුනාගැනීම සහ මානයන් අඩු කිරීම වැනි විවිධ යෙදුම්වල යොදවා ඇත. RBM වලට විශාල දත්ත කට්ටලවල රටා සොයාගත හැකි අතර, එහි ප්‍රතිඵලයක් ලෙස උසස් අනාවැකි සහ තීක්ෂ්ණ බුද්ධිය ලැබේ.

සීමා කරන ලද Boltzmann යන්ත්‍ර RBM

සීමා සහිත Boltzmann යන්ත්‍ර භාවිතා කළ හැක්කේ කොතැනින්ද?

RBM සඳහා වන යෙදුම්වලට මානයන් අඩු කිරීම, විෂමතා හඳුනාගැනීම සහ නිර්දේශ පද්ධති ඇතුළත් වේ. හැඟීම් විශ්ලේෂණය සහ සඳහා RBMs විශේෂයෙන් උපකාරී වේ මාතෘකා ආකෘති නිර්මාණය ස්වභාවික භාෂා සැකසුම් සන්දර්භය තුළ.

ගැඹුරු විශ්වාස ජාල, කටහඬ සහ පින්තූර හඳුනාගැනීම සඳහා භාවිතා කරන ස්නායුක ජාලයක් ද RBM භාවිතා කරයි. ගැඹුරු විශ්වාස ජාල මෙවලම් පෙට්ටිය, TensorFlow, සහ තියානෝ RBM භාවිතා කරන මෘදුකාංග හෝ තාක්ෂණය පිළිබඳ විශේෂිත උදාහරණ වේ.

අවසන් කරන්න

කථන හඳුනාගැනීම, ස්වභාවික භාෂා සැකසීම සහ පරිගණක දැක්ම ඇතුළු විවිධ කර්මාන්තවල ගැඹුරු ඉගෙනුම් ආකෘති වඩ වඩාත් තීරණාත්මක වෙමින් පවතී.

Convolutional Neural Networks (CNNs) සහ Recurrent Neural Networks (RNNs) වඩාත්ම පොරොන්දුව පෙන්නුම් කර ඇති අතර ඒවා බොහෝ යෙදුම්වල බහුලව භාවිතා වේ, කෙසේ වෙතත්, සියලුම ගැඹුරු ඉගෙනුම් ආකෘතීන්ට ඒවායේ වාසි සහ අවාසි ඇත.

කෙසේ වෙතත්, පර්යේෂකයන් තවමත් සීමා සහිත බෝල්ට්ස්මන් යන්ත්‍ර (RBMs) සහ අනෙකුත් ගැඹුරු ඉගෙනුම් ආකෘති පිළිබඳව සොයා බලමින් සිටින්නේ ඒවාට ද විශේෂ වාසි ඇති බැවිනි.

ගැඹුරු ඉගෙනුම් ක්ෂේත්‍රය දැඩි ගැටළු විසඳීම සඳහා ඉදිරියට යන බැවින් නව සහ නිර්මාණාත්මක ආකෘති නිර්මාණය කිරීමට අපේක්ෂා කෙරේ.