ជាច្រើនឆ្នាំមកនេះ ការរៀនសូត្រស៊ីជម្រៅបាននិងកំពុងក្លាយជាប្រធានបទនៅក្នុងបច្ចេកវិទ្យា។ ហើយវាជារឿងសាមញ្ញក្នុងការយល់ពីមូលហេតុ។
សាខានៃបញ្ញាសិប្បនិមិត្តនេះកំពុងផ្លាស់ប្តូរវិស័យជាច្រើនចាប់ពីផ្នែកថែទាំសុខភាព រហូតដល់ផ្នែកធនាគារ ដល់ការដឹកជញ្ជូន ដែលអនុញ្ញាតឱ្យមានការរីកចម្រើនដែលមិននឹកស្មានដល់ពីមុនមក។
ការរៀនស៊ីជម្រៅត្រូវបានបង្កើតឡើងនៅលើសំណុំនៃក្បួនដោះស្រាយស្មុគ្រស្មាញដែលរៀនទាញយក និងទស្សន៍ទាយគំរូស្មុគស្មាញពីបរិមាណដ៏ធំនៃទិន្នន័យ។
យើងនឹងពិនិត្យមើលក្បួនដោះស្រាយការរៀនស៊ីជម្រៅល្អបំផុតចំនួន 15 នៅក្នុងការប្រកាសនេះ ចាប់ពីបណ្តាញសរសៃប្រសាទ Convolutional ដល់បណ្តាញ Adversarial ជំនាន់ទៅបណ្តាញសតិរយៈពេលខ្លី។
អត្ថបទនេះនឹងផ្តល់ការយល់ដឹងសំខាន់ៗ ថាតើអ្នកជា ក អ្នកចាប់ផ្តើមដំបូង ឬអ្នកជំនាញក្នុងការសិក្សាជ្រៅជ្រះ.
1. Transformer Networks
បណ្តាញ Transformer បានផ្លាស់ប្តូរ ចក្ខុវិស័យកុំព្យូទ័រ និងកម្មវិធីដំណើរការភាសាធម្មជាតិ (NLP) ។ ពួកគេវិភាគទិន្នន័យចូល និងប្រើប្រាស់ដំណើរការយកចិត្តទុកដាក់ ដើម្បីចាប់យកទំនាក់ទំនងរយៈពេលវែង។ នេះធ្វើឱ្យពួកវាលឿនជាងគំរូតាមលំដាប់លំដោយធម្មតា។
បណ្តាញ Transformer ត្រូវបានពិពណ៌នាជាលើកដំបូងនៅក្នុងការបោះពុម្ពផ្សាយ "ការយកចិត្តទុកដាក់គឺទាំងអស់ដែលអ្នកត្រូវការ" ដោយ Vaswani et al ។
ពួកវាមានឧបករណ៍បំលែងកូដ និងឧបករណ៍ឌិកូដ (2017)។ គំរូប្លែងបានបង្ហាញពីដំណើរការនៅក្នុងកម្មវិធី NLP ជាច្រើន រួមទាំង ការវិភាគមនោសញ្ចេតនាការចាត់ថ្នាក់អត្ថបទ និងការបកប្រែម៉ាស៊ីន។
ម៉ូដែលដែលមានមូលដ្ឋានលើ Transformer ក៏អាចត្រូវបានប្រើប្រាស់ក្នុងចក្ខុវិស័យកុំព្យូទ័រសម្រាប់កម្មវិធីផងដែរ។ ពួកគេអាចអនុវត្តការសម្គាល់វត្ថុ និងការដាក់ចំណងជើងរូបភាព។
2. បណ្តាញសតិរយៈពេលខ្លី (LSTMs)
បណ្តាញសតិរយៈពេលខ្លី (LSTMs) គឺជាទម្រង់មួយនៃ បណ្តាញសរសៃប្រសាទ ជាពិសេសត្រូវបានបង្កើតឡើងដើម្បីគ្រប់គ្រងការបញ្ចូលតាមលំដាប់លំដោយ។ ពួកគេត្រូវបានគេហៅថា "រយៈពេលខ្លី" ពីព្រោះពួកគេអាចរំលឹកចំណេះដឹងពីអតីតកាលជាយូរមក ខណៈពេលដែលភ្លេចព័ត៌មានដែលមិនចាំបាច់។
LSTMs ដំណើរការតាមរយៈ "ច្រកទ្វារ" មួយចំនួនដែលគ្រប់គ្រងលំហូរព័ត៌មាននៅក្នុងបណ្តាញ។ អាស្រ័យលើថាតើព័ត៌មានត្រូវបានវិនិច្ឆ័យថាសំខាន់ឬអត់ ច្រកទាំងនេះអាចអនុញ្ញាតឱ្យវាចូល ឬរារាំងវាបាន។
បច្ចេកទេសនេះអនុញ្ញាតឱ្យ LSTMs រំលឹកឡើងវិញ ឬបំភ្លេចព័ត៌មានពីជំហានអតីតកាល ដែលមានសារៈសំខាន់សម្រាប់កិច្ចការដូចជា ការទទួលស្គាល់ការនិយាយ ដំណើរការភាសាធម្មជាតិ និងការទស្សន៍ទាយស៊េរីពេលវេលា។
LSTMs មានអត្ថប្រយោជន៍ខ្លាំងក្នុងករណីណាក៏ដោយដែលអ្នកមានទិន្នន័យបន្តបន្ទាប់គ្នាដែលត្រូវវាយតម្លៃ ឬព្យាករណ៍។ ពួកវាត្រូវបានប្រើជាញឹកញាប់នៅក្នុងកម្មវិធីសម្គាល់សំឡេង ដើម្បីបំប្លែងពាក្យដែលបាននិយាយទៅជាអត្ថបទ ឬនៅក្នុង ទីផ្សារភាគហ៊ុន ការវិភាគដើម្បីព្យាករណ៍តម្លៃនាពេលអនាគតដោយផ្អែកលើទិន្នន័យពីមុន។
3. ផែនទីរៀបចំដោយខ្លួនឯង (SOMs)
SOMs គឺជាប្រភេទសិប្បនិម្មិតមួយ។ បណ្តាញសរសៃប្រសាទដែលអាចរៀនបាន។ និងតំណាងឱ្យទិន្នន័យស្មុគស្មាញនៅក្នុងបរិយាកាសទាប។ វិធីសាស្រ្តដំណើរការដោយការបំប្លែងទិន្នន័យបញ្ចូលវិមាត្រខ្ពស់ទៅជាក្រឡាចត្រង្គពីរវិមាត្រ ដោយឯកតានីមួយៗ ឬណឺរ៉ូនតំណាងឱ្យផ្នែកផ្សេងគ្នានៃចន្លោះបញ្ចូល។
ណឺរ៉ូនត្រូវបានភ្ជាប់ជាមួយគ្នា និងបង្កើតរចនាសម្ព័ន្ធ topological ដែលអនុញ្ញាតឱ្យពួកគេរៀន និងកែតម្រូវទៅនឹងទិន្នន័យបញ្ចូល។ ដូច្នេះ SOM គឺផ្អែកលើការរៀនដែលគ្មានការត្រួតពិនិត្យ។
ក្បួនដោះស្រាយមិនត្រូវការ ទិន្នន័យដែលមានស្លាក ដើម្បីរៀនពី។ ផ្ទុយទៅវិញ វាប្រើលក្ខណៈស្ថិតិនៃទិន្នន័យបញ្ចូល ដើម្បីស្វែងរកគំរូ និងការជាប់ទាក់ទងគ្នាក្នុងចំណោមអថេរ។
ក្នុងអំឡុងពេលហ្វឹកហាត់ ណឺរ៉ូនប្រកួតប្រជែងដើម្បីជាការចង្អុលបង្ហាញដ៏ល្អបំផុតនៃទិន្នន័យបញ្ចូល។ ហើយពួកគេរៀបចំដោយខ្លួនឯងទៅជារចនាសម្ព័ន្ធដ៏មានអត្ថន័យ។ SOMs មានកម្មវិធីជាច្រើន រួមទាំងការទទួលស្គាល់រូបភាព និងការនិយាយ ការជីកយករ៉ែទិន្នន័យ និងការទទួលស្គាល់គំរូ។
ពួកវាមានប្រយោជន៍សម្រាប់ ការមើលឃើញទិន្នន័យស្មុគស្មាញការដាក់ចង្កោមចំណុចទិន្នន័យដែលពាក់ព័ន្ធ និងការរកឃើញភាពមិនប្រក្រតី ឬផ្នែកខាងក្រៅ។
4. ការរៀនពង្រឹងជ្រៅ
ជ្រៅ ការរៀនសូត្រពង្រឹង គឺជាប្រភេទនៃការរៀនម៉ាស៊ីនដែលភ្នាក់ងារត្រូវបានបណ្តុះបណ្តាលដើម្បីធ្វើការសម្រេចចិត្តដោយផ្អែកលើប្រព័ន្ធរង្វាន់។ វាដំណើរការដោយអនុញ្ញាតឱ្យភ្នាក់ងារធ្វើអន្តរកម្មជាមួយមនុស្សជុំវិញខ្លួន និងរៀនតាមរយៈការសាកល្បង និងកំហុស។
ភ្នាក់ងារត្រូវបានផ្តល់រង្វាន់សម្រាប់រាល់សកម្មភាពដែលវាធ្វើ ហើយគោលបំណងរបស់វាគឺដើម្បីរៀនពីរបៀបបង្កើនប្រសិទ្ធភាពអត្ថប្រយោជន៍របស់វាតាមពេលវេលា។ វាអាចត្រូវបានប្រើដើម្បីបង្រៀនភ្នាក់ងារឱ្យលេងហ្គេម បើករថយន្ត និងសូម្បីតែគ្រប់គ្រងមនុស្សយន្ត។
Q-Learning គឺជាវិធីសាស្រ្តរៀនពង្រឹងជ្រៅដែលល្បីល្បាញ។ វាដំណើរការដោយការវាយតម្លៃតម្លៃនៃការធ្វើសកម្មភាពជាក់លាក់មួយនៅក្នុងស្ថានភាពជាក់លាក់មួយ និងការធ្វើបច្ចុប្បន្នភាពការប៉ាន់ស្មាននោះ នៅពេលដែលភ្នាក់ងារមានអន្តរកម្មជាមួយបរិស្ថាន។
បន្ទាប់មកភ្នាក់ងារប្រើប្រាស់ការប៉ាន់ប្រមាណទាំងនេះដើម្បីកំណត់ថាសកម្មភាពណាដែលទំនងជាទទួលបានរង្វាន់ធំជាងគេ។ Q-Learning ត្រូវបានប្រើដើម្បីអប់រំភ្នាក់ងារឱ្យលេងហ្គេម Atari ក៏ដូចជាកែលម្អការប្រើប្រាស់ថាមពលនៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យ។
Deep Q-Networks គឺជាវិធីសាស្រ្តរៀនពង្រឹងជ្រៅ (DQN) ដ៏ល្បីល្បាញមួយទៀត។ DQNs គឺស្រដៀងទៅនឹង Q-Learning ដែលពួកគេប៉ាន់ស្មានតម្លៃសកម្មភាពដោយប្រើបណ្តាញសរសៃប្រសាទជ្រៅជាជាងតារាង។
នេះអនុញ្ញាតឱ្យពួកគេដោះស្រាយជាមួយនឹងការកំណត់ដ៏ធំ និងស្មុគស្មាញជាមួយនឹងសកម្មភាពជំនួសជាច្រើន។ DQNs ត្រូវបានប្រើដើម្បីបណ្តុះបណ្តាលភ្នាក់ងារឱ្យលេងហ្គេមដូចជា Go និង Dota 2 ក៏ដូចជាបង្កើតមនុស្សយន្តដែលអាចរៀនដើរបាន។
5. បណ្តាញសរសៃប្រសាទកើតឡើងវិញ (RNNs)
RNNs គឺជាប្រភេទនៃបណ្តាញសរសៃប្រសាទដែលអាចដំណើរការទិន្នន័យជាបន្តបន្ទាប់ខណៈពេលដែលរក្សាស្ថានភាពផ្ទៃក្នុង។ ពិចារណាវាស្រដៀងនឹងមនុស្សម្នាក់ដែលកំពុងអានសៀវភៅ ដែលពាក្យនីមួយៗត្រូវបានរំលាយដោយទាក់ទងទៅនឹងអ្នកដែលមកមុនវា។
ដូច្នេះ RNNs គឺល្អសម្រាប់កិច្ចការដូចជា ការទទួលស្គាល់ការនិយាយ ការបកប្រែភាសា និងសូម្បីតែការព្យាករណ៍ពាក្យបន្ទាប់នៅក្នុងឃ្លាមួយ។
RNNs ដំណើរការដោយប្រើរង្វិលជុំមតិដើម្បីភ្ជាប់លទ្ធផលនៃរាល់ពេលដែលជំហានត្រឡប់ទៅធាតុបញ្ចូលនៃជំហានបន្ទាប់។ នេះអនុញ្ញាតឱ្យបណ្តាញប្រើប្រាស់ព័ត៌មានជំហានមុនដើម្បីជូនដំណឹងអំពីការព្យាករណ៍របស់វាសម្រាប់ជំហានពេលវេលានាពេលអនាគត។ ជាអកុសល នេះក៏មានន័យថា RNNs ងាយរងគ្រោះទៅនឹងបញ្ហាជម្រាលដែលបាត់ ដែលក្នុងនោះជម្រាលដែលប្រើសម្រាប់ការបណ្តុះបណ្តាលក្លាយជាតូចបំផុត ហើយបណ្តាញតស៊ូដើម្បីរៀនទំនាក់ទំនងរយៈពេលវែង។
ទោះបីជាមានឧបសគ្គជាក់ស្តែងនេះក៏ដោយ RNNs បានរកឃើញការប្រើប្រាស់នៅក្នុងកម្មវិធីយ៉ាងទូលំទូលាយ។ កម្មវិធីទាំងនេះរួមមានដំណើរការភាសាធម្មជាតិ ការទទួលស្គាល់ការនិយាយ និងសូម្បីតែការផលិតតន្ត្រី។
ហ្គូហ្គលបកប្រែជាឧទាហរណ៍ ប្រើប្រាស់ប្រព័ន្ធដែលមានមូលដ្ឋានលើ RNN ដើម្បីបកប្រែភាសានានា ខណៈដែល Siri ដែលជាជំនួយការនិម្មិតប្រើប្រាស់ប្រព័ន្ធផ្អែកលើ RNN ដើម្បីចាប់សំឡេង។ RNNs ក៏ត្រូវបានប្រើដើម្បីព្យាករណ៍តម្លៃភាគហ៊ុន និងបង្កើតអត្ថបទ និងក្រាហ្វិកប្រាកដនិយមផងដែរ។
6. បណ្តាញ Capsule
Capsule Networks គឺជាប្រភេទថ្មីនៃការរចនាបណ្តាញសរសៃប្រសាទដែលអាចកំណត់អត្តសញ្ញាណគំរូ និងការជាប់ទាក់ទងគ្នាក្នុងទិន្នន័យកាន់តែមានប្រសិទ្ធភាព។ ពួកគេរៀបចំណឺរ៉ូនទៅជា "កន្សោម" ដែលអ៊ិនកូដទិដ្ឋភាពមួយចំនួននៃការបញ្ចូល។
វិធីនេះពួកគេអាចធ្វើការទស្សន៍ទាយបានត្រឹមត្រូវ។ Capsule Networks ទាញយកលក្ខណៈសម្បត្តិដែលមានភាពស្មុគស្មាញជាលំដាប់ពីទិន្នន័យបញ្ចូលដោយប្រើប្រាស់ស្រទាប់ជាច្រើននៃ capsule ។
បច្ចេកទេសរបស់ Capsule Networks អនុញ្ញាតឱ្យពួកគេរៀនពីតំណាងឋានានុក្រមនៃធាតុបញ្ចូលដែលបានផ្តល់ឱ្យ។ ពួកគេអាចអ៊ិនកូដការតភ្ជាប់លំហបានត្រឹមត្រូវរវាងធាតុនៅក្នុងរូបភាពដោយទំនាក់ទំនងរវាងកន្សោម។
ការកំណត់អត្តសញ្ញាណវត្ថុ ការបែងចែករូបភាព និងដំណើរការភាសាធម្មជាតិ គឺជាកម្មវិធីទាំងអស់នៃបណ្តាញ Capsule Networks។
Capsule Networks មានសក្តានុពលក្នុងការធ្វើការ បើកបរដោយស្វយ័ត បច្ចេកវិទ្យា។ ពួកគេជួយប្រព័ន្ធក្នុងការទទួលស្គាល់ និងបែងចែករវាងវត្ថុដូចជា រថយន្ត មនុស្ស និងផ្លាកសញ្ញាចរាចរណ៍។ ប្រព័ន្ធទាំងនេះអាចជៀសវាងការប៉ះទង្គិចគ្នាដោយធ្វើការព្យាករណ៍ច្បាស់លាស់បន្ថែមទៀតអំពីឥរិយាបថរបស់វត្ថុនៅក្នុងបរិយាកាសរបស់ពួកគេ។
7. បំរែបំរួល Autoencoders (VAEs)
VAEs គឺជាទម្រង់នៃឧបករណ៍សិក្សាស៊ីជម្រៅដែលត្រូវបានប្រើសម្រាប់ការរៀនដែលគ្មានការត្រួតពិនិត្យ។ តាមរយៈការបំប្លែងទិន្នន័យទៅក្នុងទំហំវិមាត្រទាប ហើយបន្ទាប់មកការឌិកូដវាត្រឡប់ទៅជាទម្រង់ដើមវិញ ពួកគេអាចរៀនសម្គាល់គំរូនៅក្នុងទិន្នន័យ។
ពួកគេប្រៀបដូចជាគ្រូមន្តអាគម ដែលអាចបំប្លែងទន្សាយទៅជាមួក រួចត្រឡប់ទៅជាទន្សាយវិញ! VAEs មានអត្ថប្រយោជន៍សម្រាប់បង្កើតរូបភាព ឬតន្ត្រីជាក់ស្តែង។ ហើយពួកវាអាចត្រូវបានប្រើដើម្បីផលិតទិន្នន័យថ្មីដែលអាចប្រៀបធៀបទៅនឹងទិន្នន័យដើម។
VAEs គឺស្រដៀងទៅនឹងអ្នកបំបែកកូដសម្ងាត់។ ពួកគេអាចរកឃើញមូលដ្ឋាន រចនាសម្ព័ន្ធទិន្នន័យ ដោយបំបែកវាទៅជាប៊ីតសាមញ្ញជាងនេះដូចជារបៀបដែលល្បែងផ្គុំរូបត្រូវបានបំបែក។ ពួកគេអាចប្រើប្រាស់ព័ត៌មាននោះដើម្បីបង្កើតទិន្នន័យថ្មីដែលមើលទៅដូចដើម បន្ទាប់ពីពួកគេបានតម្រៀបចេញផ្នែក។
នេះអាចជាការងាយស្រួលសម្រាប់ការបង្ហាប់ឯកសារដ៏ធំសម្បើម ឬផលិតក្រាហ្វិក ឬតន្ត្រីថ្មីៗនៅក្នុងរចនាប័ទ្មជាក់លាក់មួយ។ VAEs ក៏អាចផលិតខ្លឹមសារថ្មីៗ ដូចជារឿងព័ត៌មាន ឬអត្ថបទចម្រៀងជាដើម។
8. បណ្តាញប្រឆាំងទូទៅ (GANs)
GANs (Generative Adversarial Networks) គឺជាទម្រង់នៃប្រព័ន្ធសិក្សាជ្រៅជ្រះដែលបង្កើតទិន្នន័យថ្មីដែលស្រដៀងនឹងដើម។ ពួកគេដំណើរការដោយការបណ្តុះបណ្តាលបណ្តាញពីរ៖ ម៉ាស៊ីនភ្លើង និងបណ្តាញរើសអើង។
ម៉ាស៊ីនបង្កើតទិន្នន័យថ្មីដែលអាចប្រៀបធៀបទៅនឹងដើម។
ហើយអ្នករើសអើងព្យាយាមបែងចែករវាងទិន្នន័យដើម និងទិន្នន័យដែលបានបង្កើត។ បណ្តាញទាំងពីរនេះត្រូវបានបណ្តុះបណ្តាលរួមគ្នាដោយម៉ាស៊ីនភ្លើងព្យាយាមបញ្ឆោតអ្នករើសអើងនិងអ្នករើសអើងព្យាយាមកំណត់អត្តសញ្ញាណទិន្នន័យដើមឱ្យបានត្រឹមត្រូវ។
ពិចារណា GANs ជាការឆ្លងរវាងអ្នកក្លែងបន្លំនិងអ្នកស៊ើបអង្កេត។ ម៉ាស៊ីនភ្លើងមានមុខងារស្រដៀងទៅនឹងអ្នកក្លែងបន្លំ ផលិតស្នាដៃសិល្បៈថ្មីដែលស្រដៀងនឹងដើម។
អ្នករើសអើងដើរតួជាអ្នកស៊ើបអង្កេត ដោយព្យាយាមបែងចែករវាងស្នាដៃសិល្បៈពិតប្រាកដ និងការក្លែងបន្លំ។ បណ្តាញទាំងពីរនេះត្រូវបានបណ្តុះបណ្តាលរួមគ្នា ដោយម៉ាស៊ីនភ្លើងកំពុងកែលម្អក្នុងការបង្កើតក្លែងក្លាយដែលអាចជឿជាក់បាន ហើយអ្នករើសអើងនឹងកែលម្អក្នុងការទទួលស្គាល់ពួកគេ។
GANs មានការប្រើប្រាស់ជាច្រើន ចាប់ពីការផលិតរូបភាពពិតរបស់មនុស្ស ឬសត្វ រហូតដល់ការបង្កើតតន្ត្រី ឬការសរសេរថ្មី។ ពួកវាក៏អាចត្រូវបានប្រើសម្រាប់ការបង្កើនទិន្នន័យ ដែលពាក់ព័ន្ធនឹងការរួមបញ្ចូលទិន្នន័យដែលបានផលិតជាមួយនឹងទិន្នន័យពិត ដើម្បីបង្កើតសំណុំទិន្នន័យធំជាងមុនសម្រាប់ការបណ្តុះបណ្តាលគំរូរៀនម៉ាស៊ីន។
9. Deep Q-Networks (DQNs)
Deep Q-Networks (DQNs) គឺជាប្រភេទនៃក្បួនដោះស្រាយការរៀនពង្រឹងការសម្រេចចិត្ត។ ពួកគេដំណើរការដោយការរៀនមុខងារ Q ដែលព្យាករណ៍ពីរង្វាន់ដែលរំពឹងទុកសម្រាប់ការធ្វើសកម្មភាពជាក់លាក់ក្នុងលក្ខខណ្ឌជាក់លាក់មួយ។
មុខងារ Q ត្រូវបានបង្រៀនដោយការសាកល្បង និងកំហុស ជាមួយនឹងក្បួនដោះស្រាយព្យាយាមធ្វើសកម្មភាពផ្សេងៗ និងរៀនពីលទ្ធផល។
ពិចារណាវាដូចជា ក ហ្គេមវីឌីអូ តួអង្គពិសោធន៍ជាមួយសកម្មភាពផ្សេងៗ និងស្វែងយល់ថាតើមួយណានាំទៅរកភាពជោគជ័យ! DQNs បណ្តុះបណ្តាល Q-function ដោយប្រើបណ្តាញសរសៃប្រសាទជ្រៅ ធ្វើឱ្យពួកគេជាឧបករណ៍មានប្រសិទ្ធភាពសម្រាប់កិច្ចការធ្វើការសម្រេចចិត្តពិបាក។
ពួកគេថែមទាំងបានយកឈ្នះជើងឯកមនុស្សនៅក្នុងហ្គេមដូចជា Go និងអុក ក៏ដូចជានៅក្នុងមនុស្សយន្ត និងរថយន្តដែលបើកបរដោយខ្លួនឯងផងដែរ។ ដូច្នេះ សរុបទាំងអស់ DQNs ធ្វើការដោយការរៀនពីបទពិសោធន៍ ដើម្បីបង្កើនជំនាញធ្វើការសម្រេចចិត្តរបស់ពួកគេតាមពេលវេលា។
10. បណ្តាញមុខងារមូលដ្ឋានរ៉ាឌីកាល់ (RBFNs)
Radial Basis Function Networks (RBFNs) គឺជាបណ្តាញប្រសាទមួយប្រភេទដែលត្រូវបានប្រើសម្រាប់មុខងារប្រហាក់ប្រហែល និងអនុវត្តកិច្ចការចាត់ថ្នាក់។ ពួកវាដំណើរការដោយការបំប្លែងទិន្នន័យបញ្ចូលទៅក្នុងលំហវិមាត្រខ្ពស់ដោយប្រើបណ្តុំនៃមុខងារមូលដ្ឋានរ៉ាឌីកាល់។
លទ្ធផលនៃបណ្តាញគឺជាការរួមបញ្ចូលគ្នាលីនេអ៊ែរនៃមុខងារមូលដ្ឋាន ហើយមុខងារមូលដ្ឋានរ៉ាឌីកាល់នីមួយៗតំណាងឱ្យចំណុចកណ្តាលនៅក្នុងចន្លោះបញ្ចូល។
RBFNs មានប្រសិទ្ធភាពជាពិសេសសម្រាប់ស្ថានភាពដែលមានអន្តរកម្មបញ្ចូល-លទ្ធផលដ៏ស្មុគស្មាញ ហើយពួកវាអាចត្រូវបានបង្រៀនដោយប្រើបច្ចេកទេសជាច្រើន រួមទាំងការរៀនសូត្រដែលស្ថិតក្រោមការគ្រប់គ្រង និងគ្មានការត្រួតពិនិត្យ។ ពួកវាត្រូវបានប្រើសម្រាប់អ្វីៗគ្រប់យ៉ាងពីការព្យាករណ៍ហិរញ្ញវត្ថុ រហូតដល់រូបភាព និងការទទួលស្គាល់ការនិយាយ រហូតដល់ការវិនិច្ឆ័យវេជ្ជសាស្ត្រ។
ពិចារណា RBFNs ជាប្រព័ន្ធ GPS ដែលប្រើចំណុចយុថ្កាជាបន្តបន្ទាប់ ដើម្បីស្វែងរកផ្លូវឆ្លងកាត់ដីដែលមានបញ្ហា។ លទ្ធផលនៃបណ្តាញគឺជាការរួមបញ្ចូលគ្នានៃចំណុចយុថ្កាដែលឈរសម្រាប់មុខងារមូលដ្ឋានរ៉ាឌីកាល់។
យើងអាចរកមើលព័ត៌មានស្មុគស្មាញ និងបង្កើតការព្យាករណ៍ច្បាស់លាស់អំពីរបៀបដែលសេណារីយ៉ូនឹងកើតឡើងដោយប្រើប្រាស់ RBFNs ។
11. Multilayer Perceptrons (MLPs)
ទម្រង់ធម្មតានៃបណ្តាញសរសៃប្រសាទដែលហៅថា multilayer perceptron (MLP) ត្រូវបានប្រើសម្រាប់កិច្ចការសិក្សាដែលមានការត្រួតពិនិត្យដូចជាការចាត់ថ្នាក់ និងការតំរែតំរង់។ ពួកវាដំណើរការដោយការជង់ស្រទាប់ជាច្រើននៃថ្នាំងដែលភ្ជាប់គ្នា ឬណឺរ៉ូន ដោយស្រទាប់នីមួយៗផ្លាស់ប្តូរទិន្នន័យចូលមិនត្រង់បន្ទាត់។
នៅក្នុង MLP ណឺរ៉ូននីមួយៗទទួលការបញ្ចូលពីណឺរ៉ូនក្នុងស្រទាប់ខាងក្រោម ហើយបញ្ជូនសញ្ញាទៅណឺរ៉ូនក្នុងស្រទាប់ខាងលើ។ លទ្ធផលនៃណឺរ៉ូននីមួយៗត្រូវបានកំណត់ដោយប្រើមុខងារធ្វើឱ្យសកម្ម ដែលផ្តល់ឱ្យបណ្តាញ nonlinearity ។
ពួកគេមានសមត្ថភាពក្នុងការរៀនតំណាងស្មុគ្រស្មាញនៃទិន្នន័យបញ្ចូលចាប់តាំងពីពួកគេអាចមានស្រទាប់លាក់ជាច្រើន។
MLPs ត្រូវបានគេអនុវត្តចំពោះកិច្ចការជាច្រើនដូចជាការវិភាគមនោសញ្ចេតនា ការរកឃើញការក្លែងបន្លំ និងការទទួលស្គាល់សំឡេង និងរូបភាព។ MLPs អាចត្រូវបានប្រៀបធៀបទៅនឹងក្រុមអ្នកស៊ើបអង្កេតដែលធ្វើការរួមគ្នាដើម្បីបំបែកសំណុំរឿងដ៏លំបាកមួយ។
រួមគ្នា ពួកគេអាចរួមបញ្ជូលអង្គហេតុ និងដោះស្រាយឧក្រិដ្ឋកម្ម ទោះបីជាការពិតនីមួយៗមានជំនាញពិសេសក៏ដោយ។
12. Convolutional Neural Networks (CNNs)
រូបភាព និងវីដេអូត្រូវបានដំណើរការដោយប្រើបណ្តាញប្រសាទប្រសាទ (CNNs) ដែលជាទម្រង់នៃបណ្តាញសរសៃប្រសាទ។ ពួកវាដំណើរការដោយប្រើប្រាស់សំណុំនៃតម្រងដែលអាចរៀនបាន ឬខឺណែល ដើម្បីទាញយកលក្ខណៈសំខាន់ៗពីទិន្នន័យបញ្ចូល។
តម្រងរំកិលលើរូបភាពបញ្ចូល ដោយអនុវត្តការរួមគ្នាដើម្បីបង្កើតផែនទីលក្ខណៈពិសេសដែលចាប់យកទិដ្ឋភាពសំខាន់ៗនៃរូបភាព។
ដោយសារ CNNs អាចរៀនតំណាងឋានានុក្រមនៃលក្ខណៈរូបភាព ពួកវាមានប្រយោជន៍ជាពិសេសសម្រាប់ស្ថានភាពដែលទាក់ទងនឹងបរិមាណដ៏ធំនៃទិន្នន័យដែលមើលឃើញ។ កម្មវិធីជាច្រើនបានប្រើប្រាស់ពួកវា ដូចជាការរកឃើញវត្ថុ ការបែងចែករូបភាព និងការចាប់មុខ។
ពិចារណា CNNs ជាវិចិត្រករម្នាក់ដែលប្រើជក់ជាច្រើនដើម្បីបង្កើតស្នាដៃ។ ជក់នីមួយៗគឺជាខឺណែល ហើយវិចិត្រករអាចបង្កើតរូបភាពដ៏ស្មុគស្មាញ និងជាក់ស្តែងដោយលាយខឺណែលជាច្រើន។ យើងអាចទាញយកលក្ខណៈសំខាន់ៗពីរូបថត និងប្រើប្រាស់ពួកវាដើម្បីព្យាករណ៍មាតិកានៃរូបភាពបានយ៉ាងត្រឹមត្រូវដោយប្រើប្រាស់ CNNs ។
13. បណ្តាញជំនឿជ្រៅ (DBNs)
DBNs គឺជាទម្រង់នៃបណ្តាញសរសៃប្រសាទដែលត្រូវបានប្រើសម្រាប់កិច្ចការសិក្សាដែលមិនមានការត្រួតពិនិត្យដូចជាការកាត់បន្ថយវិមាត្រ និងការរៀនលក្ខណៈ។ ពួកវាដំណើរការដោយការដាក់ស្រទាប់ជាច្រើននៃ Restricted Boltzmann Machines (RBMs) ដែលជាបណ្តាញសរសៃប្រសាទពីរស្រទាប់ដែលមានសមត្ថភាពរៀនបង្កើតទិន្នន័យបញ្ចូលឡើងវិញ។
DBNs មានប្រយោជន៍ខ្លាំងណាស់សម្រាប់បញ្ហាទិន្នន័យវិមាត្រខ្ពស់ ដោយសារតែពួកគេអាចរៀនតំណាងដ៏តូច និងមានប្រសិទ្ធភាពនៃការបញ្ចូល។ ពួកវាត្រូវបានប្រើប្រាស់សម្រាប់អ្វីទាំងអស់ ចាប់ពីការទទួលស្គាល់ដោយសំឡេង រហូតដល់ការចាត់ថ្នាក់រូបភាព រហូតដល់ការរកឃើញគ្រឿងញៀន។
ឧទាហរណ៍ អ្នកស្រាវជ្រាវបានប្រើ DBN ដើម្បីប៉ាន់ប្រមាណភាពជាប់ទាក់ទងគ្នានៃបេក្ខជនថ្នាំទៅនឹងអ្នកទទួលអរម៉ូនអ៊ឹស្ត្រូសែន។ DBN ត្រូវបានបណ្តុះបណ្តាលលើបណ្តុំនៃលក្ខណៈគីមី និងភាពជាប់ទាក់ទងគ្នា ហើយវាអាចទស្សន៍ទាយបានយ៉ាងត្រឹមត្រូវអំពីភាពជាប់ទាក់ទងនៃបេក្ខជនឱសថប្រលោមលោក។
នេះបង្ហាញពីការប្រើប្រាស់ DBNs ក្នុងការអភិវឌ្ឍន៍ថ្នាំ និងកម្មវិធីទិន្នន័យវិមាត្រខ្ពស់ផ្សេងទៀត។
14. ឧបករណ៍បំលែងកូដស្វ័យប្រវត្តិ
Autoencoders គឺជាបណ្តាញសរសៃប្រសាទដែលត្រូវបានប្រើប្រាស់សម្រាប់កិច្ចការសិក្សាដែលមិនមានការត្រួតពិនិត្យ។ ពួកគេមានបំណងបង្កើតទិន្នន័យបញ្ចូលឡើងវិញ ដែលបង្កប់ន័យថាពួកគេនឹងរៀនអ៊ិនកូដព័ត៌មានទៅជាតំណាងបង្រួម និងបន្ទាប់មកឌិកូដវាត្រឡប់ទៅធាតុបញ្ចូលដើមវិញ។
Autoencoders មានប្រសិទ្ធភាពខ្លាំងណាស់សម្រាប់ការបង្ហាប់ទិន្នន័យ ការដកសំលេងរំខាន និងការរកឃើញភាពមិនប្រក្រតី។ ពួកវាក៏អាចត្រូវបានប្រើសម្រាប់ការរៀនលក្ខណៈផងដែរ ដែលតំណាងបង្រួមតូចរបស់កម្មវិធីបម្លែងកូដស្វ័យប្រវត្តិត្រូវបានបញ្ចូលទៅក្នុងកិច្ចការសិក្សាដែលមានការគ្រប់គ្រង។
ពិចារណាថា autoencoders ជាសិស្សដែលកត់ចំណាំនៅក្នុងថ្នាក់។ សិស្សស្តាប់ការបង្រៀន ហើយរៀបរាប់ចំណុចដែលពាក់ព័ន្ធបំផុតក្នុងលក្ខណៈសង្ខេប និងមានប្រសិទ្ធភាព។
ក្រោយមក សិស្សអាចសិក្សា ហើយចងចាំមេរៀនដោយប្រើកំណត់ចំណាំរបស់ពួកគេ។ ម៉្យាងវិញទៀត autoencoder បំប្លែងទិន្នន័យបញ្ចូលទៅជាតំណាងបង្រួម ដែលអាចត្រូវបានប្រើប្រាស់ជាបន្តបន្ទាប់សម្រាប់គោលបំណងផ្សេងៗ ដូចជាការរកឃើញភាពមិនប្រក្រតី ឬការបង្រួមទិន្នន័យ។
15. ម៉ាស៊ីន Boltzmann បានដាក់កម្រិត (RBMs)
RBMs (Restricted Boltzmann Machines) គឺជាប្រភេទនៃបណ្តាញសរសៃប្រសាទទូទៅដែលត្រូវបានប្រើសម្រាប់កិច្ចការសិក្សាដែលមិនមានការត្រួតពិនិត្យ។ ពួកវាត្រូវបានបង្កើតឡើងពីស្រទាប់ដែលអាចមើលឃើញ និងស្រទាប់លាក់កំបាំង ដោយមានណឺរ៉ូននៅក្នុងស្រទាប់នីមួយៗភ្ជាប់គ្នា ប៉ុន្តែមិនមែននៅក្នុងស្រទាប់តែមួយនោះទេ។
RBMs ត្រូវបានបណ្តុះបណ្តាលដោយប្រើបច្ចេកទេសដែលគេស្គាល់ថាជា contrastive divergence ដែលរួមបញ្ចូលការផ្លាស់ប្តូរទម្ងន់រវាងស្រទាប់ដែលអាចមើលឃើញ និងលាក់ ដើម្បីបង្កើនប្រសិទ្ធភាពប្រូបាប៊ីលីតេនៃទិន្នន័យបណ្តុះបណ្តាល។ RBMs អាចបង្កើតទិន្នន័យថ្មី បន្ទាប់ពីត្រូវបានបណ្តុះបណ្តាលដោយការយកគំរូពីការចែកចាយដែលបានសិក្សា។
ការទទួលស្គាល់រូបភាព និងការនិយាយ ការត្រងសហការ និងការរកឃើញភាពមិនប្រក្រតី គឺជាកម្មវិធីទាំងអស់ដែលបានប្រើប្រាស់ RBMs ។ ពួកវាក៏ត្រូវបានប្រើប្រាស់នៅក្នុងប្រព័ន្ធណែនាំផងដែរ ដើម្បីបង្កើតការណែនាំដែលតម្រូវដោយការសិក្សាគំរូពីអាកប្បកិរិយារបស់អ្នកប្រើប្រាស់។
RBMs ក៏ត្រូវបានប្រើក្នុងការសិក្សាលក្ខណៈពិសេសផងដែរដើម្បីបង្កើតការតំណាងបង្រួមនិងមានប្រសិទ្ធិភាពនៃទិន្នន័យវិមាត្រខ្ពស់។
ការបញ្ចប់ និងការអភិវឌ្ឍន៍ប្រកបដោយជោគជ័យនៅលើផ្តេក
វិធីសាស្រ្តសិក្សាយ៉ាងស៊ីជម្រៅ ដូចជាបណ្តាញសរសៃប្រសាទ Convolutional (CNNs) និងបណ្តាញសរសៃប្រសាទកើតឡើងវិញ (RNNs) គឺស្ថិតក្នុងចំណោមវិធីសាស្រ្តបញ្ញាសិប្បនិម្មិតកម្រិតខ្ពស់បំផុត។ CNNs បានផ្លាស់ប្តូរការទទួលស្គាល់រូបភាព និងសំឡេង ខណៈពេលដែល RNNs បានរីកចម្រើនយ៉ាងខ្លាំងនៅក្នុងដំណើរការភាសាធម្មជាតិ និងការវិភាគទិន្នន័យតាមលំដាប់លំដោយ។
ជំហានបន្ទាប់ក្នុងការវិវត្តន៍នៃវិធីសាស្រ្តទាំងនេះ ទំនងជាផ្តោតលើការកែលម្អប្រសិទ្ធភាព និងទំហំរបស់វា ដែលអនុញ្ញាតឱ្យពួកគេវិភាគសំណុំទិន្នន័យកាន់តែធំ និងស្មុគស្មាញ ក៏ដូចជាការបង្កើនការបកស្រាយ និងសមត្ថភាពក្នុងការរៀនពីទិន្នន័យដែលមានស្លាកតិចជាង។
ការរៀនសូត្រស៊ីជម្រៅមានលទ្ធភាពអនុញ្ញាតឱ្យមានរបកគំហើញនៅក្នុងវិស័យដូចជាការថែទាំសុខភាព ហិរញ្ញវត្ថុ និងប្រព័ន្ធស្វយ័ត នៅពេលវារីកចម្រើន។
សូមផ្ដល់យោបល់