Kwa miaka mingi, kujifunza kwa kina kumekuwa kukipamba vichwa vya habari katika teknolojia. Na, ni rahisi kuelewa kwa nini.
Tawi hili la akili bandia linabadilisha sekta kuanzia huduma ya afya hadi benki hadi usafiri, na hivyo kuwezesha maendeleo ambayo hayakufikiriwa hapo awali.
Kujifunza kwa kina hujengwa juu ya seti ya algoriti za hali ya juu ambazo hujifunza kutoa na kutabiri mifumo changamano kutoka kwa wingi mkubwa wa data.
Tutaangalia algoriti 15 bora zaidi za ujifunzaji katika chapisho hili, kutoka kwa Mitandao ya Neural Convolutional hadi Mitandao ya Uzalishaji ya Adui hadi mitandao ya Kumbukumbu ya Muda Mrefu.
Chapisho hili litatoa maarifa muhimu kama wewe ni a anayeanza au mtaalam wa kujifunza kwa kina.
1. Mitandao ya Transfoma
Mitandao ya transfoma imebadilika maono ya kompyuta na maombi ya usindikaji wa lugha asilia (NLP). Wanachanganua data inayoingia na hutumia michakato ya umakini ili kunasa uhusiano wa masafa marefu. Hii huwafanya kuwa wepesi zaidi kuliko miundo ya kawaida ya mfuatano hadi-mfuatano.
Mitandao ya transfoma ilielezewa kwa mara ya kwanza katika chapisho la "Tahadhari Ndio Wote Unaohitaji" na Vaswani et al.
Zinajumuisha encoder na avkodare (2017). Mfano wa transformer umeonyesha utendaji katika aina mbalimbali za maombi ya NLP, ikiwa ni pamoja na uchambuzi wa hisia, uainishaji wa maandishi, na tafsiri ya mashine.
Miundo inayotegemea transfoma pia inaweza kutumika katika maono ya kompyuta kwa programu. Wanaweza kutekeleza utambuzi wa kitu na manukuu ya picha.
2. Mitandao ya Kumbukumbu ya Muda Mrefu (LSTMs)
Mitandao ya Kumbukumbu ya Muda Mrefu (LSTMs) ni aina ya neural mtandao iliyojengwa haswa kushughulikia uingizaji wa mtiririko. Wanajulikana kama "muda mfupi wa muda mrefu" kwa sababu wanaweza kukumbuka ujuzi wa muda mrefu uliopita na pia kusahau habari zisizohitajika.
LSTM hufanya kazi kupitia baadhi ya "milango" ambayo inasimamia mtiririko wa taarifa ndani ya mtandao. Kulingana na ikiwa habari inachukuliwa kuwa muhimu au la, milango hii inaweza kuiruhusu kuingia au kuizuia.
Mbinu hii huwezesha LSTM kukumbuka au kusahau maelezo kutoka kwa hatua za wakati uliopita, ambayo ni muhimu kwa kazi kama vile utambuzi wa usemi, uchakataji wa lugha asilia na ubashiri wa mfululizo wa saa.
LSTM ni ya manufaa sana katika hali yoyote ambapo una data mfuatano ambayo inapaswa kutathminiwa au kutabiriwa. Mara nyingi hutumiwa katika programu ya utambuzi wa sauti kubadilisha maneno yaliyotamkwa kuwa maandishi, au ndani soko la hisa uchambuzi wa kutabiri bei za siku zijazo kulingana na data ya awali.
3. Ramani za Kujipanga (SOMs)
SOM ni aina ya bandia mtandao wa neural ambao unaweza kujifunza na kuwakilisha data ngumu katika mazingira ya chini-dimensional. Mbinu hufanya kazi kwa kubadilisha data ya pembejeo ya hali ya juu kuwa gridi ya pande mbili, na kila kitengo au neuroni inawakilisha sehemu tofauti ya nafasi ya kuingiza.
Neuroni zimeunganishwa pamoja na kuunda muundo wa kitopolojia, kuziruhusu kujifunza na kurekebisha data ya ingizo. Kwa hivyo, SOM inategemea kujifunza bila kusimamiwa.
Algorithm haihitaji data yenye lebo kujifunza kutoka. Badala yake, hutumia vipengele vya takwimu vya data ya ingizo ili kugundua ruwaza na uwiano kati ya vigeuzo.
Wakati wa hatua ya mafunzo, niuroni hushindana kuwa kielelezo bora cha data ya ingizo. Na, wanajipanga katika muundo wa maana. SOM zina anuwai ya programu, ikijumuisha utambuzi wa picha na usemi, uchimbaji data, na utambuzi wa muundo.
Wao ni muhimu kwa kuibua data ngumu, kuunganisha pointi za data zinazohusiana, na kugundua kasoro au bidhaa za nje.
4. Mafunzo ya Kuimarisha Kina
Deep Kuimarisha Kujifunza ni aina ya kujifunza kwa mashine ambapo wakala anafunzwa kufanya maamuzi kulingana na mfumo wa zawadi. Inafanya kazi kwa kuruhusu wakala kuingiliana na mazingira yake na kujifunza kupitia majaribio na makosa.
Wakala hutuzwa kwa kila hatua anayofanya, na madhumuni yake ni kujifunza jinsi ya kuboresha manufaa yake baada ya muda. Hii inaweza kutumika kufundisha mawakala kucheza michezo, kuendesha magari na hata kudhibiti roboti.
Q-Learning ni mbinu inayojulikana ya Kukuza Uimarishaji wa Kina. Hufanya kazi kwa kutathmini thamani ya kufanya kitendo fulani katika hali fulani na kusasisha makadirio hayo kwani wakala anaingiliana na mazingira.
Kisha wakala hutumia makadirio haya ili kubaini ni hatua gani ina uwezekano mkubwa wa kusababisha zawadi kubwa zaidi. Q-Learning imetumiwa kuelimisha mawakala kucheza michezo ya Atari, na pia kuboresha matumizi ya nishati katika vituo vya data.
Deep Q-Networks ni njia nyingine maarufu ya Kujifunza ya Kuimarisha Kina (DQN). DQN ni sawa na Q-Learning kwa kuwa wanakadiria maadili ya vitendo kwa kutumia mtandao wa kina wa neva badala ya jedwali.
Hii inawawezesha kushughulika na mipangilio mikubwa, ngumu na vitendo vingi mbadala. DQN zimetumika kuwafunza mawakala kucheza michezo kama vile Go na Dota 2, na pia kuunda roboti zinazoweza kujifunza kutembea.
5. Mitandao ya Neural ya Kawaida (RNNs)
RNN ni aina ya mtandao wa neva ambao unaweza kuchakata data mfuatano huku ukiweka hali ya ndani. Lifikirie kama mtu anayesoma kitabu, ambapo kila neno humeng'enywa kwa uhusiano na yale yaliyotangulia.
Kwa hivyo RNN ni bora kwa kazi kama vile utambuzi wa usemi, tafsiri ya lugha, na hata kutabiri neno linalofuata katika kifungu cha maneno.
RNN hufanya kazi kwa kutumia misururu ya maoni ili kuunganisha matokeo ya kila hatua ya kurudi kwenye ingizo la hatua inayofuata. Hii huwezesha mtandao kutumia maelezo ya hatua ya awali ili kufahamisha ubashiri wake kwa hatua za wakati ujao. Kwa bahati mbaya, hii pia inamaanisha kuwa RNN zinaweza kuathiriwa na suala la kutoweka kwa gradient, ambapo gradient zinazotumiwa kwa mafunzo huwa ndogo sana na mtandao unatatizika kujifunza uhusiano wa muda mrefu.
Licha ya kikwazo hiki dhahiri, RNN zimepata matumizi katika anuwai ya matumizi. Programu hizi ni pamoja na usindikaji wa lugha asilia, utambuzi wa usemi, na hata utengenezaji wa muziki.
Google Tafsiri, kwa mfano, hutumia mfumo unaotegemea RNN kutafsiri katika lugha zote, huku Siri, msaidizi pepe, akitumia mfumo wa RNN kutambua sauti. RNN pia zimetumika kutabiri bei za hisa na kuunda maandishi na michoro halisi.
6. Mitandao ya Kibonge
Capsule Networks ni aina mpya ya muundo wa mtandao wa neva ambao unaweza kutambua ruwaza na uunganisho wa data kwa ufanisi zaidi. Hupanga nyuroni kuwa "vidonge" ambavyo husimba vipengele fulani vya ingizo.
Kwa njia hii wanaweza kufanya utabiri sahihi zaidi. Mitandao ya Kibonge huchota sifa changamano hatua kwa hatua kutoka kwa data ya ingizo kwa kutumia tabaka nyingi za kapsuli.
Mbinu ya Mitandao ya Vibonge huwawezesha kujifunza uwakilishi wa ngazi ya juu wa ingizo lililotolewa. Wanaweza kusimba vizuri miunganisho ya anga kati ya vitu vilivyo ndani ya picha kwa kuwasiliana kati ya vidonge.
Kitambulisho cha kitu, sehemu za picha, na usindikaji wa lugha asilia zote ni matumizi ya Mitandao ya Kibonge.
Mitandao ya Capsule ina uwezo wa kuajiriwa ndani uhuru wa kuendesha gari teknolojia. Wanasaidia mfumo katika kutambua na kutofautisha kati ya vitu kama vile magari, watu na ishara za trafiki. Mifumo hii inaweza kuzuia migongano kwa kufanya utabiri sahihi zaidi kuhusu tabia ya vitu katika mazingira yao.
7. Visimbaji Kiotomatiki tofauti (VAEs)
VAEs ni aina ya zana ya kujifunza kwa kina ambayo hutumiwa kwa ujifunzaji usiosimamiwa. Kwa kusimba data katika nafasi ya chini-dimensional na kisha kuiweka katika umbizo halisi, wanaweza kujifunza kutambua ruwaza katika data.
Wao ni kama mchawi anayeweza kubadilisha sungura kuwa kofia kisha kumrudisha kuwa sungura! VAE ni manufaa kwa kutoa taswira au muziki halisi. Na, zinaweza kutumika kutoa data mpya ambayo inaweza kulinganishwa na data asili.
VAE ni sawa na kivunja kanuni za siri. Wanaweza kugundua msingi muundo wa data kwa kuigawanya katika vipande rahisi zaidi, kama vile jinsi fumbo linachambuliwa. Wanaweza kutumia maelezo hayo kuunda data mpya ambayo inaonekana kama ya awali baada ya kupanga sehemu.
Hii inaweza kuwa rahisi kwa kubana faili kubwa sana au kutoa picha mpya au muziki katika mtindo fulani. VAE pia inaweza kutoa maudhui mapya, kama vile hadithi za habari au maneno ya muziki.
8. Mitandao ya Kiadui inayozalisha (GANs)
GANs (Generative Adversarial Networks) ni aina ya mfumo wa kina wa kujifunza ambao hutoa data mpya inayofanana na ya awali. Wanafanya kazi kwa kufundisha mitandao miwili: jenereta na mtandao wa kibaguzi.
Jenereta hutoa data mpya ambayo inaweza kulinganishwa na ya asili.
Na, kibaguzi hujaribu kutofautisha kati ya data asili na iliyoundwa. Mitandao hiyo miwili imefunzwa sanjari, huku jenereta ikijaribu kuhadaa mbaguzi na mbaguzi akijaribu kubainisha data asili ipasavyo.
Fikiria GAN kuwa msalaba kati ya ghushi na mpelelezi. Jenereta hufanya kazi sawa na ghushi, ikitoa mchoro mpya unaofanana na asili.
Mbaguzi hufanya kama mpelelezi, akijaribu kutofautisha kati ya mchoro halisi na ughushi. Mitandao hiyo miwili imefunzwa sanjari, huku jenereta ikiimarika katika kutengeneza feki zinazokubalika na mbaguzi akiimarika katika kuzitambua.
GAN zina matumizi kadhaa, kuanzia kutoa picha halisi za wanadamu au wanyama hadi kuunda muziki mpya au maandishi. Zinaweza pia kutumika kwa uongezaji data, unaojumuisha kuchanganya data iliyozalishwa na data halisi ili kuunda mkusanyiko mkubwa wa data wa miundo ya mafunzo ya mashine.
9. Deep Q-Networks (DQNs)
Deep Q-Networks (DQNs) ni aina ya kanuni za uimarishaji za kufanya maamuzi. Wanafanya kazi kwa kujifunza kazi ya Q inayotabiri malipo yanayotarajiwa kwa kufanya kitendo fulani katika hali fulani.
Kazi ya Q inafundishwa kwa majaribio na makosa, huku kanuni ikijaribu vitendo mbalimbali na kujifunza kutokana na matokeo.
Ichukulie kama a mchezo video mhusika akijaribu matendo mbalimbali na kugundua yapi yanapelekea mafanikio! DQN hufunza kazi ya Q kwa kutumia mtandao wa kina wa neva, na kuifanya kuwa zana bora kwa kazi ngumu za kufanya maamuzi.
Wamewashinda hata mabingwa wa binadamu katika michezo kama vile Go na chess, na pia katika robotiki na magari yanayojiendesha. Kwa hivyo, kwa ujumla, DQN hufanya kazi kwa kujifunza kutokana na uzoefu ili kuboresha ujuzi wao wa kufanya maamuzi kwa wakati.
10. Mitandao ya Kazi ya Msingi wa Radi (RBFNs)
Mitandao ya Utendakazi ya Msingi wa Radi (RBFNs) ni aina ya mtandao wa neva ambao hutumiwa kukadiria utendakazi na kutekeleza majukumu ya uainishaji. Hufanya kazi kwa kubadilisha data ya ingizo kuwa nafasi ya juu-dimensional kwa kutumia mkusanyiko wa vitendakazi vya msingi wa radial.
Matokeo ya mtandao ni mchanganyiko wa mstari wa kazi za msingi, na kila kazi ya msingi ya radial inawakilisha sehemu ya katikati katika nafasi ya uingizaji.
RBFN zinafaa hasa kwa hali zenye mwingiliano changamano wa pato-ingizo, na zinaweza kufundishwa kwa kutumia mbinu mbalimbali, ikiwa ni pamoja na ujifunzaji unaosimamiwa na usiosimamiwa. Zimetumika kwa chochote kuanzia utabiri wa fedha hadi utambuzi wa picha na usemi hadi uchunguzi wa kimatibabu.
Zingatia RBFN kama mfumo wa GPS unaotumia safu ya sehemu za nanga kutafuta njia ya kuvuka ardhi yenye changamoto. Pato la mtandao ni mchanganyiko wa pointi za nanga, ambazo zinasimama kwa kazi za msingi wa radial.
Tunaweza kuvinjari taarifa changamano na kutoa ubashiri sahihi kuhusu jinsi hali itakavyokuwa kwa kutumia RBFN.
11. Vielelezo vya Multilayer (MLPs)
Aina ya kawaida ya mtandao wa neva unaoitwa multilayer perceptron (MLP) hutumiwa kwa kazi za kujifunza zinazosimamiwa kama vile uainishaji na urejeleaji. Hufanya kazi kwa kuweka tabaka kadhaa za nodi zilizounganishwa, au niuroni, huku kila safu ikibadilisha data inayoingia bila mstari.
Katika MLP, kila neuroni hupata ingizo kutoka kwa niuroni katika safu iliyo hapa chini na kutuma ishara kwa niuroni katika safu iliyo juu. Kila pato la niuroni hubainishwa kwa kutumia chaguo la kukokotoa la kuwezesha, ambalo hupa mtandao kutokuwa na mstari.
Wana uwezo wa kujifunza uwasilishaji wa hali ya juu wa data ya ingizo kwani wanaweza kuwa na tabaka kadhaa zilizofichwa.
MLP zimetumika kwa kazi mbalimbali, kama vile uchanganuzi wa hisia, utambuzi wa ulaghai, na utambuzi wa sauti na picha. MLP zinaweza kulinganishwa na kundi la wachunguzi wanaofanya kazi pamoja ili kutatua kesi ngumu.
Kwa pamoja, wanaweza kuunganisha ukweli na kutatua uhalifu licha ya ukweli kwamba kila mmoja ana eneo fulani la utaalam.
12. Mitandao ya Neural Convolutional (CNNs)
Picha na video huchakatwa kwa kutumia mitandao ya neva ya kubadilisha (CNNs), aina ya mtandao wa neva. Hufanya kazi kwa kutumia seti ya vichujio vinavyoweza kujifunza, au kernels, ili kutoa sifa muhimu kutoka kwa data ya ingizo.
Vichujio huteleza juu ya picha ya ingizo, vikifanya miunganisho ili kuunda ramani ya vipengele inayonasa vipengele muhimu vya picha.
Kwa vile CNN zinaweza kujifunza uwasilishaji wa daraja la sifa za picha, husaidia sana katika hali zinazohusisha idadi kubwa ya data inayoonekana. Programu nyingi zimezitumia, kama vile utambuzi wa kitu, uainishaji wa picha, na utambuzi wa nyuso.
Fikiria CNN kama mchoraji anayetumia brashi kadhaa kuunda kazi bora. Kila brashi ni punje, na msanii anaweza kujenga taswira tata, halisi kwa kuchanganya punje nyingi. Tunaweza kutoa sifa muhimu kutoka kwa picha na kuzitumia kutabiri kwa usahihi yaliyomo kwenye picha kwa kutumia CNN.
13. Mitandao ya Kina (DBNs)
DBN ni aina ya mtandao wa neva ambao hutumiwa kwa kazi za kujifunza zisizosimamiwa kama vile kupunguza vipimo na ujifunzaji wa vipengele. Hufanya kazi kwa kuweka safu kadhaa za Mashine za Boltzmann Zilizozuiliwa (RBMs), ambazo ni mitandao ya neural ya safu mbili inayoweza kujifunza kuunda upya data ya ingizo.
DBN zina manufaa sana kwa masuala ya data ya hali ya juu kwa sababu zinaweza kujifunza uwakilishi thabiti na bora wa ingizo. Zimetumika kwa chochote kuanzia utambuzi wa sauti hadi uainishaji wa picha hadi ugunduzi wa dawa za kulevya.
Kwa mfano, watafiti waliajiri DBN kukadiria uhusiano wa kisheria wa watahiniwa wa dawa kwa kipokezi cha estrojeni. DBN ilifunzwa juu ya mkusanyiko wa sifa za kemikali na uhusiano wa kisheria, na iliweza kutabiri kwa usahihi uhusiano wa lazima wa watahiniwa wa riwaya wa dawa.
Hii inaangazia matumizi ya DBN katika ukuzaji wa dawa na programu zingine za data za hali ya juu.
14. Visimbaji otomatiki
Visimbaji otomatiki ni mitandao ya neural ambayo hutumiwa kwa kazi za kujifunza zisizosimamiwa. Zinakusudiwa kuunda upya data ya ingizo, ambayo ina maana kwamba watajifunza kusimba maelezo katika uwakilishi wa kompakt na kisha kusimbua tena katika ingizo la asili.
Visimbaji otomatiki ni bora sana kwa ukandamizaji wa data, uondoaji wa kelele na utambuzi wa hitilafu. Zinaweza pia kutumika kwa ajili ya ujifunzaji wa vipengele, ambapo uwakilishi fumbatio wa kisimbaji kiotomatiki hutolewa katika kazi ya kujifunza inayosimamiwa.
Zingatia visimbaji otomatiki kuwa wanafunzi wanaoandika madokezo darasani. Mwanafunzi anasikiliza mhadhara na kuandika mambo muhimu zaidi kwa ufupi na kwa ufanisi.
Baadaye, mwanafunzi anaweza kujifunza na kukumbuka somo kwa kutumia maandishi yao. Kisimbaji kiotomatiki, kwa upande mwingine, husimba data ya ingizo kuwa kiwakilishi chanya ambacho kinaweza kutumika baadaye kwa madhumuni tofauti kama vile ugunduzi wa hitilafu au ugandamizaji wa data.
15. Mashine za Boltzmann Zilizozuiwa (RBMs)
RBM (Mashine za Boltzmann Zilizozuiliwa) ni aina ya mtandao wa neva ambao hutumika kwa kazi za kujifunza bila kusimamiwa. Zinaundwa na safu inayoonekana na safu iliyofichwa, yenye neurons katika kila safu, iliyounganishwa lakini sio ndani ya safu sawa.
RBM hufunzwa kwa kutumia mbinu inayojulikana kama tofauti tofauti, ambayo inajumuisha kubadilisha uzani kati ya tabaka zinazoonekana na zilizofichwa ili kuongeza uwezekano wa data ya mafunzo. RBM zinaweza kuunda data mpya baada ya kufunzwa kwa sampuli kutoka kwa usambazaji uliojifunza.
Utambuzi wa picha na usemi, uchujaji shirikishi, na utambuzi wa hitilafu zote ni programu ambazo zimetumia RBM. Pia zimetumika katika mifumo ya mapendekezo ili kuunda mapendekezo yaliyolengwa kwa kujifunza mifumo kutoka kwa tabia ya mtumiaji.
RBM pia zimetumika katika ujifunzaji wa vipengele ili kuunda uwakilishi thabiti na bora wa data ya hali ya juu.
Hitimisho na Maendeleo ya Kuahidi kwenye Upeo wa Macho
Mbinu za kujifunza kwa kina, kama vile Mitandao ya Neural ya Kubadilisha (CNNs) na Mitandao ya Kawaida ya Neural (RNNs), ni kati ya mbinu za juu zaidi za akili za bandia. CNN zimebadilisha utambuzi wa picha na sauti, huku RNN zimeendelea kwa kiwango kikubwa katika uchakataji wa lugha asilia na uchanganuzi wa data mfuatano.
Hatua inayofuata katika mageuzi ya mbinu hizi huenda ikalenga kuboresha ufanisi na upanuzi wao, na kuziruhusu kuchanganua hifadhidata kubwa na ngumu zaidi, na pia kuboresha tafsiri na uwezo wao wa kujifunza kutoka kwa data isiyo na lebo.
Kujifunza kwa kina kuna uwezekano wa kuruhusu mafanikio katika nyanja kama vile huduma ya afya, fedha, na mifumo ya uhuru inapoendelea.
Acha Reply