Aynu qiyaaso inaad isku dayayso inaad barato robot sida loo socdo. Si ka duwan sida loo baro kombuyuutarka sida loo saadaaliyo qiimaha saamiyada ama loo kala saaro sawirada, ma hayno xog-ururin weyn oo aan u isticmaali karno inaan ku tababarno robotkeena.
Iyadoo laga yaabo inay si dabiici ah kuugu timaado, socodku dhab ahaantii waa fal aad u adag. Socodka tillaabo caadi ahaan waxay ku lug leedahay daraasiin muruqyo kala duwan oo wada shaqeynaya. Dedaalka iyo farsamooyinka loo isticmaalo in meel loo socdo oo loo socdo waxa kale oo ay ku xidhan yihiin arrimo kala duwan, oo ay ka mid yihiin haddii aad wax siddo ama haddii ay jiraan foorarsi ama qaabab kale oo caqabado ah.
Xaaladahan oo kale, waxaan isticmaali karnaa habka loo yaqaan xoojinta barashada ama RL. RL, waxaad ku qeexi kartaa hadaf gaar ah oo aad rabto in modelkaagu uu xalliyo oo si tartiib tartiib ah u oggolow mooduhu inuu iskii u barto sida loo fuliyo.
Maqaalkan, waxaan ku baari doonaa aasaaska barashada xoojinta iyo sida aan ugu dabaqi karno qaabka RL ee dhibaatooyinka kala duwan ee adduunka dhabta ah.
Waa maxay barashada xoojinta?
Barashada xoojinta waxa loola jeedaa qayb-hoosaad gaar ah oo ka mid ah barashada mashiinka kaas oo diiradda saaraya sidii xal loogu heli lahaa iyadoo lagu abaal marinayo dhaqamada la rabo laguna ciqaabayo dhaqamada aan la rabin.
Si ka duwan waxbarashada la kormeero, habka barashada xoojinta sida caadiga ah ma laha xog-ururin tababar oo bixisa wax-soo-saarka saxda ah ee talobixin la bixiyay. Maqnaanshaha xogta tababarka, algorithm waa in uu xal u helo iyada oo loo marayo tijaabo iyo qalad. Algorithm-ka, oo aan sida caadiga ah u tixraacno sida an wakiilka, waa in uu iskiis u raadiyaa xalka isagoo la falgalaya deegaanka.
Cilmi-baarayaashu waxay go'aansadaan natiijooyinka gaarka ah ee soo baxaya abaalmarin iyo waxa algorithm awood u leeyahay inuu sameeyo. Mid walba tallaabo Algorithm-ka uu qaato wuxuu heli doonaa nooc ka mid ah jawaab-celinta taasoo keenaysa sida wanaagsan ee algoorithm u shaqeynayo. Inta lagu jiro habka tababarka, algorithm-ka ayaa ugu dambeyntii heli doona xalka ugu fiican si loo xalliyo dhibaato gaar ah.
Tusaale Fudud: 4×4 Grid
Aan eegno tusaale fudud oo ah dhibaatada aan ku xallin karno xoojinta barashada.
Ka soo qaad in aan haysano 4×4 grid deegaan ahaan. Wakiilkayagu si aan kala sooc lahayn ayaa loo dhigayaa mid ka mid ah fagaarayaasha oo ay la socdaan caqabado yar. Shabaggu waa inuu ka koobnaadaa saddex caqabadood oo “god” ah oo ay tahay in laga fogaado iyo hal abaal-marin “dheeman” ah oo wakiilku ay tahay inuu helo. Sharaxaada dhamaystiran ee deegaankeena waxa loo yaqaan deegaanka gobolka.
Qaabkayaga RL, wakiilkayagu waxa uu u dhaqaaqi karaa labajibbaaran kasta oo ku xiga ilaa iyo inta aanay jirin caqabado hortaagan. Isku dhafka dhammaan ficillada saxda ah ee deegaan la bixiyay waxaa loo yaqaan ' meel hawleed. Hadafka wakiilkeenu waa in la helo dariiqa ugu gaaban ee abaalmarinta.
Wakiilkayagu wuxuu isticmaali doonaa habka barashada xoojinta si uu u helo dariiqa dheemanka u baahan qadarka ugu yar ee tillaabooyinka. Tallaabo kasta oo sax ah waxay siin doontaa robotka abaal-marin, tallaabo kasta oo khaldan waxay ka jaraysaa abaalmarinta robot-ka. Qaabku wuxuu xisaabiyaa wadarta abaalmarinta marka wakiilku gaadho dheemanka.
Hadda oo aan qeexnay wakiilka iyo deegaanka, waa inaan sidoo kale qeexno xeerarka loo isticmaalo go'aaminta tallaabada xigta ee wakiilku qaadi doono iyadoo la eegayo xaaladda uu hadda joogo iyo deegaanka.
Siyaasadaha iyo Abaalmarinta
Qaabka barashada xoojinta, a siyaasadda waxaa loola jeedaa istiraatijiyadda uu isticmaalo wakiil si uu u gaaro yoolkiisa. Siyaasadda wakiilku waa ta go'aamisa waxa wakiilku sameeyo marka xigta iyadoo la eegayo xaaladda wakiilka iyo deegaankiisa.
Wakiilku waa inuu qiimeeyaa dhammaan siyaasadaha suurtagalka ah si uu u arko siyaasadda ugu fiican.
Tusaalahayaga fudud, ku degista meel bannaan waxay soo celin doontaa qiimaha -1. Marka wakiilku uu ku soo dego meel bannaan oo leh abaalmarinta dheeman, waxay heli doonaan qiime dhan 10. Isticmaalka qiyamkan, waxaan barbar dhigi karnaa siyaasadaha kala duwan iyadoo la adeegsanayo a shaqada utility U.
Aynu hadda is barbar dhigno waxtarka labada siyaasad ee kor lagu arkay:
U(A) = -1 - 1 -1 + 10 = 7
U(B) = -1 – 1 – 1 – 1 – 1 + 10 = 5
Natiijooyinka waxay muujinayaan in Siyaasadda A ay tahay dariiqa ugu wanaagsan ee lagu heli karo abaalmarinta. Markaa, wakiilku wuxuu isticmaali doonaa Jidka A ee ka sarreeya Siyaasadda B.
Sahaminta vs. Dhiig-miirashada
Dhibaatada ka-ganacsiga ee sahaminta iyo ka faa'iidaysiga ee waxbarashada xoojinta waa laba daran mid dooro wakiilku waa inuu la kulmo inta lagu jiro habka go'aanka.
Wakiiladu miyay diirada saaraan sahaminta wadooyin cusub ama doorashooyin mise waa inay sii wadaan ka faa'iidaysiga fursadaha ay hore u garanayeen?
Haddii wakiilku doorto inuu sahamiyo, waxaa jirta suurtogalnimada wakiilku inuu helo doorasho ka wanaagsan, laakiin sidoo kale waxay halis gelin kartaa waqti iyo kheyraad. Dhanka kale, haddii wakiilku doorto inuu ka faa'iidaysto xalka uu hore u yaqaan, waxaa laga yaabaa inay lumiso ikhtiyaar ka fiican.
Codsiyada wax ku oolka ah
Waa kuwan siyaabaha qaar Cilmi-baarayaasha AI waxay dabaqeen qaababka waxbarashada xoojinta si ay u xalliyaan mashaakilaadka aduunka dhabta ah:
Xoojinta Barashada Baabuurta Iswada
Barashada xoojinta ayaa lagu dabaqay baabuurta iswada si loo horumariyo awooda ay u wadaan si badbaado leh oo hufan. Tiknoolajiyadu waxay awood u siinaysaa baabuurta iskood u madaxbannaan inay wax ka bartaan khaladaadkooda oo ay si joogto ah u hagaajiyaan dabeecadooda si ay kor ugu qaadaan waxqabadkooda.
Tusaale ahaan, shirkadda AI ee fadhigeedu yahay London Way ayaa si guul leh u dabaqday qaabka waxbarashada xoojinta qoto dheer ee wadista madaxbannaanida. Tijaabadooda, waxay adeegsadeen shaqo abaal-marin ah oo kordhisa inta wakhtiga uu gaadhigu socdo iyada oo aanu darawalku wax talo ah bixin.
Moodooyinka RL waxay sidoo kale caawiyaan baabuurta inay gaaraan go'aamo ku salaysan deegaanka, sida ka fogaanshaha caqabadaha ama ku biirinta taraafikada. Moodooyinkani waa inay helaan hab ay ugu beddelaan jawiga adag ee ku hareeraysan baabuurka una beddelaan meel dawladeed oo matalaysa oo moodelku fahmi karo.
Xoojinta Barashada Robotics-ka
Cilmi-baarayaashu waxay sidoo kale adeegsanayeen barashada xoojinta si ay u horumariyaan robots kuwaas oo baran kara hawlo adag. Iyadoo loo marayo moodooyinkan RL, robotyadu waxay awoodaan inay ilaaliyaan deegaankooda oo ay gaaraan go'aamo ku salaysan indha-indhayntooda.
Tusaale ahaan, cilmi-baaris ayaa la sameeyay iyadoo la adeegsanayo moodooyinka barashada xoojinta si loogu oggolaado robot-yada laba-geesoodka ah inay bartaan sida loo sameeyo soco iyaga u gaar ah.
Cilmi-baarayaashu waxay u tixgeliyaan RL inay tahay habka ugu muhiimsan ee goobta robotics. Barashada xoojinta waxay siinaysaa wakiilada robotka qaab ay ku bartaan ficillo casri ah oo laga yaabo inay ku adkaato injineernimada.
Xoojinta Barashada Ciyaaraha
Moodooyinka RL ayaa sidoo kale loo isticmaalay in lagu barto sida loo ciyaaro ciyaaraha fiidyaha. Wakiilada waxa loo diyaarin karaa inay wax ka bartaan khaladaadkooda oo ay si joogto ah u horumariyaan waxqabadkooda ciyaarta.
Cilmi-baarayaashu waxay hore u soo saareen wakiillo ciyaari kara ciyaaraha sida chess, Go, iyo turubka. 2013, Deepmind loo isticmaalay Barashada Xoojinta Qoto dheer si ay ugu oggolaato moodal si uu u barto sida loo ciyaaro ciyaaraha Atari meel eber ah.
Ciyaaraha looxa iyo fiidyowyada badankoodu waxay leeyihiin meel hawleed xaddidan iyo yool la taaban karo oo si wanaagsan loo qeexay. Tilmaamahani waxay u shaqeeyaan faa'iidada qaabka RL. Hababka RL waxay si dhakhso ah u soo celin karaan in ka badan malaayiin ciyaarood oo la isku daray si ay u bartaan xeeladaha ugu wanaagsan ee lagu gaaro guusha.
Ugu Dambeyn
Hadday baranayso sida loo socdo ama loo barto sida loo ciyaaro ciyaaraha fiidiyowga, moodooyinka RL ayaa la xaqiijiyay inay yihiin qaabab AI oo faa'iido leh oo lagu xalliyo dhibaatooyinka u baahan go'aan qaadasho adag.
Marka ay tignoolajiyadu sii socoto kobcinta, cilmi-baarayaasha iyo horumariyayaashuba waxay sii wadi doonaan helista codsiyo cusub oo ka faa'iidaysanaya awoodda wax-barid ee moodeelka.
Waa maxay codsiyo la taaban karo oo aad u malaynayso in barashada xoojinta ay ku caawin karto?
Leave a Reply