Industria gehiagok eragiketak automatizatzeko eta aukerak egiteko algoritmoen indarra erabiltzen duten heinean, ikaskuntza automatikoa mundu garaikidearen funtzionamenduaren funtsezko osagaia bihurtzen ari da.
Ikaskuntza automatikoaren alborapenaren gaia funtsezkoa da ikaskuntza automatikoaren ereduak hainbat erakunderen erabakiak hartzeko prozesuetan integratzen direnean.
Algoritmoek sortutako aukerak inpartzialak eta alborapenik gabekoak direla bermatzea izan behar da ikaskuntza automatikoko ereduak erabiltzen dituen edozein erakunderen helburua. Ereduaren irteerak fidagarriak izan daitezen eta bidezkotzat har daitezkeela ziurtatzeko, funtsezkoa da aintzat hartzea eta zuzentzea makina ikaskuntza alborapena.
Ereduen azalgarritasunari buruzko galderekin lotuta dago, edo pertsona batentzat zein erraza den ikaskuntza automatikoko eredu bat ondorio batera nola iritsi den ulertzea. Ikaskuntza automatikoko ereduek mapatzen eta ikasten dituzten joerak eta ereduak datuetatik bertatik datoz, giza garapen zuzenaren bidez baino.
Ikaskuntza automatikoan alborapena hainbat arrazoirengatik sor daiteke, kontrolatu eta egiaztatzen ez bada. Eredu bat zabaltzen denean, maiz egiten du topo prestakuntza-datuen laginean zehatz-mehatz islatzen ez diren egoerak.
Eredua gehiegi egokitzea izan zitekeen ordezkaririk gabeko prestakuntza-datu multzo honetarako. Prestakuntza-datuen kalitate bikaina izan arren, ereduak eragin kultural zabalagoen ondoriozko alborapen historikoak eragin dezake.
Inplementatu ondoren, eredu alboratuak zenbait talderen alde egin dezake edo datu-azpimultzo jakin batzuekin zehaztasuna gal dezake. Honek gizabanako talde jakin bat bidegabe zigortzen duten epaiak sor ditzake, eta horrek eragin negatiboak izan ditzake benetako munduan.
Artikulu honek ikaskuntza automatikoaren alborapena aztertzen du, zer den, nola antzeman, dakartzan arriskuak eta askoz gehiago.
Beraz, zer da Machine Learning Bias?
Ikasketa automatikoko prozesuan egindako hipotesi faltsuen ondorioz sistematikoki alboratuta dauden irteerak sortzen dituen algoritmo bati ikaskuntza automatikoaren alborapena deritzo, algoritmoaren alborapena edo AI alborapena bezala ezagutzen dena.
Ikaskuntza automatikoaren alborapena eredu batek datu-multzo jakin bati edo datu-azpimultzo bati mesede egiteko duen joera da; maiz adierazten ez diren prestakuntza-datu multzoek eragiten dute. Datu-bilketa jakin batekin, eredu alboratuak errendimendu txikia izango du, eta horrek zehaztasuna kaltetuko du.
Mundu errealeko ingurune batean, horrek esan nahi du prestakuntza-datu alboratuak eredu baten irteerak arraza, demografia edo genero jakin bati mesede egiten ziola.
Ondorioz, ikaskuntza automatikoaren emaitzak bidegabeak edo diskriminatzaileak izan daitezke. Ordezkaririk gabeko prestakuntza datu-multzoek alborapena eragin dezakete ikaskuntza automatikoan.
Ondoriozko eredua beste kategoria batzuetara albora daiteke, baldin eta prestakuntza-datuak falta badira edo datu-talde jakin baten gehiegi adierazgarriak badira. Hori gerta daiteke prestakuntza-datuen lagina ez badator bat mundu errealeko inplementazio-ingurunearekin.
Osasun-industrian ikaskuntza automatikoa, gaixotasun ezagunen edo gaixotasunen aurrean pazientearen datuak egiaztatzeko erabil daitekeena, adibide bikaina da. Ereduek medikuen esku-hartzeak azkartu ditzakete egoki erabiltzen direnean.
Hala ere, aurreiritziak posible dira. Paziente adineko baten gaixotasun posiblea aurreikusteko eskatzen zaionean, eredu batek ezin du ondo funtzionatuko hura eraikitzeko erabilitako prestakuntza-datuak gehienbat adin txikiagoko pazienteen datuez badaude.
Gainera, estatistika historikoak okertu daitezke. Esate baterako, historikoki langile gehienak gizonezkoak zirenez, lan-hautagaiak iragazteko trebatutako eredu batek gizonezkoen eskatzaileen alde egingo luke.
Ikaskuntza automatikoaren alborapenak eragina izango du ereduaren zehaztasunean bi agertokietan, eta egoera okerrenetan, ondorio diskriminatzaileak eta bidegabeak ere sor ditzake.
Erabakiak arretaz berrikusi behar dira alborapenik ez dagoela ziurtatzeko ikasteko makina ereduak gero eta eskuzko eragiketa gehiago ordezkatu. Ondorioz, edozein erakundetako eredu-gobernantza-praktikek ikaskuntza automatikoaren alborapenaren jarraipena izan beharko lukete.
Hainbat industriatan lan mota asko ari dira osatzen ikaskuntza automatikoko ereduen bidez. Gaur egun, gero eta zailagoak diren prozesuak automatizatzeko eta iradokizunak sortzeko erabiltzen dira ereduak. Erabakiak hartzeko prozesu honetan, alborapenak esan nahi du eredu batek talde jakin baten alde egin dezakeela ikasitako alborapenean oinarrituta.
Benetako ondorioekin epai arriskutsuak egiteko erabiltzen denean, horrek ondorio larriak izan ditzake. Mailegu-eskaerak automatikoki onartzeko erabiltzen denean, adibidez, eredu alboratuak biztanleria jakin bati kalte egin diezaioke. Ekintza guztiak ikuskatu edo aztertu daitezkeen negozio arautuetan, hori kontuan hartu beharreko faktore erabakigarria da.
Machine Learning Bias motak
- Algoritmoaren alborapena – Hau gertatzen da ikaskuntza automatikoaren konputazioak gidatzen dituen kalkuluak egiten dituen algoritmoan akats bat dagoenean.
- Laginaren alborapena – Datuak erabiltzen direnean ikaskuntza automatikoa trebatu ereduak arazo bat du, hau gertatzen da. Alborapen mota horretako kasuetan, sistema entrenatzeko erabilitako datuen kantitatea edo kalitatea nahikoa ez da. Algoritmoa irakasle guztiak emakumezkoak direla sinesteko trebatu egingo da, adibidez, prestakuntza-datuak emakumezko irakasleez osatuta badaude.
- Bazterketa-alborapena – Erabiltzen ari den datu multzotik funtsezko datu-puntu bat ez dagoenean gertatzen da, eta hori gerta daiteke modelatzaileek falta den datu-puntuaren garrantziaz jabetzen ez badira.
- Aurreiritzi-alborapena – Kasu honetan, ikaskuntza automatikoa bera alboratuta dago, sistema entrenatzeko erabilitako datuek mundu errealeko aurreiritziak islatzen baitituzte, hala nola aurreiritziak, estereotipoak eta gizarte-suposizio okerrak. Esate baterako, medikuak eta emakumezko erizainak bakarrik barne hartzen dituen sistema informatikoan mediku profesionalei buruzko datuak sartuko balira, osasun-langileei buruzko mundu errealeko genero estereotipoa iraunaraziko litzateke.
- Neurketa-alborapena – Izenak dioen bezala, alborapen hori datuen kalitatearen eta horiek biltzeko edo ebaluatzeko erabilitako metodoen oinarrizko arazoetatik sortzen da. Pisua zehatz-mehatz ebaluatzeko entrenatzen ari den sistema alboratuta egongo da prestakuntza-datuetan jasotako pisuak etengabe biribiltzen badira, eta pozik dauden langileen irudiak erabiltzea lantokiko ingurunea ebaluatzeko sistema bat trebatzeko alboratuta egon daiteke irudietako langileek bazekiten. zoriontasuna neurtzen ari ziren.
Zer faktorek eragiten dute ikaskuntza automatikoan alborapena?
Ikaskuntza automatikoaren alborapenaren arrazoi asko egon arren, askotan prestakuntza-datuen beraren alborapenetik sortzen da. Prestakuntza-datuen alborapenen azpiko hainbat arrazoi potentzial daude.
Ilustraziorik agerikoena entrenamendu-datuak dira, ohikoa ez den sistema zabaldu batean ikusten diren baldintzen azpimultzoa. Hau izan daiteke kategoria baten gutxiespena duten prestakuntza-datuak edo beste baten kopuru neurrigabea.
Hau lagin-alborapena deritzo, eta ausazko prestakuntza-datuen bilketaren ondorioz izan daiteke. Datuak biltzeko, aztertzeko edo sailkatzeko erabiltzen diren metodoek, baita datuen sustrai historikoek ere, datuen beraren alborapena ekar dezakete.
Informazioa historikoki ere alboratuta egon daiteke bildu zen kultura handiagoetan.
Ikaskuntza automatikoaren alborapena honako hauek eragiten dute gehienbat:
- Datu historikoetan gizakiak edo gizarteak eragindako alborapenak algoritmoak entrenatzeko erabiltzen dira.
- Mundu errealeko egoerak islatzen ez dituzten prestakuntza-datuak.
- Alborapena etiketatu edo ikasketa automatiko gainbegiraturako datuak prestatzean.
Adibidez, prestakuntza-datuen aniztasun faltak irudikapen-alborapena eragin dezake. Ikaskuntza automatikoko ereduen zehaztasuna kultura zabalagoko alborapen historikoak eragiten du maiz.
Batzuetan, gizarte edo giza alborapena deitzen zaio. Gizarte-alborapenerako joerarik ez duten datu-bilduma zabalak aurkitzea zaila izan daiteke. Ikaskuntza automatikoko bizi-zikloaren datuak prozesatzeko fasea giza-alborapenaren jasaten da.
Datu-zientzialari edo beste aditu batek etiketatu eta prozesatu dituen datuak beharrezkoak dira ikaskuntza automatikoa gainbegiratu ahal izateko. Garbitzen diren datuen aniztasunetik, datu-puntuak etiketatzeko modutik edo ezaugarrien aukerak izan arren, etiketatze prozesu honetan alborapenak alborapena ekar dezake ikaskuntza automatikoan.
Machine Learning Alborapen Arriskuak
Ereduak datuetan oinarritutako erabakiak hartzeko tresnak direnez, epai inpartzialak ematen dituztela uste da. Ikaskuntza automatikoko ereduek alborapena izaten dute maiz, eta horrek emaitzetan eragina izan dezake.
Gero eta industria gehiagok inplementatzen dute ikaskuntza automatikoa software eta prozedu zaharkituen ordez. Eredu alboratuak eragin negatiboak izan ditzakete mundu errealean lan konplikatuagoak ereduak erabiliz automatizatzen direnean.
Ikaskuntza automatikoa ez da bestelako erabakiak hartzeko prozesuetatik, erakundeek eta pertsonek gardena eta bidezkoa izatea espero baitute. Ikaskuntza automatikoa prozesu automatizatua denez, noizean behin are gehiago aztertzen dira hura erabiliz egindako epaiak.
Funtsezkoa da erakundeak proaktiboak izatea arriskuei aurre egiteko, ikaskuntza automatikoaren alborapenak maiz eragin negatiboak edo diskriminatzaileak izan ditzakeelako populazio batzuetan. Testuinguru arautuetarako, bereziki, ikaskuntza automatikoaren alborapenaren aukera kontuan hartu behar da.
Esate baterako, bankuko ikaskuntza automatikoa erabil liteke hipoteka-eskatzaileak automatikoki onartzeko edo baztertzeko, hasierako azterketaren ondoren. Hautagai-talde jakin baterako joera duen eredu batek ondorio kaltegarriak izan ditzake hautagaiarengan zein erakundean.
Ekintzak azter daitezkeen hedapen-ingurunean aurkitzen den edozein alderdikeriak arazo handiak sor ditzake. Baliteke ereduak ez funtzionatzea eta, eszenatoki okerrenetan, nahita diskriminatzailea izatea ere gerta daiteke.
Alborapena arretaz ebaluatu eta prestatu behar da, eredua hedapenetik erabat kentzea eragin baitezake. Ereduen erabakietan konfiantza irabazteak ikaskuntza automatikoaren alborapena ulertzea eta aurre egitea eskatzen du.
Erakundearen barneko eta kanpoko zerbitzu-kontsumitzaileen arteko konfiantza-maila ereduaren erabakiak hartzean hautematen den alborapenek eragin dezakete. Ereduak ez badira fidagarriak, batez ere arrisku handiko aukerak gidatzen direnean, ez dira erakunde baten barruan bere potentzial guztian erabiliko.
Eredu baten azalgarritasuna ebaluatzeko orduan, alborapena kontabilizatzea kontuan hartu beharreko faktorea izan behar da. Ereduen aukeren baliozkotasuna eta zehaztasuna larriki eragin dezake egiaztatu gabeko ikaskuntza automatikoaren alborapenek.
Batzuetan, pertsona edo talde jakin batzuei eragin diezaieketen diskriminazio-ekintzak eragin ditzake. Aplikazio ugari daude ikaskuntza automatikoko eredu mota ezberdinetarako, eta bakoitza ikaskuntza automatikoaren alborapena jasaten du neurri batean.
Ikaskuntza automatikoaren alborapena honako hauek erakusten dute:
- Prestakuntza-datuetan aniztasunik ez dagoenez, aurpegi-ezagutze algoritmoak hain zehatzak izan daitezke arraza-talde batzuentzat.
- Programak arraza- eta genero-alborapena antzeman dezake datuetan, giza edo aurreiritzi historikoengatik.
- Dialekto edo azentu jakin batekin, hizkuntza naturalaren prozesamendua zehatzagoa izan liteke, eta agian ezingo du prozesatu prestakuntza-datuetan azpimarraturik dagoen azentu bat.
Alborapena ebaztea Machine Learning-en
Alborapena aurkitzen denean ereduak monitorizatzea eta birziklatzea ikaskuntza automatikoaren alborapenari aurre egiteko bi modu dira. Kasu gehienetan, ereduaren alborapena prestakuntza-datuen alborapenaren adierazgarri da, edo gutxienez alborapena ikaskuntza automatikoaren bizi-zikloaren prestakuntza-etaparekin erlazionatu daiteke.
Ereduaren bizi-zikloaren fase bakoitzak prozedurak izan beharko lituzke alborapena edo ereduaren noraeza harrapatzeko. Inplementatu ondoren ikaskuntza automatikoa kontrolatzeko prozesuak ere sartzen dira. Garrantzitsua da eredua eta datu-multzoa maiz egiaztatzea alborapenik dagoen.
Horrek prestakuntza-datu multzo bat aztertzea suposa dezake, taldeak bertan nola banatzen eta irudikatzen diren ikusteko. Guztiz adierazgarriak ez diren datu-multzoak aldatzea edo/eta hobetzea posible da.
Gainera, alborapena kontuan hartu behar da ereduaren errendimendua ebaluatzerakoan. Datuen azpimultzo desberdinetan ereduaren errendimendua probatzeak talde jakin bati dagokionez alboratuta edo gehiegi egokituta dagoen ikus dezake.
Posible da ikaskuntza automatikoko ereduaren errendimendua ebaluatzea datu-azpimultzo jakin batzuetan, baliozkotze gurutzatuaren teknikak erabiliz. Prozedurak datuak prestakuntza- eta proba-datu multzo desberdinetan banatzen ditu.
Ikaskuntza automatikoan alborapena ezaba dezakezu:
- Beharrezkoa denean, trebatu eredua entrenamendu-multzo handiagoak eta adierazgarriagoak erabiliz.
- Emaitza alboratuak eta ezohiko epaiak modu proaktiboan bilatzeko prozedura bat ezartzea.
- Ezaugarriak birponderatzeak eta hiperparametroak behar den moduan doitzeak alborapena kontutan hartzen lagun dezake.
- Aurkitutako alborapenen ebazpena bultzatzea detekzio eta optimizazio etengabeko ziklo baten bidez.
Ondorioa
Tentagarria da sinestea behin trebatu ondoren, ikaskuntza automatikoko eredu batek modu autonomoan funtzionatuko lukeela. Izan ere, ereduaren funtzionamendu-ingurunea beti aldatzen ari da, eta kudeatzaileek ereduak berriro trebatu behar dituzte datu-multzo freskoak erabiliz aldian-aldian.
Gaur egun, ikaskuntza automatikoa mundu errealeko onura ekonomikoak dituen gaitasun teknologiko liluragarrienetako bat da. Makina-ikaskuntzak, big data teknologiekin eta hodei publikoaren bidez eskuragarri dagoen konputazio-potentzia izugarriarekin konbinatuta, gizabanakoek teknologiarekin eta, agian, industria osoekin nola elkarreragiten duten eraldatzeko ahalmena du.
Hala ere, ikaskuntza automatikoko teknologia itxaropentsua denez, arreta handiz planifikatu behar da nahi gabeko alborapenak saihesteko. Makinek egindako epaien eraginkortasuna alborapenek eragin handia izan dezakete, hau da, ikaskuntza automatikoko ereduen garatzaileek kontuan hartu behar duten zerbait.
Utzi erantzun bat