Samtang daghang mga industriya ang naggamit sa gahum sa mga algorithm aron ma-automate ang mga operasyon ug maghimo mga kapilian, ang pagkat-on sa makina nahimong hinungdanon nga bahin kung giunsa ang paglihok sa kalibutan karon.
Ang isyu sa bias sa pagkat-on sa makina hinungdanon nga tagdon kung ang mga modelo sa pagkat-on sa makina maapil sa lainlaing mga proseso sa paghimog desisyon sa organisasyon.
Aron magarantiya nga ang mga pagpili nga gihimo sa mga algorithm dili mapihigon ug wala’y pagpihig kinahanglan ang katuyoan sa bisan unsang organisasyon nga naggamit mga modelo sa pagkat-on sa makina. Aron masiguro nga ang mga modelo nga mga output mahimong masaligan ug makita nga patas, hinungdanon nga mailhan ug matubag pagkat-on sa makina bias.
May kalabotan kini sa mga pangutana bahin sa pagpatin-aw sa modelo, o kung unsa kadali alang sa usa ka tawo nga masabtan kung giunsa ang usa ka modelo sa pagkat-on sa makina nakaabut sa usa ka konklusyon. Ang mga uso ug mga sumbanan nga gimapa ug nakat-unan sa mga modelo sa pagkat-on sa makina naggikan mismo sa datos kaysa sa direkta nga pag-uswag sa tawo.
Ang pagpihig sa pagkat-on sa makina mahimong motumaw sa lainlaing mga hinungdan kung dili kini kontrolado ug susihon. Kung ang usa ka modelo gi-deploy, kini kanunay nga makasugat sa mga sitwasyon nga dili tukma nga makita sa sample sa datos sa pagbansay.
Ang modelo mahimo nga nag-overfitting alang niining dili representatibo nga set sa pagbansay sa datos. Bisan pa sa maayo kaayo nga kalidad sa datos sa pagbansay, ang modelo mahimo gihapon nga maapektuhan sa historikal nga pagpihig nga resulta sa mas lapad nga mga impluwensya sa kultura.
Sa higayon nga mapatuman, ang usa ka mapihigong modelo mahimong mopabor sa pipila ka mga grupo o mawad-an sa katukma sa partikular nga mga subset sa datos. Mahimong moresulta kini sa mga paghukom nga dili patas nga pagsilot sa usa ka grupo sa mga indibidwal, nga mahimong adunay negatibo nga mga epekto sa aktwal nga kalibutan.
Gihisgutan sa kini nga artikulo ang bias sa pagkat-on sa makina, lakip ang kung unsa kini, kung giunsa kini makit-an, ang mga peligro nga gipahinabo niini, ug daghan pa.
Busa, Unsa ang Machine Learning Bias?
Ang usa ka algorithm nga naghimo og mga output nga sistematikong gipihig isip resulta sa sayop nga mga pangagpas nga gihimo sa panahon sa proseso sa pagkat-on sa makina nailhan nga machine learning bias, nailhan usab nga algorithm bias o nailhan nga AI bias.
Ang pagpihig sa pagkat-on sa makina mao ang kalagmitan sa usa ka modelo nga mopabor sa usa ka partikular nga hugpong sa datos o usa ka subset sa datos; kini kanunay nga gidala sa dili-representante nga mga dataset sa pagbansay. Uban sa usa ka piho nga koleksyon sa mga datos, ang usa ka mapihigon nga modelo dili molihok, nga makadaot sa katukma niini.
Sa usa ka tinuod nga kalibutan nga kahimtang, kini mahimong magpasabot nga ang mapihigong datos sa pagbansay miresulta sa output sa usa ka modelo nga mipabor sa usa ka lahi, demograpiko, o gender.
Ingon usa ka sangputanan, ang mga output sa pagkat-on sa makina mahimong dili patas o diskriminasyon. Non-representative nga pagbansay Ang mga dataset mahimong makatampo sa bias sa pagkat-on sa makina.
Ang resulta nga modelo mahimong mapihigon ngadto sa uban, wala girepresentahan nga mga kategorya kung kulang ang datos sa pagbansay o sobra nga representante sa usa ka partikular nga grupo sa datos. Mahimo kini mahitabo kung ang sample sa datos sa pagbansay dili tukma nga mohaum sa tinuod nga kalibutan nga deployment environment.
Ang pagkat-on sa makina sa industriya sa pag-atiman sa kahimsog, nga magamit aron masusi ang datos sa pasyente batok sa nahibal-an nga mga sakit o sakit, usa ka panguna nga pananglitan. Ang mga modelo makapadali sa mga interbensyon sa mga medikal nga practitioner kung kini gigamit sa hustong paagi.
Apan, posible ang pagpihig. Kung gihangyo sa pagtagna sa posible nga sakit sa usa ka tigulang nga pasyente, ang usa ka modelo dili mahimo nga maayo kung ang datos sa pagbansay nga gigamit sa paghimo niini kasagaran naglangkob sa datos sa pasyente gikan sa gamay nga edad.
Dugang pa, ang mga estadistika sa kasaysayan mahimong mabalhin. Pananglitan, tungod kay sa kasaysayan, kadaghanan sa mga empleyado mga lalaki, usa ka modelo nga gibansay sa pagsala sa mga kandidato sa trabaho ang mopabor sa mga lalaki nga aplikante.
Ang pagpihig sa pagkat-on sa makina adunay impluwensya sa katukma sa modelo sa duha nga mga senaryo, ug sa labing grabe nga mga kahimtang, mahimo pa nga magresulta kini sa pagpihig ug dili makatarunganon nga mga konklusyon.
Ang mga desisyon kinahanglang susihon pag-ayo aron maseguro nga walay pagpihig mga modelo sa pagkat-on sa makina pulihan ang dugang ug mas daghang manual nga operasyon. Ingon usa ka sangputanan, ang modelo nga mga gawi sa pagdumala sa bisan unsang organisasyon kinahanglan nga maglakip sa pagmonitor alang sa bias sa pagkat-on sa makina.
Daghang lainlain nga klase sa trabaho sa daghang lainlain nga industriya ang nakumpleto sa mga modelo sa pagkat-on sa makina. Karon, ang mga modelo gigamit sa pag-automate sa labi ka lisud nga mga proseso ug pagmugna og mga sugyot. Niini nga proseso sa paghimog desisyon, ang bias nagpasabot nga ang usa ka modelo mahimong mopabor sa usa ka partikular nga grupo kay sa lain base sa nakat-onan nga bias.
Kung gigamit sa paghimo og dili luwas nga mga paghukom nga adunay aktwal nga mga sangputanan, mahimo kini nga adunay grabe nga mga epekto. Kung gigamit sa awtomatik nga pag-apruba sa mga aplikasyon sa pautang, pananglitan, ang usa ka biased nga modelo mahimong makadaut sa usa ka piho nga populasyon. Sa mga regulated nga negosyo diin ang bisan unsang aksyon mahimong masusi o masusi, kini usa ka labi ka hinungdanon nga hinungdan nga tagdon.
Mga tipo sa Machine Learning Bias
- Bias sa Algorithm - Mahitabo kini kung adunay bug sa algorithm nga naghimo sa mga kalkulasyon nga nagmaneho sa mga pagkalkula sa pagkat-on sa makina.
- Sampol nga Bias – Sa diha nga ang data gigamit sa pagbansay sa pagkat-on sa makina modelo adunay usa ka isyu, kini mahitabo. Sa mga kaso sa kini nga matang sa bias, ang kantidad o kalidad sa datos nga gigamit sa pagbansay sa sistema dili igo. Ang algorithm mabansay sa pagtuo nga ang tanan nga mga magtutudlo mga babaye kung, pananglitan, ang datos sa pagbansay hingpit nga gilangkuban sa mga babaye nga magtutudlo.
- Exclusion bias - Kini mahitabo kung ang usa ka hinungdanon nga punto sa datos wala sa set sa datos nga gigamit, nga mahimong mahitabo kung ang mga tigmodelo mapakyas nga makaamgo sa kamahinungdanon sa nawala nga punto sa datos.
- Pagpihigpihig – Niining higayona, ang pagkat-on sa makina mismo mapihigon tungod kay ang datos nga gigamit sa pagbansay sa sistema nagpakita sa tinuod nga kalibutan nga mga pagpihig sama sa pagpihig, stereotypes, ug dili husto nga sosyal nga mga pangagpas. Pananglitan, kung ang mga datos sa mga medikal nga propesyonal ilakip sa sistema sa kompyuter nga naglakip lamang sa mga lalaki nga doktor ug babaye nga mga nars, ang usa ka tinuod nga kalibutan nga gender stereotype bahin sa mga healthcare worker magpadayon.
- Pagsukod Bias – Sama sa gipasabot sa ngalan, kini nga bias resulta sa sukaranang mga isyu sa kalidad sa datos ug sa mga pamaagi nga gigamit sa pagkolekta o pagtimbang-timbang niini. Ang usa ka sistema nga gibansay sa tukma nga pagtimbang-timbang sa gibug-aton mahimong mapihigon kung ang mga gibug-aton nga naa sa datos sa pagbansay kanunay nga gilibutan, ug ang paggamit sa mga imahe sa kontento nga mga empleyado aron sa pagbansay sa usa ka sistema nga gituyo aron masusi ang usa ka palibot sa trabahoan mahimong mapihigon kung nahibal-an sa mga empleyado sa mga litrato. sila gisukod alang sa kalipay.
Unsa nga mga hinungdan ang nakatampo sa pagpihig sa pagkat-on sa makina?
Bisan kung adunay daghang mga hinungdan sa pagpihig sa pagkat-on sa makina, kasagaran kini naggikan sa pagpihig sa datos sa pagbansay mismo. Adunay ubay-ubay nga potensyal nga nagpahiping hinungdan sa mga pagpihig sa datos sa pagbansay.
Ang labing dayag nga ilustrasyon mao ang datos sa pagbansay, nga usa ka subset sa mga kondisyon nga makita sa usa ka gipakatap nga sistema nga dili kasagaran. Mahimo kini nga datos sa pagbansay nga adunay gamay nga representasyon sa usa ka kategorya o dili parehas nga gidaghanon sa lain.
Nailhan kini nga sample bias, ug kini mahimong resulta sa dili random nga pagkolekta sa datos sa pagbansay. Ang mga pamaagi nga gigamit sa pagkolekta, pag-analisa, o pagklasipikar sa datos, ingon man sa makasaysayanong mga ugat sa datos, mahimong mosangput sa pagpihig sa datos mismo.
Ang impormasyon mahimo pa gani nga mapihigon sa kasaysayan sa mas dako nga kultura diin kini gitigum.
Ang bias sa pagkat-on sa makina kasagaran tungod sa:
- Ang mga bias nga gipahinabo sa mga tawo o katilingban sa makasaysayanong datos gigamit sa pagbansay sa mga algorithm.
- Mga datos sa pagbansay nga wala magpakita sa tinuod nga mga kahimtang sa kalibutan.
- Bias samtang nag-label o nag-andam sa datos alang sa gibantayan nga pagkat-on sa makina.
Pananglitan, ang kakulang sa pagkalainlain sa datos sa pagbansay mahimong hinungdan sa bias sa representasyon. Ang katukma sa mga modelo sa pagkat-on sa makina kanunay nga naapektuhan sa makasaysayan nga pagpihig sa mas lapad nga kultura.
Kini usahay gitawag nga sosyal o tawhanong pagpihig. Ang pagpangita sa daghang mga koleksyon sa datos nga dili dali sa sosyal nga pagpihig mahimong mahagiton. Ang yugto sa pagproseso sa datos sa siklo sa kinabuhi sa pagkat-on sa makina parehas nga daling makuha sa bias sa tawo.
Ang mga datos nga gimarkahan ug giproseso sa usa ka data scientist o uban pang eksperto gikinahanglan alang sa supervised machine learning. Naggikan man kini sa lainlain nga datos nga gilimpyohan, ang paagi nga gimarkahan ang mga punto sa datos, o ang pagpili sa mga bahin, ang bias sa kini nga proseso sa pag-label mahimong mosangput sa pagpihig sa pagkat-on sa makina.
Mga Risgo sa Machine Learning Bias
Tungod kay ang mga modelo mao ang data-driven nga mga himan sa paghimog desisyon, gituohan nga kini naghatag ug walay gidapigan nga mga paghukom. Ang mga modelo sa pagkat-on sa makina kanunay adunay pagpihig, nga makaapekto sa mga resulta.
Nagkadaghan ang mga industriya nga nagpatuman sa pagkat-on sa makina puli sa karaan nga software ug mga pamaagi. Ang mga biased nga modelo mahimong adunay negatibo nga epekto sa tinuod nga kalibutan kung ang mas komplikado nga mga trabaho automated gamit ang mga modelo.
Ang pagkat-on sa makina walay kalainan sa ubang mga proseso sa paghimog desisyon nga ang mga organisasyon ug indibidwal nagpaabot nga kini mahimong transparent ug patas. Tungod kay ang pagkat-on sa makina usa ka awtomatiko nga proseso, ang mga hukom nga gihimo gamit kini usahay labi ka labi nga gisusi.
Mahinungdanon nga ang mga organisasyon mahimong aktibo sa pagsulbad sa mga kapeligrohan tungod kay ang pagpihig sa pagkat-on sa makina kanunay nga adunay diskriminasyon o negatibo nga mga epekto sa pipila nga mga populasyon. Alang sa mga regulated nga konteksto, labi na, ang posibilidad sa pagpihig sa pagkat-on sa makina kinahanglan nga tagdon.
Pananglitan, ang pagkat-on sa makina sa banking mahimong magamit aron awtomatiko nga dawaton o isalikway ang mga aplikante sa mortgage pagkahuman sa pasiuna nga screening. Ang usa ka modelo nga mapihigon sa usa ka grupo sa mga kandidato mahimo’g adunay makadaot nga epekto sa kandidato ug sa organisasyon.
Ang bisan unsang pagpihig nga makit-an sa usa ka palibot sa pag-deploy kung diin ang mga aksyon mahimong susihon mahimo’g mosangput sa dagkong mga problema. Mahimong dili molihok ang modelo ug, sa labing daotan nga mga senaryo, mahimo’g mahimo’g tinuyo nga diskriminasyon.
Ang bias kinahanglan nga mabinantayon nga susihon ug andamon tungod kay kini mahimong moresulta sa modelo nga hingpit nga matangtang gikan sa pag-deploy. Ang pagbaton og pagsalig sa mga desisyon sa modelo nanginahanglan og pagsabot ug pagsulbad sa bias sa pagkat-on sa makina.
Ang lebel sa pagsalig sa sulod sa organisasyon ug taliwala sa mga konsumedor sa serbisyo sa gawas mahimong maapektuhan sa gitan-aw nga bias sa paghimog desisyon sa modelo. Kung ang mga modelo dili kasaligan, labi na kung naggiya sa mga kapilian nga adunay peligro, dili sila magamit sa ilang tibuuk nga potensyal sa sulod sa usa ka organisasyon.
Sa pagtimbang-timbang sa pagpatin-aw sa usa ka modelo, ang pag-asoy sa pagpihig kinahanglan nga usa ka hinungdan nga tagdon. Ang kabalido ug katukma sa mga pagpili sa modelo mahimong seryoso nga maapektuhan sa wala masusi nga pagpihig sa pagkat-on sa makina.
Usahay kini mahimong moresulta sa diskriminasyon nga mga aksyon nga makaapekto sa partikular nga mga tawo o grupo. Daghang mga aplikasyon ang naglungtad alang sa lainlaing mga klase sa modelo sa pagkat-on sa makina, ug ang matag usa dali nga madala sa bias sa pagkat-on sa makina sa pila ka sukod.
Ang bias sa pagkat-on sa makina gihulagway sa:
- Tungod sa pagkawalay kalainan sa datos sa pagbansay, ang mga algorithm sa pag-ila sa nawong mahimong dili kaayo tukma alang sa pipila ka mga grupo sa rasa.
- Makita sa programa ang pagpihig sa rasa ug gender sa datos tungod sa pagpihig sa tawo o kasaysayan.
- Uban sa usa ka piho nga diyalekto o accent, ang natural nga pagproseso sa lengguwahe mahimong mas tukma, ug mahimo nga dili kini makaproseso sa usa ka accent nga wala kaayo girepresentahan sa datos sa pagbansay.
Pagsulbad sa Bias sa Machine Learning
Ang pag-monitor ug pag-retraining sa mga modelo kung makit-an ang bias mao ang duha ka paagi aron matubag ang bias sa pagkat-on sa makina. Sa kadaghanan nga mga kaso, ang bias sa modelo usa ka timailhan sa bias sa datos sa pagbansay, o labing menos ang bias mahimong may kalabutan sa yugto sa pagbansay sa lifecycle sa pagkat-on sa makina.
Ang matag yugto sa siklo sa kinabuhi sa modelo kinahanglan adunay mga pamaagi aron makuha ang bias o pag-anod sa modelo. Ang mga proseso alang sa pag-monitor sa pagkat-on sa makina pagkahuman sa pag-deploy gilakip usab. Importante nga susihon kanunay ang modelo ug mga dataset alang sa bias.
Mahimong maglakip kini sa pagsusi sa usa ka set sa pagbansay aron makita kung giunsa ang mga grupo giapod-apod ug girepresentahan didto. Posible ang pag-usab ug/o pagpaayo sa mga dataset nga dili hingpit nga representatibo.
Dugang pa, kinahanglan nga tagdon ang bias samtang gisusi ang pasundayag sa modelo. Ang pagsulay sa pasundayag sa modelo sa lain-laing mga subset sa datos mahimong magpakita kung kini gipihig o sobra nga pagkabutang sa relasyon sa usa ka grupo.
Posible ang pagtimbang-timbang sa pasundayag sa modelo sa pagkat-on sa makina sa pipila nga mga subset sa datos pinaagi sa paggamit sa mga pamaagi sa cross-validation. Ang pamaagi naglakip sa pagbahin sa datos sa lahi nga pagbansay ug pagsulay nga mga datos.
Mahimo nimong wagtangon ang bias sa pagkat-on sa makina pinaagi sa:
- Kung gikinahanglan, bansayon pag-usab ang modelo gamit ang mas dako, mas representante nga mga set sa pagbansay.
- Pag-establisar og pamaagi aron maabtik nga mangita alang sa mga mapihigong resulta ug dili kasagaran nga mga paghukom.
- Ang pagbag-o sa mga bahin ug pag-adjust sa mga hyperparameter kung gikinahanglan makatabang sa pag-asoy sa bias.
- Pag-awhag sa resolusyon sa nadiskobrehan nga bias pinaagi sa padayon nga siklo sa pag-ila ug pag-optimize.
Panapos
Makatintal ang pagtuo nga sa higayon nga mabansay na, ang usa ka modelo sa pagkat-on sa makina moandar nga awtonomiya. Sa tinuud, ang palibot sa operasyon sa modelo kanunay nga nagbag-o, ug ang mga manedyer kinahanglan nga magbansay pag-usab sa mga modelo gamit ang mga bag-ong set sa datos sa kanunay.
Ang pagkat-on sa makina karon usa sa labing makaiikag nga kapabilidad sa teknolohiya nga adunay mga benepisyo sa ekonomiya sa kalibutan. Ang pagkat-on sa makina, kung ipares sa mga teknolohiya sa dagkong datos ug ang dako nga gahum sa pagkalkula nga magamit pinaagi sa publiko nga panganod, adunay potensyal nga mabag-o kung giunsa ang mga indibidwal nakig-uban sa teknolohiya, ug tingali sa tibuuk nga mga industriya.
Bisan pa, ingon ka saad sa teknolohiya sa pagkat-on sa makina, kinahanglan kini nga maampingon nga pagplano aron malikayan ang dili tinuyo nga mga pagpihig. Ang pagka-epektibo sa mga paghukom nga gihimo sa mga makina mahimong maapektuhan pag-ayo sa bias, nga usa ka butang nga kinahanglan nga tagdon sa mga developer sa modelo sa pagkat-on sa makina.
Leave sa usa ka Reply