Om't mear yndustry de krêft fan algoritmen brûke om operaasjes te automatisearjen en karren te meitsjen, wurdt masine learen in krúsjale komponint fan hoe't de hjoeddeistige wrâld wurket.
De kwestje fan bias yn masine learen is krúsjaal om te rekkenjen as masine-learenmodellen yntegreare wurde yn beslútfoarmingprosessen fan ferskate organisaasjes.
Om te garandearjen dat karren generearre troch algoritmen ûnpartidich binne en sûnder foaroardielen, soe it doel wêze moatte foar elke organisaasje dy't masine-learmodellen brûkt. Om te soargjen dat de modelútgongen kinne wurde fertroud en sjoen as earlik, is it krúsjaal om te erkennen en oan te pakken masine learen bias.
It is relatearre oan fragen oer modelferklearring, of hoe maklik it is foar in persoan om te begripen hoe't in masine-learenmodel ta in konklúzje kaam. De trends en patroanen dy't masine-learmodellen yn kaart bringe en leare komme fan 'e gegevens sels ynstee fan troch direkte minsklike ûntwikkeling.
Bias yn masine learen kin ûntstean foar in ferskaat oan redenen as it net wurdt kontrolearre en kontrolearre. As in model wurdt ynset, komt it faak situaasjes tsjin dy't net krekt werjûn wurde yn 'e treningsgegevensmonster.
It model koe wêze oerfitting foar dizze net represintative training set fan gegevens. Nettsjinsteande de treflike kwaliteit fan 'e treningsgegevens, kin it model noch altyd beynfloede wurde troch histoaryske bias dy't fuortkomme út bredere kulturele ynfloeden.
Sadree't ymplementearre, in bias model koe favorisearje bepaalde groepen of ferlieze krektens mei bepaalde gegevens subsets. Dit kin resultearje yn oardielen dy't in bepaalde groep yndividuen ûnrjochtfeardich straffen, wat negative effekten kinne hawwe op 'e eigentlike wrâld.
Dit artikel besprekt foaroardielen fan masine-learen, ynklusyf wat it is, hoe it te spotten, de gefaren dy't it foarmet, en folle mear.
Dat, wat is Machine Learning Bias?
In algoritme dat útgongen produsearret dy't systematysk bias binne as gefolch fan falske oannames dy't makke binne tidens it masine-learproses is bekend as masine-learen-bias, ek bekend as algoritme-bias of bekend as AI-bias.
Masine learen bias is de oanstriid fan in model te favorisearje in bepaalde set fan gegevens of in subset fan gegevens; it wurdt faak brocht troch net-representative training datasets. Mei in beskate kolleksje fan gegevens sil in biased model ûnderprestearje, wat de krektens skea sil.
Yn in ynstelling yn 'e echte wrâld kin dit ymplisearje dat foaroardielde trainingsgegevens resultearre yn' e útfier fan in model dy't in bepaald ras, demografysk of geslacht favorisearret.
As resultaat kinne de útgongen fan masine learen ûnrjochtfeardich of diskriminearjend wêze. Net-representative training datasets kinne bydrage oan bias yn masine learen.
It resultearjende model kin bias wêze foar oare, ûnderfertsjintwurdige kategoryen as de trainingsgegevens ûntbrekke of te represintatyf binne foar in bepaalde gegevensgroepearring. Dit kin barre as it sample fan trainingsgegevens net krekt oerienkomt mei de ynsetomjouwing yn 'e echte wrâld.
Masine learen yn 'e sûnenssektor, dat kin wurde brûkt om pasjintgegevens te kontrolearjen tsjin bekende sykten of sykten, is in prima foarbyld. Modellen kinne yntervinsjes fan medyske praktiken fersnelle as se passend wurde brûkt.
Foaroardielen binne lykwols mooglik. Wannear't frege wurdt om mooglike sykte yn in âldere pasjint te foarsizzen, kin in model net goed prestearje as de trainingsgegevens dy't brûkt wurde om it te konstruearjen meast bestiet út pasjintgegevens út in lytser leeftydsbereik.
Dêrnjonken kinne de histoaryske statistiken skeef wurde. Bygelyks, om't histoarysk de mearderheid fan 'e meiwurkers manlju wiene, soe in model oplaat om kandidaten te filterjen manlike sollisitanten favorisearje.
Foaroardielen fan masinelearen sil in ynfloed hawwe op de krektens fan it model yn beide senario's, en yn 'e slimste omstannichheden kin it sels resultearje yn diskriminearjende en ûnrjochtfeardige konklúzjes.
Besluten moatte soarchfâldich hifke wurde om te soargjen dat d'r gjin foaroardielen is masine learmodellen ferfange mear en mear hânmjittich operaasjes. As resultaat moatte modelbestjoerpraktiken yn elke organisaasje tafersjoch omfetsje foar bias foar masine-learen.
In protte ferskillende soarten banen yn in protte ferskillende yndustry wurde foltôge troch masine-learmodellen. Tsjintwurdich wurde modellen brûkt om hieltyd dreger prosessen te automatisearjen en suggestjes te generearjen. Yn dit beslútfoarmingproses betsjuttet bias dat in model ien bepaalde groep oer in oare kin favorisearje op basis fan in learde bias.
As it brûkt wurdt om ûnfeilige oardielen te meitsjen mei feitlike gefolgen, kin dit slimme gefolgen hawwe. As it wurdt brûkt om bygelyks lieningsapplikaasjes automatysk goed te keuren, kin in foaroardielend model in beskate populaasje beynfloedzje. Yn regele bedriuwen wêr't aksjes kinne wurde ynspekteare of ûndersocht, is dit in bysûnder krúsjale faktor om rekken te hâlden.
Machine Learning Bias types
- Algoritme bias - Dit bart as d'r in brek is yn it algoritme dat de berekkeningen docht dy't berekkeningen foar masine learen oandriuwt.
- Sample Bias - Doe't de gegevens brûkt om traine de masine learen model hat in probleem, dit bart. Yn gefallen fan dit soarte foaroardielen is it bedrach of kwaliteit fan 'e gegevens brûkt om it systeem te trainen net genôch. It algoritme sil wurde oplaat om te leauwen dat alle learkrêften froulik binne as bygelyks traininggegevens folslein út froulike learkrêften binne.
- Útsluting bias - Dit bart as in krúsjaal gegevenspunt ôfwêzich is yn 'e set gegevens dy't wurdt brûkt, wat kin foarkomme as de modelers de betsjutting fan it ûntbrekkende gegevenspunt net realisearje.
- Foaroardielen bias - Yn dit gefal is it masinelearen sels beoardiele, om't de gegevens dy't brûkt wurde om it systeem te trenen, biases yn 'e echte wrâld wjerspegelje, lykas foaroardielen, stereotypen en ferkearde sosjale oannames. Bygelyks, as gegevens oer medyske professionals opnommen wurde yn it kompjûtersysteem dat allinich manlike dokters en froulike ferpleechkundigen omfette, soe in echte wrâldgeslachtstereotype oer sûnenswurkers behâlde wurde.
- Mjitting Bias - Lykas de namme al fermoeden docht, komt dizze bias út fûnemintele problemen mei de kwaliteit fan 'e gegevens en de metoaden dy't brûkt wurde om it te sammeljen of te evaluearjen. In systeem dat wurdt oplaat om presys gewicht te beoardieljen sil beoardiele wêze as de gewichten yn 'e trainingsgegevens konsekwint wurde rûn, en it brûken fan ôfbyldings fan tefreden meiwurkers om in systeem te trenen dat bedoeld is om in wurkomjouwing te beoardieljen kin beoardiele wurde as de meiwurkers op 'e foto's wisten se waarden mjitten foar lok.
Hokker faktoaren drage by oan bias yn masine learen?
Hoewol d'r in protte redenen binne foar bias foar masine learen, ûntstiet it faaks út bias yn 'e trainingsgegevens sels. D'r binne ferskate potensjele ûnderlizzende oarsaken foar foaroardielen yn trainingsgegevens.
De meast skynbere yllustraasje is training gegevens, dat is in subset fan betingsten sjoen yn in ynset systeem dat is net typysk. Dit kin trainingsgegevens wêze mei in ûnderfertsjintwurdiging fan ien kategory of in ûnevenredige hoemannichte fan in oare.
Dit is bekend as sample bias, en it kin resultearje út net-willekeurige training gegevens sammeling. De metoaden dy't brûkt wurde om de gegevens te sammeljen, te analysearjen of te klassifisearjen, lykas de histoaryske woartels fan 'e gegevens, kinne allegear liede ta bias yn 'e gegevens sels.
De ynformaasje kin sels histoarysk bias wêze yn 'e gruttere kultuer wêr't it waard sammele.
Masine learen bias wurdt meast feroarsake troch:
- Foaroardielen feroarsake troch minsken of maatskippij yn 'e histoaryske gegevens wurde brûkt om algoritmen te trainen.
- Trainingsgegevens dy't gjin echte omstannichheden reflektearje.
- Bias by it labeljen of tarieden fan gegevens foar tafersjoch masine learen.
Bygelyks, in gebrek oan ferskaat yn traininggegevens kin fertsjinwurdigingsbias feroarsaakje. De krektens fan modellen foar masine-learen wurdt faak beynfloede troch histoaryske foaroardielen yn 'e bredere kultuer.
Dit wurdt soms oantsjutten as sosjale of minsklike bias. It finen fan grutte kolleksjes fan gegevens dy't net gefoelich binne foar maatskiplike bias kin útdaagjend wêze. It gegevensferwurkingsstadium fan 'e libbenssyklus fan masine-learen is like gefoelich foar minsklike foaroardielen.
Gegevens dy't binne markearre en ferwurke troch in gegevenswittenskipper as in oare saakkundige binne nedich foar begeliede masine learen. Oft it komt út it ferskaat oan gegevens dy't wurde skjinmakke, de manier wêrop gegevenspunten wurde markearre, of de kar fan funksjes, foaroardielen yn dit etiketteproses kin liede ta bias yn masine learen.
Machine Learning Bias Risiko's
Sûnt modellen binne data-oandreaune beslútfoarming ark, wurdt oannommen dat se jouwe ûnpartidige oardielen. Masine-learmodellen befetsje faak bias, wat de resultaten kin beynfloedzje.
Hieltyd mear yndustry implementearje masine learen yn plak fan ferâldere software en prosedueres. Foarinige modellen kinne negative effekten hawwe yn 'e echte wrâld as mear komplisearre banen wurde automatisearre mei modellen.
Masine learen is net oars as oare beslútfoarmjende prosessen yn dat organisaasjes en partikulieren ferwachtsje dat it transparant en rjochtfeardich is. Om't masine learen in automatisearre proses is, wurde oardielen makke mei it sa no en dan noch nauwer ûndersocht.
It is krúsjaal dat organisaasjes proaktyf binne by it oanpakken fan de gefaren, om't bias yn masine learen faak diskriminearjende of negative effekten kin hawwe op guon populaasjes. Foar regele konteksten, yn it bysûnder, moat de mooglikheid fan bias yn masine learen yn rekken brocht wurde.
Bygelyks, masine learen yn it bankieren koe wurde brûkt om hypoteekoanfregers automatysk te akseptearjen of te wegerjen nei inisjele screening. In model dat bias is op in bepaalde groep kandidaten kin wol skealike effekten hawwe op sawol de kandidaat as de organisaasje.
Elke bias fûn yn in ynsetomjouwing wêr't aksjes kinne wurde ûndersocht kin liede ta grutte problemen. It model kin miskien net wurkje en, yn 'e slimste senario's, kin sels blike te wêzen bewust diskriminearjend.
Bias moat soarchfâldich evaluearre en taret wurde op, om't it kin resultearje yn it model wurdt folslein fuortsmiten fan ynset. Betrouwen winne yn modelbesluten fereasket begryp en oanpak fan bias foar masine-learen.
It nivo fan fertrouwen binnen de organisaasje en ûnder eksterne tsjinstkonsuminten koe wurde beynfloede troch waarnommen foaroardielen yn modelbeslútfoarming. As modellen net fertroud wurde, foaral by it begelieden fan keuzes mei hege risiko, sille se net brûkt wurde om har folsleine potensjeel binnen in organisaasje.
By it evaluearjen fan de ferklearring fan in model, moat rekkening foar bias in faktor wêze dy't yn rekken brocht wurde moat. De jildigens en krektens fan modelkeuzes kinne serieus beynfloede wurde troch net kontroleare bias foar masine-learen.
It kin soms resultearje yn diskriminearjende aksjes dy't bepaalde minsken of groepen kinne beynfloedzje. Tal fan tapassingen bestean foar ferskate masine learen model types, en elk is gefoelich foar masine learen bias foar in part.
Masine learen bias wurdt yllustrearre troch:
- Troch it ûntbrekken fan ferskaat yn 'e trainingsgegevens kinne algoritmen foar gesichtsherkenning minder akkuraat wêze foar guon rasiale groepen.
- It programma koe rasiale en geslachtsfoaroardielen yn gegevens ûntdekke fanwegen minsklike of histoaryske foaroardielen.
- Mei in bepaald dialekt of aksint soe natuerlike taalferwurking krekter wêze kinne, en it kin miskien net in aksint ferwurkje dat yn trainingsgegevens ûnderfertsjintwurdige is.
Bias oplosse yn Machine Learning
Monitoring- en opliedingsmodellen as bias wurdt fûn binne twa manieren om bias foar masine-learen oan te pakken. Yn 'e measte gefallen is modelbias in yndikaasje fan bias yn' e trainingsgegevens, of op syn minst kin de bias relatearre wurde oan 'e trainingsstadium fan' e libbenssyklus fan masine-learen.
Elke faze fan 'e modellibbenssyklus soe prosedueres moatte hawwe om bias as modeldrift te fangen. Prosessen foar it kontrolearjen fan masine learen nei ynset binne ek opnommen. It is wichtich om it model en datasets faak te kontrolearjen op bias.
Dit kin omfetsje it ûndersykjen fan in trainingsdataset om te sjen hoe't groepen dêr ferdield en fertsjintwurdige binne. It is mooglik om datasets te wizigjen en/of te ferbetterjen dy't net hielendal represintatyf binne.
Derneist moat bias wurde beskôge by it beoardieljen fan de prestaasjes fan it model. It testen fan 'e prestaasjes fan it model op ferskate subsets fan' e gegevens kin sjen litte as it bias of oerfit is yn relaasje ta in bepaalde groep.
It is mooglik om de prestaasjes fan masine-learenmodel op bepaalde gegevenssubsets te evaluearjen troch krúsvalidaasjetechniken te brûken. De proseduere omfettet it ferdielen fan de gegevens yn ûnderskate training- en testen datasets.
Jo kinne bias yn masine learen eliminearje troch:
- As it nedich is, retrain it model mei help fan gruttere, mear represintative training sets.
- It fêststellen fan in proseduere om proaktyf út te sjen nei biased resultaten en ûngewoane oardielen.
- Funksjes opnij gewicht en oanpasse hyperparameters as nedich kinne helpe om rekken te hâlden mei bias.
- It stimulearjen fan de resolúsje fan ûntdutsen bias troch in trochgeande syklus fan detectie en optimalisaasje.
Konklúzje
It is ferliedlik om te leauwen dat ienris oplaat, in masine-learmodel autonoom soe funksjonearje. Yn feite feroaret de operative omjouwing fan it model altyd, en managers moatte modellen opnij opliede mei frisse datasets op reguliere basis.
Masine learen is op it stuit ien fan 'e meast fassinearjende technologyske mooglikheden mei echte ekonomyske foardielen. Masine-learen, as keppele mei big data-technologyen en de enoarme berekkeningskrêft beskikber fia de iepenbiere wolk, hat it potensjeel om te transformearjen hoe't yndividuen ynteraksje mei technology, en miskien hiele yndustry.
Lykwols, sa kânsryk as masine-learen technology is, moat it soarchfâldich pland wurde om ûnbedoelde foaroardielen te foarkommen. De effektiviteit fan 'e oardielen makke troch de masines kin slim beynfloede wurde troch foaroardielen, wat iets is dat ûntwikkelders fan masine-learmodellen rekken hâlde moatte.
Leave a Reply