Како све више индустрија користи моћ алгоритама за аутоматизацију операција и доношење избора, машинско учење постаје кључна компонента начина на који функционише савремени свет.
Питање пристрасности у машинском учењу је кључно да се узме у обзир када се модели машинског учења интегришу у процесе доношења одлука у различитим организацијама.
Гарантовање да су избори које генеришу алгоритми непристрасни и лишени пристрасности требало би да буде циљ сваке организације која користи моделе машинског учења. Да би се осигурало да се резултати модела могу ослонити и да се виде као праведни, кључно је препознати и адресирати Машина учење склоност.
То се односи на питања објашњивости модела, или колико је лако за особу да схвати како је модел машинског учења дошао до закључка. Трендови и обрасци које модели машинског учења мапирају и уче потичу из самих података, а не из директног људског развоја.
Пристрасност у машинском учењу може се појавити из разних разлога ако се не контролише и проверава. Када се модел примени, он се често сусреће са ситуацијама које нису прецизно приказане у узорку података за обуку.
Модел је могао бити превише прилагођен за овај нерепрезентативни скуп података за обуку. Упркос одличном квалитету података о обуци, на модел и даље може утицати историјска пристрасност која је резултат ширих културних утицаја.
Једном имплементиран, пристрасни модел би могао фаворизовати одређене групе или изгубити тачност са одређеним подскуповима података. Ово може резултирати пресудама које неправедно кажњавају одређену групу појединаца, што може имати негативне ефекте на стварни свет.
Овај чланак говори о пристрасности машинског учења, укључујући шта је то, како је уочити, опасности које представља и још много тога.
Дакле, шта је пристрасност машинског учења?
Алгоритам који производи резултате који су систематски пристрасни као резултат лажних претпоставки направљених током процеса машинског учења познат је као пристрасност машинског учења, такође позната као пристрасност алгоритма или позната као АИ пристрасност.
Пристрасност машинског учења је тенденција модела да фаворизује одређени скуп података или подскуп података; често га доносе нерепрезентативни скупови података за обуку. Уз одређену збирку података, пристрасни модел ће имати слаб учинак, што ће штетити његовој тачности.
У стварном свету, ово може да имплицира да су пристрасни подаци о обуци резултирали у излазу модела који фаворизује одређену расу, демографију или пол.
Као резултат тога, резултати машинског учења могу бити неправедни или дискриминирајући. Нерепрезентативна обука скупови података могу допринети пристрасности у машинском учењу.
Резултирајући модел може бити пристрасан према другим, недовољно заступљеним категоријама ако подаци о обуци недостају или су превише репрезентативни за одређену групу података. Ово се може десити ако узорак података о обуци не одговара прецизно окружењу примене у стварном свету.
Машинско учење у здравственој индустрији, које се може користити за проверу података о пацијентима у односу на познате болести или болести, је одличан пример. Модели могу убрзати интервенције лекара када се правилно користе.
Међутим, могуће су предрасуде. Када се тражи да предвиди могућу болест код старијег пацијента, модел не може добро да функционише ако се подаци о обуци који се користе за његову израду углавном састоје од података о пацијентима из мањег старосног опсега.
Поред тога, историјске статистике могу бити искривљене. На пример, пошто је историјски гледано, већина запослених били мушкарци, модел обучен да филтрира кандидате за посао фаворизовао би мушке кандидате.
Пристрасност машинског учења ће утицати на тачност модела у оба сценарија, ау најгорим околностима чак може довести до дискриминирајућих и неправедних закључака.
Одлуке се морају пажљиво прегледати како би се осигурало да нема пристрасности као модели машинског учења замењују све више ручних операција. Као резултат тога, модел праксе управљања у било којој организацији треба да укључује праћење пристрасности машинског учења.
Многи различити типови послова у многим различитим индустријама се завршавају моделима машинског учења. Данас се модели користе за аутоматизацију све тежих процеса и за генерисање предлога. У овом процесу доношења одлука, пристрасност значи да модел може дати предност једној одређеној групи у односу на другу на основу научене пристрасности.
Када се користи за доношење несигурних пресуда са стварним последицама, ово може имати озбиљне последице. Када се користи за аутоматско одобравање захтева за кредит, на пример, пристрасни модел може да утиче на одређену популацију. У регулисаним пословима где се било која радња може проверити или испитати, ово је посебно важан фактор који треба узети у обзир.
Типови пристрасности машинског учења
- Алгоритам Биас – Ово се дешава када постоји грешка у алгоритму који врши прорачуне који покрећу рачунања машинског учења.
- Сампле Биас – Када су подаци некада обучите машинско учење модел има проблем, то се дешава. У случајевима ове врсте пристрасности, количина или квалитет података који се користе за обуку система су недовољни. Алгоритам ће бити обучен да верује да су сви наставници жене ако се, на пример, подаци о обуци у потпуности састоје од учитељица.
- Пристрасност искључења – Ово се дешава када кључна тачка података одсутна из скупа података који се користе, што би могло да се деси ако моделери не схвате значај тачке података која недостаје.
- Пристрасност предрасуда – У овом случају, само машинско учење је пристрасно јер подаци који се користе за обуку система одражавају пристрасности у стварном свету као што су предрасуде, стереотипи и нетачне друштвене претпоставке. На пример, ако би подаци о медицинским радницима били укључени у компјутерски систем који укључује само мушке лекаре и медицинске сестре, постојао би родни стереотип из стварног света о здравственим радницима.
- Меасуремент Биас – Као што назив имплицира, ова пристрасност је резултат фундаменталних проблема са квалитетом података и методама које се користе за њихово прикупљање или процену. Систем који је обучен да прецизно процени тежину биће пристрасан ако су тежине садржане у подацима о обуци доследно заокружене, а коришћење слика задовољних запослених за обуку система намењеног за процену окружења на радном месту може бити пристрасно ако су запослени на сликама знали мерили су се за срећу.
Који фактори доприносе пристрасности у машинском учењу?
Иако постоји много разлога за пристрасност машинског учења, она често произилази из пристрасности у самим подацима о обуци. Постоји неколико потенцијалних узрока пристрасности у подацима о обуци.
Најочигледнија илустрација су подаци о обуци, који су подскуп услова који се виде у распоређеном систему који није типичан. Ово могу бити подаци о обуци са недовољном заступљеношћу једне категорије или несразмерном количином друге.
Ово је познато као пристрасност узорка и може бити резултат нерандомизованог прикупљања података о обуци. Методе које се користе за прикупљање, анализу или класификацију података, као и историјски корени података, могу довести до пристрасности у самим подацима.
Информације могу чак бити историјски пристрасне у широј култури у којој су прикупљене.
Пристрасност машинског учења је углавном узрокована:
- Предрасуде изазване људима или друштвом у историјским подацима се користе за обуку алгоритама.
- Подаци о обуци који не одражавају стварне околности.
- Пристрасност приликом означавања или припреме података за надгледано машинско учење.
На пример, недостатак разноликости у подацима о обуци може проузроковати пристрасност репрезентације. На тачност модела машинског учења често утиче историјска пристрасност у широј култури.
Ово се понекад назива друштвеном или људском пристрасношћу. Проналажење огромних колекција података који нису склони друштвеним пристрасностима може бити изазов. Фаза обраде података животног циклуса машинског учења подједнако је подложна људској пристрасности.
Подаци које је означио и обрадио научник података или други стручњак су неопходни за надгледано машинско учење. Било да произилази из различитих података који се чисте, начина на који су тачке података означене или избора карактеристика, пристрасност у овом процесу означавања може довести до пристрасности у машинском учењу.
Ризици пристрасности машинског учења
Пошто су модели алати за доношење одлука вођени подацима, претпоставља се да они пружају непристрасне судове. Модели машинског учења често садрже пристрасност, што може утицати на резултате.
Све више индустрија примењује машинско учење уместо застарелог софтвера и процедура. Пристрасни модели могу имати негативне ефекте у стварном свету када се компликованији послови аутоматизују помоћу модела.
Машинско учење се не разликује од других процеса доношења одлука у томе што организације и појединци очекују да буде транспарентно и правично. Пошто је машинско учење аутоматизован процес, пресуде донете помоћу њега се повремено још пажљивије испитују.
Од кључне је важности да организације буду проактивне у решавању опасности јер пристрасност у машинском учењу често може имати дискриминаторне или негативне ефекте на неке популације. За регулисане контексте, посебно, мора се узети у обзир могућност пристрасности у машинском учењу.
На пример, машинско учење у банкарству може се користити за аутоматско прихватање или одбијање подносилаца захтева за хипотеку након почетног прегледа. Модел који је пристрасан према одређеној групи кандидата могао би имати штетне ефекте и на кандидата и на организацију.
Свака пристрасност која се нађе у окружењу примене у којем се радње може пажљиво испитати може довести до великих проблема. Модел можда неће функционисати и, у најгорим сценаријима, чак се може испоставити да је намерно дискриминаторски.
Пристрасност мора бити пажљиво процењена и припремљена јер може довести до потпуног уклањања модела из примене. Стицање поверења у одлуке модела захтева разумевање и решавање пристрасности машинског учења.
На ниво поверења унутар организације и међу екстерним корисницима услуга може утицати уочена пристрасност у моделу доношења одлука. Ако се моделима не верује, посебно када се воде избори са високим ризиком, они неће бити искоришћени у пуном потенцијалу унутар организације.
Приликом процене објашњивости модела, урачунавање пристрасности треба да буде фактор који треба узети у обзир. На валидност и тачност избора модела може озбиљно утицати непроверена пристрасност машинског учења.
То повремено може довести до дискриминаторних радњи које могу утицати на одређене људе или групе. Постоје бројне апликације за различите типове модела машинског учења, а свака је у одређеној мери подложна пристрасности машинског учења.
Пристрасност машинског учења је илустрована:
- Због одсуства разноликости у подацима о обуци, алгоритми за препознавање лица могу бити мање тачни за неке расне групе.
- Програм би могао да открије расну и родну пристрасност у подацима због људских или историјских предрасуда.
- Са одређеним дијалектом или акцентом, обрада природног језика би могла бити прецизнија и можда неће моћи да обради акценат који је недовољно заступљен у подацима о обуци.
Решавање пристрасности у машинском учењу
Модели праћења и преквалификације када се открије пристрасност су два начина за решавање пристрасности машинског учења. У већини случајева, пристрасност модела је показатељ пристрасности у подацима о обуци, или барем пристрасност може бити повезана са фазом обуке животног циклуса машинског учења.
Свака фаза животног циклуса модела треба да има процедуре за хватање пристрасности или одступања модела. Укључени су и процеси за праћење машинског учења након примене. Важно је често проверавати модел и скупове података на пристрасност.
Ово може укључивати испитивање скупа података за обуку да би се видело како су групе тамо распоређене и представљене. Могуће је модификовати и/или побољшати скупове података који нису у потпуности репрезентативни.
Поред тога, треба узети у обзир пристрасност приликом процене перформанси модела. Тестирање перформанси модела на различитим подскуповима података може показати да ли је он пристрасан или превише опремљен у односу на одређену групу.
Могуће је проценити перформансе модела машинског учења на одређеним подскуповима података коришћењем техника унакрсне провере. Процедура укључује поделу података у различите скупове података за обуку и тестирање.
Можете елиминисати пристрасност у машинском учењу на следећи начин:
- Када је потребно, поново обучите модел користећи веће, репрезентативније скупове за обуку.
- Успостављање процедуре за проактивно тражење пристрасних резултата и необичних пресуда.
- Поновно пондерисање карактеристика и прилагођавање хиперпараметара по потреби могу помоћи да се узме у обзир пристрасност.
- Подстицање решавања откривене пристрасности кроз континуирани циклус детекције и оптимизације.
Zakljucak
Примамљиво је веровати да би модел машинског учења, једном обучен, функционисао аутономно. У ствари, оперативно окружење модела се увек мења и менаџери морају редовно да обучавају моделе користећи свеже скупове података.
Машинско учење је тренутно једна од најфасцинантнијих технолошких могућности са реалним економским предностима. Машинско учење, када је упарено са технологијама великих података и огромном рачунарском снагом доступном кроз јавни облак, има потенцијал да трансформише начин на који појединци комуницирају са технологијом, а можда и читаве индустрије.
Међутим, колико год технологија машинског учења била обећавајућа, она мора бити пажљиво планирана како би се избегле ненамерне пристрасности. Пристрасност може озбиљно да утиче на ефикасност пресуда које доносе машине, што је нешто што програмери модела машинског учења морају узети у обзир.
Ostavite komentar