Како што повеќе индустрии ја користат моќта на алгоритмите за да ги автоматизираат операциите и да прават избори, машинското учење станува клучна компонента за тоа како функционира современиот свет.
Прашањето за пристрасност во машинското учење е клучно да се земе предвид кога моделите за машинско учење се интегрираат во процесите на донесување одлуки на различни организации.
Да се гарантира дека изборите генерирани од алгоритмите се непристрасни и без пристрасност треба да биде целта на секоја организација која користи модели за машинско учење. За да се осигури дека резултатите од моделот може да се потпрат и да се гледаат како правични, од клучно значење е да се препознаат и да се решат машинско учење пристрасност
Тоа е поврзано со прашања за објаснување на моделот, или колку е лесно за едно лице да сфати како моделот за машинско учење дошол до заклучок. Трендовите и обрасците што моделите за машинско учење ги мапираат и учат доаѓаат од самите податоци, а не преку директен човечки развој.
Пристрасноста во машинското учење може да се појави поради различни причини ако не се контролира и проверува. Кога се применува модел, тој често наидува на ситуации кои не се прецизно рефлектирани во примерокот на податоци за обука.
Моделот можеше да биде премногу соодветен за овој нерепрезентативен сет на податоци за обука. И покрај одличниот квалитет на податоците за обуката, моделот сè уште може да биде под влијание на историската пристрасност што произлегува од пошироките културни влијанија.
Откако ќе се имплементира, пристрасен модел може да фаворизира одредени групи или да ја изгуби точноста со одредени подмножества на податоци. Ова може да резултира со пресуди кои неправедно казнуваат одредена група поединци, што може да има негативни ефекти врз вистинскиот свет.
Оваа статија дискутира за пристрасноста на машинското учење, вклучувајќи што е тоа, како да се забележи, опасностите што ги носи и многу повеќе.
Значи, што е пристрасност за машинско учење?
Алгоритам кој произведува резултати кои се систематски пристрасни како резултат на лажни претпоставки направени за време на процесот на машинско учење е познат како пристрасност за машинско учење, исто така познат како пристрасност на алгоритам или познат како AI пристрасност.
Пристрасноста на машинското учење е тенденција на моделот да фаворизира одреден сет на податоци или подмножество податоци; тоа често е предизвикано од нерепрезентативни збирки на податоци за обука. Со одредено собирање на податоци, пристрасен модел ќе има недоволно работење, што ќе и наштети на неговата точност.
Во реалниот свет, ова може да имплицира дека пристрасните податоци за обука резултирале со резултат на моделот кој фаворизира одредена раса, демографска или пол.
Како резултат на тоа, резултатите од машинското учење може да бидат неправедни или дискриминирачки. Нерепрезентативна обука збирките на податоци може да придонесат за пристрасност во машинското учење.
Резултантниот модел може да биде пристрасен кон други, недоволно застапени категории, доколку податоците за обуката недостасуваат или се премногу репрезентативни за одредена групација на податоци. Ова може да се случи ако примерокот на податоци за обука не се совпаѓа прецизно со околината за распоредување во реалниот свет.
Машинското учење во здравствената индустрија, кое може да се користи за проверка на податоците за пациентите против познати болести или болести, е одличен пример. Моделите можат да ги забрзаат интервенциите на лекарите кога соодветно се користат.
Сепак, можни се предрасуди. Кога се бара да се предвиди можна болест кај постар пациент, моделот не може да функционира добро ако податоците за обука што се користат за негово конструирање главно се состојат од податоци за пациенти од помал опсег на возраст.
Дополнително, историската статистика може да биде искривена. На пример, бидејќи историски, мнозинството вработени беа мажи, моделот обучен да ги филтрира кандидатите за работа би ги фаворизирал машките апликанти.
Пристрасноста на машинското учење ќе има влијание врз прецизноста на моделот и во двете сценарија, а во најлошите околности, може дури и да резултира со дискриминирачки и неправедни заклучоци.
Одлуките мора внимателно да се прегледаат за да се осигура дека нема пристрасност модели на машинско учење заменете се повеќе и повеќе рачни операции. Како резултат на тоа, практиките за управување со модели во која било организација треба да вклучуваат следење за пристрасност на машинското учење.
Многу различни видови на работни места во многу различни индустрии се завршуваат со модели за машинско учење. Денес, моделите се користат за автоматизирање на потешките процеси и за генерирање предлози. Во овој процес на одлучување, пристрасноста значи дека моделот би можел да фаворизира една одредена група пред друга врз основа на научена пристрасност.
Кога се користи за донесување небезбедни пресуди со реални последици, ова може да има сериозни последици. Кога се користи за автоматско одобрување на апликации за заем, на пример, пристрасен модел може да наштети на одредена популација. Во регулираните бизниси каде што било какви дејства може да се проверат или проверат, ова е особено клучен фактор што треба да се земе предвид.
Видови пристрасност за машинско учење
- Пристрасност на алгоритам – Ова се случува кога има грешка во алгоритмот што ги прави пресметките што ги поттикнуваат пресметките за машинско учење.
- Пристрасност на примерокот – Кога податоците порано обучете го машинското учење моделот има проблем, ова се случува. Во случаи на овој вид пристрасност, количината или квалитетот на податоците што се користат за обука на системот е недоволен. Алгоритмот ќе биде обучен да верува дека сите наставници се жени, ако, на пример, податоците за обуката се целосно составени од наставнички.
- Пристрасност на исклучувањето – Ова се случува кога отсуствува клучна податочна точка од множеството податоци што се користат, што може да се случи ако моделарите не успеат да го сфатат значењето на точката на податоци што недостасува.
- Пристрасност на предрасуди – Во овој пример, самото машинско учење е пристрасно бидејќи податоците што се користат за обука на системот ги одразуваат предрасудите од реалниот свет, како што се предрасудите, стереотипите и неточните општествени претпоставки. На пример, доколку податоците за медицинските работници се вклучат во компјутерскиот систем кој вклучува само машки лекари и медицински сестри, ќе се овековечи реалниот родовиот стереотип за здравствените работници.
- Мерење пристрасност – Како што имплицира името, оваа пристрасност произлегува од фундаментални прашања со квалитетот на податоците и методите што се користат за нивно собирање или оценување. Системот што е обучен за прецизно проценување на тежината ќе биде пристрасен ако тежините содржани во податоците за обуката се постојано заокружени, а користењето слики на задоволни вработени за обука на систем наменет за проценка на работната средина може да биде пристрасно ако вработените на сликите знаеле се мереле за среќа.
Кои фактори придонесуваат за пристрасност во машинското учење?
Иако постојат многу причини за пристрасност во машинското учење, таа често произлегува од пристрасност во самите податоци за обуката. Постојат неколку потенцијални основни причини за пристрасност во податоците за обуката.
Најочигледна илустрација се податоците за обука, кои се подмножество на услови што се гледаат во распореден систем што не е типичен. Ова може да се податоци за обука со недоволна застапеност на една категорија или непропорционална количина на друга.
Ова е познато како пристрасност на примерокот и може да резултира од нерандомизирано собирање податоци за обука. Методите што се користат за собирање, анализа или класификација на податоците, како и историските корени на податоците, може да доведат до пристрасност во самите податоци.
Информациите може да бидат дури и пристрасни историски во поголемата култура каде што се собрани.
Пристрасноста на машинското учење најчесто е предизвикана од:
- Предрасудите предизвикани од луѓето или општеството во историските податоци се користат за обука на алгоритми.
- Податоци за обука кои не ги одразуваат реалните околности.
- Пристрасност при етикетирање или подготовка на податоци за надгледувано машинско учење.
На пример, недостатокот на разновидност во податоците за обуката може да предизвика пристрасност во претставувањето. Прецизноста на моделите за машинско учење е често под влијание на историската пристрасност во пошироката култура.
Ова понекогаш се нарекува социјална или човечка пристрасност. Пронаоѓањето огромни збирки на податоци кои не се склони кон општествена пристрасност може да биде предизвик. Фазата на обработка на податоци од животниот циклус на машинско учење е подеднакво подложна на човечка пристрасност.
Податоците што се означени и обработени од научник за податоци или друг експерт се неопходни за надгледувано машинско учење. Без разлика дали произлегува од разновидноста на податоците што се чистат, начинот на кој се означуваат точките за податоци или изборот на карактеристики, пристрасноста во овој процес на етикетирање може да доведе до пристрасност во машинското учење.
Ризици од пристрасност во машинското учење
Бидејќи моделите се алатки за донесување одлуки водени од податоци, се претпоставува дека тие обезбедуваат непристрасни судови. Моделите за машинско учење често содржат пристрасност, што може да влијае на резултатите.
Сè повеќе индустрии имплементираат машинско учење наместо застарен софтвер и процедури. Пристрасните модели може да имаат негативни ефекти во реалниот свет кога се автоматизираат покомплицирани работни места со користење на модели.
Машинското учење не се разликува од другите процеси на донесување одлуки затоа што организациите и поединците очекуваат тоа да биде транспарентно и правично. Бидејќи машинското учење е автоматизиран процес, пресудите направени со негова употреба повремено се испитуваат уште повнимателно.
Од клучно значење е организациите да бидат проактивни во справувањето со опасностите бидејќи пристрасноста во машинското учење често може да има дискриминаторски или негативни ефекти врз некои популации. За регулираните контексти, особено, мора да се земе предвид можноста за пристрасност во машинското учење.
На пример, машинското учење во банкарството може да се користи за автоматско прифаќање или отфрлање на апликантите за хипотека по првичниот преглед. Моделот кој е пристрасен кон одредена група кандидати може да има штетни ефекти и врз кандидатот и врз организацијата.
Секоја пристрасност пронајдена во опкружување за распоредување каде дејствата може да се проверуваат може да доведе до големи проблеми. Моделот може да не функционира и, во најлошите сценарија, може дури и да испадне дека е намерно дискриминаторски.
Пристрасноста мора внимателно да се процени и подготви бидејќи може да резултира со целосно отстранување на моделот од распоредувањето. Стекнувањето доверба во одлуките за моделот бара разбирање и справување со пристрасноста на машинското учење.
Нивото на доверба во организацијата и меѓу надворешните потрошувачи на услуги може да биде под влијание на воочената пристрасност во донесувањето одлуки за моделот. Ако на моделите не им се верува, особено кога се водат избори со висок ризик, тие нема да се искористат до полн потенцијал во организацијата.
При оценувањето на објаснливоста на моделот, сметководството за пристрасност треба да биде фактор што треба да се земе предвид. На валидноста и точноста на изборот на модели може сериозно да влијае непроверената пристрасност за машинско учење.
Повремено може да резултира со дискриминаторски дејствија кои би можеле да влијаат на одредени луѓе или групи. Постојат бројни апликации за различни типови модели на машинско учење, и секоја е подложна на пристрасност на машинското учење до одреден степен.
Пристрасноста за машинско учење е илустрирана со:
- Поради отсуството на разновидност во податоците за обуката, алгоритмите за препознавање лица може да бидат помалку точни за некои расни групи.
- Програмата може да открие расна и родова пристрасност во податоците поради човечки или историски предрасуди.
- Со одреден дијалект или акцент, обработката на природниот јазик би можела да биде попрецизна и можеби нема да може да обработи акцент што е недоволно застапен во податоците за обуката.
Решавање на пристрасност во машинското учење
Моделите за следење и преквалификација кога ќе се најде пристрасност се два начини за справување со пристрасноста на машинското учење. Во повеќето случаи, пристрасноста на моделот е показател за пристрасност во податоците за обуката, или барем пристрасноста може да се поврзе со фазата на обука на животниот циклус на машинско учење.
Секоја фаза од животниот циклус на моделот треба да има процедури за да се фати пристрасност или оддалечување на моделот. Вклучени се и процеси за следење на машинското учење по распоредувањето. Важно е често да се проверуваат моделите и збирките на податоци за пристрасност.
Ова може да вклучи испитување на базата на податоци за обука за да се види како групите се дистрибуирани и претставени таму. Можно е да се изменат и/или да се подобрат збирките на податоци кои не се целосно репрезентативни.
Дополнително, при проценка на перформансите на моделот треба да се земе предвид пристрасноста. Тестирањето на перформансите на моделот на различни подмножества на податоци може да покаже дали тој е пристрасен или преоптоварен во однос на одредена група.
Можно е да се проценат перформансите на моделот за машинско учење на одредени подмножества на податоци со користење на техники за вкрстена валидација. Постапката вклучува поделба на податоците на посебни групи на податоци за обука и тестирање.
Можете да ја елиминирате пристрасноста во машинското учење со:
- Кога е потребно, преквалифицирајте го моделот користејќи поголеми, порепрезентативни сетови за обука.
- Воспоставување постапка за проактивно да се внимава на пристрасни резултати и невообичаени пресуди.
- Повторното мерење на карактеристиките и прилагодувањето на хиперпараметрите по потреба може да помогне да се земе предвид пристрасноста.
- Поттикнување на разрешување на откриената пристрасност преку континуиран циклус на откривање и оптимизација.
Заклучок
Примамливо е да се верува дека откако ќе се обучи, моделот за машинско учење ќе функционира автономно. Всушност, оперативното опкружување на моделот секогаш се менува и менаџерите мора да ги преквалификуваат моделите користејќи свежи збирки податоци на редовна основа.
Машинското учење во моментов е една од најфасцинантните технолошки способности со економски придобивки од реалниот свет. Машинското учење, кога е поврзано со технологиите за големи податоци и огромната пресметковна моќ достапна преку јавниот облак, има потенцијал да го трансформира начинот на кој поединците комуницираат со технологијата, а можеби и со цели индустрии.
Сепак, колку и да е ветувачка технологијата за машинско учење, таа мора внимателно да се планира за да се избегнат ненамерни предрасуди. Ефективноста на пресудите направени од машините може да биде сериозно под влијание на пристрасност, што е нешто што програмерите на моделите за машинско учење мора да го земат предвид.
Оставете Одговор