Па меры таго як усё больш галін выкарыстоўваюць моц алгарытмаў для аўтаматызацыі аперацый і прыняцця рашэнняў, машыннае навучанне становіцца найважнейшым кампанентам таго, як працуе сучасны свет.
Калі мадэлі машыннага навучання інтэгруюцца ў працэсы прыняцця рашэнняў у розных арганізацыях, вельмі важна ўлічваць праблему прадузятасці ў машынным навучанні.
Мэтай любой арганізацыі, якая выкарыстоўвае мадэлі машыннага навучання, павінна быць гарантыя таго, што выбар, зроблены алгарытмамі, бесстаронні і пазбаўлены прадузятасці. Каб гарантаваць, што вынікі мадэлі можна спадзявацца і разглядаць як справядлівыя, вельмі важна распазнаваць і разглядаць навучанне з дапамогай машыны прадузятасць.
Гэта звязана з пытаннямі тлумачальнасці мадэлі або з тым, наколькі лёгка чалавеку зразумець, як мадэль машыннага навучання прыйшла да высновы. Тэндэнцыі і заканамернасці, якія адлюстроўваюць і вывучаюць мадэлі машыннага навучання, паходзяць з саміх даных, а не праз непасрэднае развіццё чалавека.
Зрушэнні ў машынным навучанні могуць узнікаць па розных прычынах, калі іх не кантраляваць і не правяраць. Калі мадэль разгортваецца, яна часта сутыкаецца з сітуацыямі, якія недакладна адлюстраваны ў выбарцы навучальных даных.
Мадэль магла быць пераабсталяванай для гэтага нерэпрэзентатыўнага навучальнага набору даных. Нягледзячы на выдатную якасць навучальных даных, на мадэль усё яшчэ можа паўплываць гістарычная прадузятасць, якая ўзнікае ў выніку больш шырокіх культурных уплываў.
Пасля ўкаранення прадузятая мадэль можа спрыяць пэўным групам або страціць дакладнасць з пэўнымі падмноствамі даных. Гэта можа прывесці да рашэнняў, якія несправядліва караюць пэўную групу асоб, што можа мець негатыўныя наступствы для рэальнага свету.
У гэтым артыкуле абмяркоўваецца прадузятасць машыннага навучання, у тым ліку што гэта такое, як яго выявіць, небяспекі, якія ён нясе, і многае іншае.
Такім чынам, што такое прадузятасць машыннага навучання?
Алгарытм, які стварае вынікі, якія сістэматычна зрушаны ў выніку ілжывых здагадак, зробленых у працэсе машыннага навучання, вядомы як зрушэнне машыннага навучання, таксама вядомае як зрушэнне алгарытму або зрушэнне штучнага інтэлекту.
Зрушэнне машыннага навучання - гэта тэндэнцыя мадэлі аддаваць перавагу пэўнаму набору даных або падмноства даных; гэта часта выклікана нерэпрэзентатыўнымі навучальнымі наборамі даных. Пры пэўным зборы даных прадузятая мадэль будзе працаваць недастаткова, што пагоршыць яе дакладнасць.
У рэальных умовах гэта можа азначаць, што неаб'ектыўныя даныя навучання прывялі да таго, што мадэль аддае перавагу пэўнай расе, дэмаграфічнай групе або полу.
У выніку вынікі машыннага навучання могуць быць несправядлівымі або дыскрымінацыйнымі. Нерэпрэзентатыўнае навучанне наборы дадзеных могуць спрыяць прадузятасці у машынным навучанні.
Атрыманая мадэль можа быць зрушана ў бок іншых, недастаткова прадстаўленых катэгорый, калі вучэбныя даныя адсутнічаюць або занадта рэпрэзентатыўныя для пэўнай групы даных. Гэта можа адбыцца, калі ўзор навучальных даных не адпавядае дакладнаму асяроддзю разгортвання ў рэальным свеце.
Яркім прыкладам з'яўляецца машыннае навучанне ў сферы аховы здароўя, якое можна выкарыстоўваць для праверкі даных пацыентаў на наяўнасць вядомых захворванняў. Мадэлі могуць паскорыць умяшанне практыкуючых лекараў, калі яны выкарыстоўваюцца належным чынам.
Аднак забабоны магчымыя. Калі яе просяць прадказаць магчымую хваробу ў старэйшага пацыента, мадэль не можа працаваць добра, калі навучальныя даныя, якія выкарыстоўваюцца для яе пабудовы, у асноўным складаюцца з даных пацыентаў меншага ўзросту.
Акрамя таго, гістарычная статыстыка можа быць скажонай. Напрыклад, паколькі гістарычна большасць супрацоўнікаў складалі мужчыны, мадэль, навучаная фільтраваць кандыдатаў на вакансію, аддавала перавагу мужчынам.
Зрушэнне машыннага навучання будзе мець уплыў на дакладнасць мадэлі ў абодвух сцэнарыях, і ў горшых абставінах можа нават прывесці да дыскрымінацыйных і несправядлівых высноў.
Рашэнні павінны быць старанна перагледжаны, каб пераканацца ў адсутнасці прадузятасці мадэлі машыннага навучання замяніць усё больш і больш ручных аперацый. У выніку мадэльная практыка кіравання ў любой арганізацыі павінна ўключаць маніторынг прадузятасці машыннага навучання.
Шмат розных тыпаў працоўных месцаў у розных галінах прамысловасці выконваюцца мадэлямі машыннага навучання. Сёння мадэлі выкарыстоўваюцца для аўтаматызацыі ўсё больш складаных працэсаў і для стварэння прапаноў. У гэтым працэсе прыняцця рашэнняў прадузятасць азначае, што мадэль можа аддаваць перавагу адной канкрэтнай групе перад іншай на падставе вывучанай прадузятасці.
Пры выкарыстанні для вынясення небяспечных рашэнняў з рэальнымі наступствамі гэта можа мець сур'ёзныя наступствы. Пры выкарыстанні для аўтаматычнага зацвярджэння крэдытных заявак, напрыклад, прадузятая мадэль можа нанесці шкоду пэўнай групе насельніцтва. У рэгламентаваных прадпрыемствах, дзе любыя дзеянні могуць падвяргацца праверцы або дбайнаму кантролю, гэта асабліва важны фактар, які трэба ўлічваць.
Тыпы ўхілаў машыннага навучання
- Зрушэнне алгарытму – Гэта адбываецца, калі ёсць памылка ў алгарытме, які робіць разлікі, якія кіруюць вылічэннямі машыннага навучання.
- Узор прадузятасці – Калі дадзеныя раней навучыць машыннае навучанне у мадэлі ёсць праблема, гэта адбываецца. У выпадках такога роду прадузятасці колькасць або якасць даных, якія выкарыстоўваюцца для навучання сістэмы, недастатковыя. Алгарытм будзе навучаны лічыць, што ўсе настаўнікі жанчыны, калі, напрыклад, навучальныя даныя цалкам складаюцца з настаўнікаў-жанчын.
- Ухіл выключэння – Гэта адбываецца, калі важная кропка даных адсутнічае ў наборы даных, якія выкарыстоўваюцца, што можа адбыцца, калі распрацоўшчыкі мадэляў не разумеюць значнасці адсутнай кропкі даных.
- Перадузятасць – У гэтым выпадку само машыннае навучанне з'яўляецца прадузятым, паколькі даныя, якія выкарыстоўваюцца для навучання сістэмы, адлюстроўваюць прадузятасці ў рэальным свеце, такія як забабоны, стэрэатыпы і няправільныя сацыяльныя здагадкі. Напрыклад, калі б даныя аб медыцынскіх работніках былі ўключаны ў камп'ютэрную сістэму, якая ўключала б толькі лекараў-мужчын і медсясцёр, гендэрны стэрэатып аб медыцынскіх работніках захаваўся б у рэальным свеце.
- Зрушэнне вымярэння – Як вынікае з назвы, гэтая прадузятасць вынікае з фундаментальных праблем з якасцю даных і метадаў, якія выкарыстоўваюцца для іх збору або ацэнкі. Сістэма, якую навучаюць дакладнай ацэнцы вагі, будзе неаб'ектыўнай, калі вагавыя паказчыкі, якія змяшчаюцца ў навучальных дадзеных, пастаянна акругляюцца ў большы бок, і выкарыстанне выяваў задаволеных супрацоўнікаў для навучання сістэмы, прызначанай для ацэнкі працоўнага асяроддзя, можа быць неаб'ектыўнай, калі супрацоўнікі на фотаздымках ведалі, іх вымяралі на шчасце.
Якія фактары спрыяюць прадузятасці ў машынным навучанні?
Нягледзячы на тое, што ёсць шмат прычын для прадузятасці машыннага навучання, яна часта ўзнікае з-за прадузятасці саміх даных навучання. Ёсць некалькі патэнцыйных асноўных прычын зрушэння даных навучання.
Найбольш відавочнай ілюстрацыяй з'яўляюцца навучальныя даныя, якія ўяўляюць сабой нетыповую падгрупу ўмоў у разгорнутай сістэме. Гэта могуць быць навучальныя даныя з недастатковай прадстаўленасцю адной катэгорыі або непрапарцыйнай колькасцю іншай.
Гэта вядома як зрушэнне выбаркі, і яно можа быць вынікам невыпадковага збору дадзеных навучання. Метады, якія выкарыстоўваюцца для збору, аналізу або класіфікацыі даных, а таксама гістарычныя карані даных, могуць прывесці да зрушэння ў саміх даных.
Інфармацыя можа быць нават гістарычна неаб'ектыўнай у большай культуры, дзе яна была сабрана.
Прадузятасць машыннага навучання ў асноўным выклікана:
- Для навучання алгарытмаў выкарыстоўваюцца зрушэнні, выкліканыя людзьмі ці грамадствам у гістарычных дадзеных.
- Навучальныя даныя, якія не адлюстроўваюць рэальныя абставіны.
- Зрушэнні падчас маркіроўкі або падрыхтоўкі даных для машыннага навучання пад наглядам.
Напрыклад, адсутнасць разнастайнасці ў навучальных даных можа выклікаць зрушэнне ў прадстаўленні. На дакладнасць мадэляў машыннага навучання часта ўплывае гістарычная прадузятасць у больш шырокай культуры.
Гэта часам называюць сацыяльнай або чалавечай прадузятасцю. Знаходжанне велізарных калекцый даных, якія не схільныя грамадству, можа быць складанай задачай. Этап апрацоўкі даных жыццёвага цыкла машыннага навучання аднолькава адчувальны да ўхілу чалавека.
Даныя, пазначаныя і апрацаваныя спецыялістам па апрацоўцы дадзеных або іншым экспертам, неабходныя для машыннага навучання пад наглядам. Незалежна ад таго, ці вынікае гэта з разнастайнасці даных, якія ачышчаюцца, спосабу пазначэння пунктаў даных або выбару функцый, прадузятасць у гэтым працэсе маркіроўкі можа прывесці да прадузятасці ў машынным навучанні.
Рызыкі зрушэння машыннага навучання
Паколькі мадэлі з'яўляюцца інструментамі прыняцця рашэнняў, якія кіруюцца дадзенымі, мяркуецца, што яны забяспечваюць бесстароннія меркаванні. Мадэлі машыннага навучання часта ўтрымліваюць прадузятасць, што можа паўплываць на вынікі.
Усё больш і больш галін укараняюць машыннае навучанне замест састарэлага праграмнага забеспячэння і працэдур. Неаб'ектыўныя мадэлі могуць мець негатыўныя наступствы ў рэальным свеце, калі больш складаныя заданні аўтаматызуюцца з дапамогай мадэляў.
Машыннае навучанне не адрозніваецца ад іншых працэсаў прыняцця рашэнняў тым, што арганізацыі і прыватныя асобы чакаюць, што яно будзе празрыстым і справядлівым. Паколькі машыннае навучанне з'яўляецца аўтаматызаваным працэсам, меркаванні, зробленыя з яго дапамогай, час ад часу вывучаюцца яшчэ больш уважліва.
Вельмі важна, каб арганізацыі былі актыўнымі ў барацьбе з небяспекамі, паколькі прадузятасць машыннага навучання часта можа мець дыскрымінацыйныя або негатыўныя наступствы для некаторых груп насельніцтва. Для рэгуляваных кантэкстаў, у прыватнасці, неабходна прыняць да ўвагі магчымасць зрушэння ў машынным навучанні.
Напрыклад, машыннае навучанне ў банкаўскай справе можа быць выкарыстана для аўтаматычнага прыняцця або адхілення прэтэндэнтаў на іпатэку пасля першапачатковага праверкі. Мадэль, якая прадузята ставіцца да пэўнай групы кандыдатаў, цалкам можа мець шкодныя наступствы як для кандыдата, так і для арганізацыі.
Любая прадузятасць, выяўленая ў асяроддзі разгортвання, дзе дзеянні могуць быць старанна вывучаны, можа прывесці да сур'ёзных праблем. Мадэль можа не спрацаваць і, у горшым выпадку, можа нават апынуцца наўмысна дыскрымінацыйнай.
Неабходна старанна ацаніць зрушэнне і падрыхтавацца да яго, бо яно можа прывесці да поўнага выдалення мадэлі з разгортвання. Каб атрымаць упэўненасць у прыняцці мадэляў рашэнняў, неабходна разуменне і ліквідацыя прадузятасці машыннага навучання.
Узровень даверу ўнутры арганізацыі і сярод знешніх спажыўцоў паслуг можа залежаць ад уяўнай прадузятасці ў прыняцці мадэляў рашэнняў. Калі мадэлям не давяраюць, асабліва пры выбары з высокай рызыкай, іх патэнцыял не будзе выкарыстоўвацца ў поўнай меры ў арганізацыі.
Пры ацэнцы вытлумачальнасці мадэлі ўлік зрушэння павінен быць фактарам, які трэба прымаць да ўвагі. На абгрунтаванасць і дакладнасць выбару мадэляў можа сур'ёзна паўплываць неправераная прадузятасць машыннага навучання.
Часам гэта можа прывесці да дыскрымінацыйных дзеянняў, якія могуць закрануць асобных людзей або групы. Існуе мноства прыкладанняў для розных тыпаў мадэляў машыннага навучання, і кожная з іх у той ці іншай ступені схільная зрушэнню машыннага навучання.
Прадузятасць машыннага навучання ілюструецца:
- З-за адсутнасці разнастайнасці навучальных даных алгарытмы распазнання асоб могуць быць менш дакладнымі для некаторых расавых груп.
- Праграма магла выявіць расавую і гендэрную прадузятасць у дадзеных з-за чалавечых або гістарычных забабонаў.
- З пэўным дыялектам або акцэнтам апрацоўка натуральнай мовы можа быць больш дакладнай, і яна можа быць не ў стане апрацаваць акцэнт, які недастаткова прадстаўлены ў дадзеных навучання.
Рашэнне прадузятасці ў машынным навучанні
Мадэлі маніторынгу і перападрыхтоўкі пры выяўленні прадузятасці - гэта два спосабы барацьбы з прадузятасцю машыннага навучання. У большасці выпадкаў зрушэнне мадэлі з'яўляецца прыкметай зрушэння ў навучальных даных, або, прынамсі, зрушэнне можа быць звязана з этапам навучання ў жыццёвым цыкле машыннага навучання.
На кожным этапе жыццёвага цыкла мадэлі павінны быць устаноўлены працэдуры для ўлоўлівання зрушэння або дрэйфу мадэлі. Таксама ўключаны працэсы маніторынгу машыннага навучання пасля разгортвання. Важна часта правяраць мадэль і наборы даных на прадузятасць.
Гэта можа ўключаць вывучэнне набору навучальных даных, каб убачыць, як там размеркаваны і прадстаўлены групы. Можна змяніць і/ці палепшыць наборы даных, якія не з'яўляюцца цалкам рэпрэзентатыўнымі.
Акрамя таго, варта ўлічваць зрушэнне пры ацэнцы прадукцыйнасці мадэлі. Тэставанне прадукцыйнасці мадэлі на розных падмноствах даных можа паказаць, ці з'яўляецца яна прадузятай або пераабсталяванай у адносінах да пэўнай групы.
Можна ацаніць прадукцыйнасць мадэлі машыннага навучання на пэўных падмноствах даных з дапамогай метадаў перакрыжаванай праверкі. Працэдура ўключае ў сябе падзел даных на асобныя навучальныя і тэставыя наборы даных.
Вы можаце ліквідаваць прадузятасць у машынным навучанні:
- Калі неабходна, перавучыце мадэль, выкарыстоўваючы большыя, больш рэпрэзентатыўныя навучальныя наборы.
- Стварэнне працэдуры, каб актыўна выяўляць неаб'ектыўныя вынікі і незвычайныя меркаванні.
- Паўторнае ўзважванне функцый і карэкціроўка гіперпараметраў пры неабходнасці можа дапамагчы ўлічыць зрушэнне.
- Заахвочванне вырашэння выяўленых зрушэнняў праз бесперапынны цыкл выяўлення і аптымізацыі.
заключэнне
Хочацца паверыць, што пасля навучання мадэль машыннага навучання будзе працаваць аўтаномна. Фактычна асяроддзе працы мадэлі пастаянна мяняецца, і менеджэры павінны рэгулярна перавучваць мадэлі, выкарыстоўваючы свежыя наборы даных.
Машыннае навучанне ў цяперашні час з'яўляецца адной з самых захапляльных тэхналагічных магчымасцей з рэальнымі эканамічнымі перавагамі. Машыннае навучанне ў спалучэнні з тэхналогіямі вялікіх даных і велізарнай вылічальнай магутнасцю, даступнай праз агульнадаступнае воблака, можа змяніць тое, як людзі ўзаемадзейнічаюць з тэхналогіямі і, магчыма, цэлымі галінамі.
Аднак, наколькі перспектыўнай ні з'яўляецца тэхналогія машыннага навучання, яе трэба старанна планаваць, каб пазбегнуць ненаўмысных зрушэнняў. Эфектыўнасць рашэнняў, якія прымаюцца машынамі, можа сур'ёзна залежаць ад прадузятасці, што павінны ўлічваць распрацоўшчыкі мадэлі машыннага навучання.
Пакінуць каментар