Көбүрөөк тармактар операцияларды автоматташтыруу жана тандоо жасоо үчүн алгоритмдердин күчүн колдонуп жаткандыктан, машинаны үйрөнүү азыркы дүйнөнүн иштөөсүнүн маанилүү компонентине айланып баратат.
Машина үйрөнүүдөгү бир тараптуулук маселеси, машина үйрөнүү моделдери ар кандай уюмдардын чечимдерди кабыл алуу процесстерине интеграцияланганда эске алуу абдан маанилүү.
Алгоритмдер тарабынан түзүлгөн тандоолордун калыс жана бир жактуу болбошуна кепилдик берүү машина үйрөнүү моделдерин колдонгон бардык уюмдун максаты болушу керек. Моделдин натыйжаларына таянуу жана адилеттүү катары кароо үчүн, аны таануу жана чечүү маанилүү машина үйрөнүү бир жактуулук.
Бул моделдин түшүндүрмөлүүлүгү же адам үчүн машина үйрөнүү модели кандай жыйынтыкка келгенин түшүнүү канчалык оңой деген суроолорго байланыштуу. Машина үйрөнүү моделдери картага түшүрүп, үйрөнгөн тенденциялар жана үлгүлөр адамдын түз өнүгүүсү аркылуу эмес, маалыматтардын өзүнөн келип чыгат.
Машиналарды үйрөнүүдө бир тараптуулук, эгерде ал көзөмөлдөнбөсө жана текшерилбесе, ар кандай себептерден улам пайда болушу мүмкүн. Модель орнотулганда, ал окуу маалыматтарынын үлгүсүндө так чагылдырылбаган кырдаалдарга көп жолугат.
Модель бул репрезентативдик эмес окуу маалымат топтому үчүн өтө ылайыктуу болушу мүмкүн. Окутуу маалыматтарынын эң сонун сапатына карабастан, моделге дагы эле кеңири маданий таасирлерден келип чыккан тарыхый көз караштар таасир этиши мүмкүн.
Ишке ашырылгандан кийин, бир жактуу модель белгилүү бир топторду жактырышы же белгилүү бир маалымат топтомдорунун тактыгын жоготушу мүмкүн. Бул адамдардын белгилүү бир тобун адилетсиз жазалаган өкүмдөрдүн натыйжасында реалдуу дүйнөгө терс таасирин тийгизиши мүмкүн.
Бул макалада машина үйрөнүүнүн бир жактуулугу, анын ичинде бул эмне, аны кантип аныктоо керек, анын коркунучтары жана башка көптөгөн нерселер талкууланат.
Ошентип, Machine Learning Bias деген эмне?
Машина үйрөнүү процессинде жасалган жалган божомолдордун натыйжасында системалуу түрдө бир жактуу болгон жыйынтыктарды чыгаруучу алгоритм машина үйрөнүү багыты деп аталат, ошондой эле алгоритмдин кыйшаюусу катары белгилүү же AI багыты деп аталат.
Машинаны үйрөнүү - бул моделдин белгилүү бир маалымат топтомун же берилиштердин бир бөлүгүн жактыруу тенденциясы; ал көп учурда репрезентативдик эмес окуу маалымат топтомдору тарабынан келтирилет. Белгилүү бир маалыматтарды чогултуу менен бир жактуу модель начар иштейт, бул анын тактыгына зыян келтирет.
Чыныгы шарттарда, бул бир жактуу окутуу маалыматтары белгилүү бир расага, демографиялык же гендерге артыкчылык берген моделдин натыйжасын бергенин билдириши мүмкүн.
Натыйжада, машина үйрөнүү натыйжалары адилетсиз же басмырлоочу болушу мүмкүн. Өкүл эмес окутуу берилиштер топтомдору бир жактуу салым кошо алат машина үйрөнүүдө.
Натыйжадагы модель, эгерде окутуу маалыматтары жетишсиз болсо же белгилүү бир маалыматтарды топтоо үчүн өтө эле өкүлү болсо, башка, аз көрсөтүлүүчү категорияларга бурулушу мүмкүн. Бул машыгуу берилиштеринин үлгүсү реалдуу дүйнөдөгү жайылтуу чөйрөсүнө так дал келбесе болот.
Белгилүү ооруларга же ооруларга каршы пациенттин маалыматтарын текшерүү үчүн колдонула турган саламаттыкты сактоо тармагындагы машинаны үйрөнүү эң сонун мисал. Моделдер туура колдонулганда, дарыгерлердин кийлигишүүсүн тездете алат.
Бирок, бейкалыс болушу мүмкүн. Улгайган бейтаптын мүмкүн болуучу ооруну алдын ала айтууну сураганда, моделди куруу үчүн колдонулган окутуу маалыматтары көбүнчө кичине курактагы пациенттердин маалыматтарынан турса, жакшы иштей албайт.
Мындан тышкары, тарыхый статистиканы бурмалоого болот. Мисалы, тарыхый жактан алганда, кызматкерлердин көпчүлүгү эркектер болгондуктан, жумушка талапкерлерди чыпкалоо үчүн даярдалган модель эркек талапкерлерге артыкчылык берет.
Машинаны үйрөнүүнүн бир жактуулугу эки сценарийде тең моделдин тактыгына таасирин тийгизет, ал эми эң начар шарттарда ал басмырлоочу жана адилетсиз корутундуларга алып келиши мүмкүн.
Чечимдер кылдаттык менен каралып чыгышы керек, эч кандай калпыстык болбошу керек машина менен окутуунун моделдери уламдан-улам кол операцияларын алмаштыруу. Натыйжада, ар кандай уюмдагы башкаруунун моделдик практикасы машинаны үйрөнүү боюнча мониторингди камтышы керек.
Көптөгөн ар кандай тармактарда жумуштун көптөгөн түрлөрү машина үйрөнүү моделдери менен аяктайт. Бүгүнкү күндө моделдер барган сайын татаал процесстерди автоматташтыруу жана сунуштарды түзүү үчүн колдонулат. Бул чечимди кабыл алуу процессинде бир тараптуулук моделдин белгилүү бир топту экинчисинен артыкчылыкка ээ болушун билдирет.
Чыныгы кесепеттери бар кооптуу чечимдерди чыгаруу үчүн колдонулганда, бул катуу кесепеттерге алып келиши мүмкүн. Кредиттик арыздарды автоматтык түрдө бекитүү үчүн колдонулганда, мисалы, бир жактуу модель белгилүү бир калкка зыян келтириши мүмкүн. Кандайдыр бир иш-аракеттерди текшерүүгө же текшерүүгө мүмкүн болгон жөнгө салынуучу ишканаларда бул өзгөчө маанилүү фактор болуп саналат.
Machine Learning Bias түрлөрү
- Algorithm Bias – Бул алгоритмде ката болгондо, машина үйрөнүү эсептөөлөрүн жүргүзгөн эсептөөлөрдү жүргүзөт.
- Үлгү Bias – Маалыматтар колдонулганда машинаны үйрөнүүгө үйрөтүү моделде көйгөй бар, бул пайда болот. Мындай терс көрүнүштөрдө системаны окутуу үчүн колдонулган маалыматтардын саны же сапаты жетишсиз. Алгоритм, мисалы, окутуу маалыматтары толугу менен аял мугалимдерден турса, бардык мугалимдер аял экенине ишенүүгө үйрөтүлөт.
- Четтетүү – Бул колдонулуп жаткан маалыматтардын топтомунда маанилүү маалымат чекити жок болгондо пайда болот, эгерде моделдөөчүлөр жетишпеген маалымат чекитинин маанисин түшүнө албаса пайда болушу мүмкүн.
- Алдын ала пикир - Бул учурда, машинаны үйрөнүүнүн өзү бир жактуу, анткени системаны окутуу үчүн колдонулган маалыматтар бейкалыс, стереотиптер жана туура эмес социалдык божомолдор сыяктуу реалдуу дүйнөдөгү терс көрүнүштөрдү чагылдырат. Мисалы, эгерде медициналык адистер жөнүндө маалыматтар эркек дарыгерлерди жана аял медайымдарды гана камтыган компьютердик системага киргизилсе, медициналык кызматкерлер жөнүндө чыныгы гендердик стереотип сакталып калат.
- Өлчөө багыты – Аты айтып тургандай, бул бир тараптуулук маалыматтардын сапаты жана аларды чогултуу же баалоо үчүн колдонулган ыкмалар менен байланышкан фундаменталдуу маселелерден келип чыгат. Эгер машыгуу маалыматтарында камтылган салмактар ырааттуу түрдө тегеректелсе, салмакты так баалоого үйрөтүлүп жаткан система бир жактуу болот, ал эми канааттанган кызматкерлердин сүрөттөрүн жумуш ордунда чөйрөнү баалоо үчүн системаны үйрөтүү үчүн колдонуу бир жактуу болушу мүмкүн, эгерде сүрөттөрдөгү кызматкерлер билсе. алар бакыт үчүн өлчөнгөн.
Кандай факторлор машинаны үйрөнүүдө бир тараптуулукка өбөлгө түзөт?
Машинаны үйрөнүүнүн бир жактуулугунун көптөгөн себептери бар болсо да, ал көбүнчө окуу маалыматтарынын өзүндө бир тараптуулуктан келип чыгат. Тренинг маалыматтарындагы бир тараптуулуктун бир нече потенциалдуу негизги себептери бар.
Эң көрүнүктүү иллюстрация - машыгуу маалыматтары, бул типтүү эмес орнотулган системада байкалган шарттардын жыйындысы. Бул бир категориянын аз көрсөтүлүшү же башкасынын пропорционалдуу эмес саны менен машыгуу маалыматтары болушу мүмкүн.
Бул үлгү тенденциясы деп аталат жана ал рандомизацияланбаган машыгуу маалыматтарын чогултуунун натыйжасында пайда болушу мүмкүн. Маалыматтарды чогултуу, талдоо же классификациялоо үчүн колдонулган ыкмалар, ошондой эле маалыматтардын тарыхый тамырлары маалыматтардын өзүндө бир тараптуулукту алып келиши мүмкүн.
Маалымат ал чогулган чоң маданиятта тарыхый жактан бир жактуу болушу мүмкүн.
Машина үйрөнүү тенденциясы көбүнчө төмөнкүлөрдөн келип чыгат:
- Тарыхый маалыматтарда адамдар же коом тарабынан пайда болгон тенденциялар алгоритмдерди окутуу үчүн колдонулат.
- Чыныгы шарттарды чагылдырбаган машыгуу маалыматтары.
- Көзөмөлдөнгөн машина үйрөнүү үчүн дайындарды белгилөөдө же даярдоодо бир тараптуулук.
Мисалы, окутуу маалыматтарынын ар түрдүүлүгүнүн жоктугу өкүлчүлүктүн терс таасирин тийгизиши мүмкүн. Машиналарды үйрөнүү моделдеринин тактыгына кеңири маданияттагы тарыхый көз караштар көп таасир этет.
Бул кээде коомдук же адамдык тентектик деп аталат. Коомчулукка жакын эмес маалыматтардын чоң жыйнагын табуу кыйынга турушу мүмкүн. Машина үйрөнүү циклинин маалыматтарды иштеп чыгуу баскычы адамдын көз карашына бирдей кабылат.
Маалымат таануучу же башка эксперт тарабынан белгиленген жана иштетилген маалыматтар көзөмөлдөнгөн машина үйрөнүү үчүн зарыл. Тазаланган маалыматтардын ар түрдүүлүгүнөн болобу, маалымат чекиттерин белгилөө ыкмасынан болобу же функцияларды тандоодон болобу, бул этикеткалоо процессиндеги бир тараптуулук машинаны үйрөнүүдө бир тараптуулукка алып келиши мүмкүн.
Машина үйрөнүү тобокелдиктери
Модельдер маалыматтарга негизделген чечимдерди кабыл алуу инструменттери болгондуктан, алар калыс баа берет деп болжолдонууда. Машина үйрөнүү моделдеринде көбүнчө натыйжаларга таасир этүүчү бир тараптуулук камтылган.
Барган сайын көп тармактар эскирген программалык камсыздоонун жана процедуралардын ордуна машиналык үйрөнүүнү ишке ашырууда. Бир жактуу моделдер моделдерди колдонуу менен татаалыраак жумуштар автоматташтырылганда реалдуу дүйнөдө терс таасирин тийгизиши мүмкүн.
Машиналарды үйрөнүү башка чечимдерди кабыл алуу процесстеринен эч айырмаланбайт, анткени уюмдар жана адамдар аны ачык жана адилеттүү деп күтүшөт. Машина үйрөнүү автоматташтырылган процесс болгондуктан, аны колдонуу менен жасалган чечимдер кээде ого бетер кылдат каралат.
Уюмдардын коркунучтарды чечүүдө жигердүү болушу өтө маанилүү, анткени машинаны үйрөнүүдө бир тараптуулук кээ бир калкка дискриминациялоочу же терс таасирин тийгизиши мүмкүн. Регламенттелген контексттер үчүн, атап айтканда, машинаны үйрөнүүдө бир тараптуулук мүмкүнчүлүгүн эске алуу керек.
Мисалы, банк ишинде машиналык үйрөнүү баштапкы текшерүүдөн кийин ипотекалык талапкерлерди автоматтык түрдө кабыл алуу же четке кагуу үчүн колдонулушу мүмкүн. Талапкерлердин белгилүү бир тобуна бир жактуу болгон модель талапкерге да, уюмга да терс таасирин тийгизиши мүмкүн.
Иш-аракеттер текшерилиши мүмкүн болгон жайгаштыруу чөйрөсүндө табылган кандайдыр бир жактуулук чоң көйгөйлөргө алып келиши мүмкүн. Модель иштебей калышы мүмкүн жана эң начар сценарийлерде атайылап басмырлоочу болуп чыгышы мүмкүн.
Бир тараптуулукту кылдаттык менен баалоо жана ага даярдануу керек, анткени бул моделдин жайылтуудан толугу менен алынып салынышына алып келиши мүмкүн. Моделдик чечимдерге ишенимге ээ болуу үчүн машинаны үйрөнүү жагын түшүнүүнү жана чечүүнү талап кылат.
Уюмдун ичиндеги жана тышкы кызматты керектөөчүлөрдүн ортосундагы ишенимдин деңгээли моделдик чечимдерди кабыл алууда бир тараптуулуктан улам таасир этиши мүмкүн. Модельдерге ишенбесе, өзгөчө коркунучтуу тандоолорду жетектөөдө, алар уюмдагы потенциалын толук пайдаланышпайт.
Моделдин түшүндүрмөлүүлүгүн баалоодо бир тараптуулукту эсепке алуу эске алынуучу фактор болушу керек. Моделди тандоонун жарактуулугуна жана тактыгына текшерилбеген машина үйрөнүү терс таасирин тийгизиши мүмкүн.
Ал кээде айрым адамдарга же топторго таасир эте турган дискриминациялык аракеттерге алып келиши мүмкүн. Машина үйрөнүү моделинин ар кандай түрлөрү үчүн көптөгөн тиркемелер бар жана алардын ар бири кандайдыр бир даражада машинаны үйрөнүүнүн терс таасирине дуушар болот.
Машина үйрөнүү бурмалоо төмөнкүчө чагылдырылган:
- Тренинг маалыматтарында ар түрдүүлүктүн жоктугунан улам, кээ бир расалык топтор үчүн жүзүн таануу алгоритмдери азыраак так болушу мүмкүн.
- Программа адамдык же тарыхый жек көрүүдөн улам маалыматтардагы расалык жана гендердик көз карашты аныктай алат.
- Белгилүү бир диалект же акцент менен табигый тилди иштетүү такыраак болушу мүмкүн жана ал окутуу маалыматтарында аз көрсөтүлүүчү акцентти иштете албашы мүмкүн.
Машинаны үйрөнүүдө бир тараптуулукту чечүү
Мониторинг жүргүзүү жана моделдерди кайра окутуу - бул машина үйрөнүүнүн бир жактуулугун чечүүнүн эки жолу. Көпчүлүк учурларда, моделдин кыйшаюусу окутуу маалыматтарындагы бир жактуулуктун көрсөткүчү болуп саналат, же жок эле дегенде, бир тараптуулук машинаны үйрөнүү циклинин окуу стадиясына байланыштуу болушу мүмкүн.
Моделдин жашоо циклинин ар бир этабында моделдин бурмаланышын же дрейфтин алдын алуу үчүн процедуралар болушу керек. Орнотулгандан кийин машина үйрөнүүсүнө мониторинг жүргүзүү процесстери да камтылган. Моделди жана берилиштер топтомун бир жактуулук үчүн тез-тез текшерип туруу маанилүү.
Бул топтордун кантип бөлүштүрүлгөнүн жана ал жерде көрсөтүлүшүн көрүү үчүн тренингдин маалымат топтомун изилдөөнү камтышы мүмкүн. Толугу менен өкүлү болбогон маалымат топтомдорун өзгөртүүгө жана/же жакшыртууга болот.
Мындан тышкары, моделдин натыйжалуулугун баалоодо бир тараптуулукту эске алуу керек. Берилиштердин ар кандай топтомдорунда моделдин иштешин тестирлөө анын белгилүү бир топко карата бир жактуу же ашыкча жабдылганын көрсөтө алат.
Кайчылаш валидация ыкмаларын колдонуу менен белгилүү бир маалымат бөлүмдөрүндө машина үйрөнүү моделинин иштешин баалоого болот. Процедура маалыматтарды өзүнчө окутуу жана тестирлөө маалымат топтомуна бөлүүнү камтыйт.
Сиз машинаны үйрөнүүдө бир тараптуулукту жок кыла аласыз:
- Зарыл болгондо, чоңураак, репрезентативдик машыгуу топтомдорун колдонуу менен моделди кайра үйрөтүңүз.
- Бир жактуу жыйынтыктарды жана адаттан тыш чечимдерди алдын ала кароо үчүн жол-жоболорду түзүү.
- Функцияларды кайра өлчөө жана гиперпараметрлерди зарыл учурда тууралоо бир тараптуулукту эсепке алууга жардам берет.
- Аныктоо жана оптималдаштыруунун үзгүлтүксүз цикли аркылуу табылган бир тараптуулукту чечүүнү кубаттоо.
жыйынтыктоо
Машина үйрөнүү модели бир жолу машыккандан кийин, өз алдынча иштей тургандыгына ишенүү азгырылат. Чынында, моделдин иштөө чөйрөсү ар дайым өзгөрүп турат жана менеджерлер үзгүлтүксүз негизде жаңы маалыматтар топтомун колдонуу менен моделдерди кайра үйрөтүшү керек.
Учурда машинаны үйрөнүү реалдуу экономикалык пайдалары бар эң кызыктуу технологиялык мүмкүнчүлүктөрдүн бири болуп саналат. Машина үйрөнүү, чоң маалымат технологиялары жана коомдук булут аркылуу жеткиликтүү эбегейсиз эсептөө күчү менен жупташканда, адамдардын технология менен, балким, бүтүндөй тармактар менен өз ара аракеттенүүсүн өзгөртүү мүмкүнчүлүгү бар.
Бирок, машинада окутуунун технологиясы кандай келечектүү болсо да, аны ойлонбогон бир жактуулукка жол бербөө үчүн кылдат пландаштыруу керек. Машиналар чыгарган чечимдердин натыйжалуулугуна бир тараптуулук катуу таасир этиши мүмкүн, бул машина үйрөнүү моделин иштеп чыгуучулар эске алышы керек.
Таштап Жооп