Քանի որ ավելի շատ արդյունաբերություններ օգտագործում են ալգորիթմների ուժը՝ գործառնություններն ավտոմատացնելու և ընտրություն կատարելու համար, մեքենայական ուսուցումը դառնում է ժամանակակից աշխարհի գործունեության կարևոր բաղադրիչ:
Մեքենայական ուսուցման մեջ կողմնակալության հարցը շատ կարևոր է հաշվի առնել, երբ մեքենայական ուսուցման մոդելները ինտեգրվում են տարբեր կազմակերպությունների որոշումների կայացման գործընթացներին:
Երաշխավորել, որ ալգորիթմների կողմից ստեղծված ընտրությունները անկողմնակալ են և զուրկ են կողմնակալությունից, պետք է լինի ցանկացած կազմակերպության նպատակը, որն օգտագործում է մեքենայական ուսուցման մոդելներ: Ապահովելու համար, որ մոդելի արդյունքները կարող են հենվել և դիտվել որպես արդար, կարևոր է ճանաչել և լուծել. Machine Learning կողմնակալություն
Այն կապված է մոդելի բացատրելիության հարցերի հետ, կամ թե որքան հեշտ է մարդու համար հասկանալ, թե ինչպես է մեքենայական ուսուցման մոդելը եկել եզրակացության: Միտումները և օրինաչափությունները, որոնք քարտեզագրում և սովորում են մեքենայական ուսուցման մոդելները, բխում են հենց տվյալներից, այլ ոչ թե ուղղակի մարդկային զարգացման միջոցով:
Մեքենայի ուսուցման մեջ կողմնակալությունը կարող է առաջանալ տարբեր պատճառներով, եթե այն չվերահսկվի և չստուգվի: Երբ մոդելը տեղակայվում է, այն հաճախ հանդիպում է իրավիճակների, որոնք ճշգրիտ չեն արտացոլվում վերապատրաստման տվյալների նմուշում:
Մոդելը կարող էր չափազանց հարմար լինել այս չներկայացնող ուսուցման տվյալների համար: Չնայած վերապատրաստման տվյալների գերազանց որակին, մոդելի վրա դեռևս կարող է ազդել պատմական կողմնակալությունը, որն առաջանում է ավելի լայն մշակութային ազդեցություններից:
Կիրառվելուց հետո կողմնակալ մոդելը կարող է նպաստել որոշակի խմբերի կամ կորցնել ճշգրտությունը որոշակի տվյալների ենթաբազմությունների հետ: Սա կարող է հանգեցնել դատողությունների, որոնք անարդարացիորեն պատժում են անհատների որոշակի խմբին, ինչը կարող է բացասական ազդեցություն ունենալ իրական աշխարհի վրա:
Այս հոդվածը քննարկում է մեքենայական ուսուցման կողմնակալությունը, ներառյալ այն, թե ինչ է դա, ինչպես նկատել այն, վտանգները և շատ ավելին:
Այսպիսով, ի՞նչ է մեքենայական ուսուցման կողմնակալությունը:
Մեքենայական ուսուցման գործընթացում արված կեղծ ենթադրությունների արդյունքում համակարգված ելքեր արտադրող ալգորիթմը հայտնի է որպես մեքենայական ուսուցման կողմնակալություն, որը նաև հայտնի է որպես ալգորիթմի կողմնակալություն կամ հայտնի է որպես AI կողմնակալություն:
Մեքենայական ուսուցման կողմնակալությունը մոդելի միտումն է՝ նպաստելու տվյալների որոշակի հավաքածուին կամ տվյալների ենթաբազմությանը. այն հաճախ առաջանում է ոչ ներկայացուցչական ուսուցման տվյալների հավաքածուներով: Տվյալների որոշակի հավաքածուի դեպքում կողմնակալ մոդելը թերակատարում կունենա, ինչը կվնասի դրա ճշգրտությանը:
Իրական միջավայրում դա կարող է ենթադրել, որ վերապատրաստման կողմնակալ տվյալները հանգեցրել են մոդելի արդյունքին, որը նպաստում է որոշակի ռասայի, ժողովրդագրական կամ սեռի:
Արդյունքում, մեքենայական ուսուցման արդյունքները կարող են լինել անարդար կամ խտրական: Ոչ ներկայացուցչական ուսուցում տվյալների հավաքածուները կարող են նպաստել կողմնակալությանը մեքենայական ուսուցման մեջ։
Արդյունքում ստացված մոդելը կարող է կողմնակալ լինել այլ, չներկայացված կատեգորիաների նկատմամբ, եթե ուսուցման տվյալները բացակայում են կամ չափից դուրս ներկայացնում են տվյալ տվյալների խմբավորումը: Դա կարող է տեղի ունենալ, եթե վերապատրաստման տվյալների նմուշը ճշգրտորեն չի համապատասխանում իրական աշխարհի տեղակայման միջավայրին:
Առողջապահության ոլորտում մեքենայական ուսուցումը, որը կարող է օգտագործվել հիվանդների տվյալները հայտնի հիվանդությունների կամ հիվանդությունների դեմ ստուգելու համար, վառ օրինակ է: Մոդելները կարող են արագացնել բժիշկների միջամտությունները, երբ դրանք պատշաճ կերպով օգտագործվեն:
Այնուամենայնիվ, նախապաշարմունքները հնարավոր են: Երբ նրան խնդրեցին կանխատեսել հնարավոր հիվանդությունը տարեց հիվանդի մոտ, մոդելը չի կարող լավ գործել, եթե այն կառուցելու համար օգտագործվող վերապատրաստման տվյալները հիմնականում բաղկացած են ավելի փոքր տարիքային տիրույթից հիվանդների տվյալներից:
Բացի այդ, պատմական վիճակագրությունը կարող է շեղվել: Օրինակ, քանի որ պատմականորեն աշխատողների մեծամասնությունը տղամարդիկ էին, աշխատանքի թեկնածուներին զտելու համար պատրաստված մոդելը կշահեր արական սեռի դիմորդներին:
Մեքենայական ուսուցման կողմնակալությունը կազդի մոդելի ճշգրտության վրա երկու սցենարներում, իսկ ամենավատ դեպքերում դա կարող է նույնիսկ հանգեցնել խտրական և անարդար եզրակացությունների:
Որոշումները պետք է ուշադիր վերանայվեն՝ համոզվելու համար, որ կողմնակալություն չկա մեքենայական ուսուցման մոդելներ փոխարինել ավելի ու ավելի շատ ձեռքով գործողություններ: Արդյունքում, ցանկացած կազմակերպությունում մոդելային կառավարման գործելակերպը պետք է ներառի մեքենայական ուսուցման կողմնակալության մոնիտորինգ:
Շատ տարբեր տեսակի աշխատատեղեր շատ տարբեր ոլորտներում ավարտվում են մեքենայական ուսուցման մոդելներով: Այսօր մոդելներն օգտագործվում են ավելի ու ավելի բարդ գործընթացները ավտոմատացնելու և առաջարկներ ստեղծելու համար: Որոշումների կայացման այս գործընթացում կողմնակալությունը նշանակում է, որ մոդելը կարող է առավելություն տալ մի կոնկրետ խմբին մյուսի նկատմամբ՝ հիմնվելով սովորած կողմնակալության վրա:
Երբ օգտագործվում է իրական հետևանքներով ոչ անվտանգ դատողություններ անելու համար, դա կարող է ունենալ ծանր հետևանքներ: Օրինակ, երբ օգտագործվում է վարկային հայտերը ավտոմատ կերպով հաստատելու համար, կողմնակալ մոդելը կարող է վնասել որոշակի բնակչությանը: Կարգավորվող ձեռնարկություններում, որտեղ ցանկացած գործողություն կարող է ստուգվել կամ մանրակրկիտ ստուգվել, սա հատկապես կարևոր գործոն է, որը պետք է հաշվի առնել:
Մեքենայի ուսուցման կողմնակալության տեսակները
- Ալգորիթմի կողմնակալություն – Դա տեղի է ունենում, երբ ալգորիթմում վրիպակ կա, որը կատարում է մեքենայական ուսուցման հաշվարկները մղող հաշվարկները:
- Նմուշի կողմնակալություն – Երբ տվյալները նախկինում էին վերապատրաստել մեքենայական ուսուցումը մոդելը խնդիր ունի, դա տեղի է ունենում: Այս տեսակի կողմնակալության դեպքերում համակարգի վերապատրաստման համար օգտագործվող տվյալների քանակը կամ որակը բավարար չէ: Ալգորիթմը կպատրաստվի հավատալու, որ բոլոր ուսուցիչները կին են, եթե, օրինակ, վերապատրաստման տվյալները ամբողջությամբ կազմված են կին ուսուցիչներից:
- Բացառման կողմնակալություն – Դա տեղի է ունենում, երբ օգտագործվող տվյալների հավաքածուից բացակայում է կարևորագույն տվյալների կետը, որը կարող է առաջանալ, եթե մոդելավորողները չկարողանան գիտակցել բացակայող տվյալների կետի նշանակությունը:
- Նախապաշարմունքային կողմնակալություն – Այս դեպքում մեքենայական ուսուցումն ինքնին կողմնակալ է, քանի որ համակարգը վարժեցնելու համար օգտագործվող տվյալները արտացոլում են իրական աշխարհի կողմնակալությունները, ինչպիսիք են նախապաշարմունքները, կարծրատիպերը և սխալ սոցիալական ենթադրությունները: Օրինակ, եթե բժշկական մասնագետների վերաբերյալ տվյալները ներառվեն համակարգչային համակարգում, որը ներառում է միայն տղամարդ բժիշկներ և կին բուժքույրեր, ապա առողջապահական աշխատողների վերաբերյալ իրական աշխարհի գենդերային կարծրատիպը կպահպանվի:
- Չափման կողմնակալություն – Ինչպես ենթադրում է անունից, այս կողմնակալությունը պայմանավորված է տվյալների որակի և դրանց հավաքագրման կամ գնահատման համար օգտագործվող մեթոդների հետ կապված հիմնարար խնդիրների պատճառով: Քաշը ճշգրիտ գնահատելու համար վերապատրաստված համակարգը կողմնակալ կլինի, եթե վերապատրաստման տվյալների մեջ պարունակվող կշիռները հետևողականորեն կլորացվեն, և աշխատավայրի միջավայրը գնահատելու համար նախատեսված համակարգ պատրաստելու համար գոհ աշխատողների պատկերների օգտագործումը կարող է կողմնակալ լինել, եթե նկարներում պատկերված աշխատակիցները գիտեն: նրանց չափում էին երջանկության համար:
Ո՞ր գործոններն են նպաստում մեքենայական ուսուցման կողմնակալությանը:
Չնայած մեքենայական ուսուցման կողմնակալության բազմաթիվ պատճառներ կան, այն հաճախ առաջանում է հենց վերապատրաստման տվյալների կողմնակալությունից: Վերապատրաստման տվյալների մեջ կողմնակալության մի քանի հնարավոր հիմքում ընկած պատճառներ կան:
Ամենաակնառու օրինակը վերապատրաստման տվյալներն են, որոնք պայմանների ենթախումբ են, որոնք դիտվում են տեղակայված համակարգում, որը բնորոշ չէ: Սա կարող է լինել վերապատրաստման տվյալներ՝ մի կատեգորիայի թերներկայացմամբ կամ մյուսի անհամաչափ քանակով:
Սա հայտնի է որպես ընտրանքային կողմնակալություն, և դա կարող է առաջանալ ոչ պատահական վերապատրաստման տվյալների հավաքագրման արդյունքում: Տվյալների հավաքագրման, վերլուծության կամ դասակարգման համար օգտագործվող մեթոդները, ինչպես նաև տվյալների պատմական արմատները կարող են հանգեցնել բուն տվյալների կողմնակալության:
Տեղեկությունը կարող է նույնիսկ պատմականորեն կողմնակալ լինել ավելի մեծ մշակույթում, որտեղ այն հավաքվել է:
Մեքենայի ուսուցման կողմնակալությունը հիմնականում պայմանավորված է.
- Մարդկանց կամ հասարակության կողմից առաջացած շեղումները պատմական տվյալների մեջ օգտագործվում են ալգորիթմներ պատրաստելու համար:
- Վերապատրաստման տվյալներ, որոնք չեն արտացոլում իրական աշխարհի հանգամանքները:
- Կողմնակալություն՝ վերահսկվող մեքենայական ուսուցման համար տվյալներ պիտակավորելիս կամ պատրաստելիս:
Օրինակ, վերապատրաստման տվյալների բազմազանության բացակայությունը կարող է առաջացնել ներկայացուցչական կողմնակալություն: Մեքենայի ուսուցման մոդելների ճշգրտության վրա հաճախ ազդում է պատմական կողմնակալությունը ավելի լայն մշակույթում:
Սա երբեմն կոչվում է սոցիալական կամ մարդկային կողմնակալություն: Տվյալների հսկայական հավաքածուներ գտնելը, որոնք հակված չեն հասարակության կողմնակալությանը, կարող է դժվար լինել: Մեքենայի ուսուցման կյանքի ցիկլի տվյալների մշակման փուլը հավասարապես ենթակա է մարդկային կողմնակալության:
Տվյալները, որոնք պիտակավորվել և մշակվել են տվյալների գիտնականի կամ այլ փորձագետի կողմից, անհրաժեշտ են վերահսկվող մեքենայական ուսուցման համար: Անկախ նրանից, թե դա բխում է մաքրվող տվյալների բազմազանությունից, տվյալների կետերի պիտակավորման ձևից կամ առանձնահատկությունների ընտրությունից, այս պիտակավորման գործընթացում կողմնակալությունը կարող է հանգեցնել մեքենայական ուսուցման կողմնակալության:
Մեքենայի ուսուցման կողմնակալության ռիսկերը
Քանի որ մոդելները տվյալների վրա հիմնված որոշումներ կայացնելու գործիքներ են, ենթադրվում է, որ դրանք ապահովում են անաչառ դատողություններ: Մեքենայական ուսուցման մոդելները հաճախ պարունակում են կողմնակալություն, ինչը կարող է ազդել արդյունքների վրա:
Ավելի ու ավելի շատ արդյունաբերություններ են իրականացնում մեքենայական ուսուցում հնացած ծրագրաշարի և ընթացակարգերի փոխարեն: Կողմնակալ մոդելները կարող են բացասական ազդեցություն ունենալ իրական աշխարհում, երբ ավելի բարդ աշխատանքներն ավտոմատացված են՝ օգտագործելով մոդելները:
Մեքենայական ուսուցումը ոչնչով չի տարբերվում որոշումների կայացման այլ գործընթացներից, քանի որ կազմակերպությունները և անհատները ակնկալում են, որ այն լինի թափանցիկ և արդար: Քանի որ մեքենայական ուսուցումը ավտոմատացված գործընթաց է, դրա օգտագործմամբ կայացված դատողությունները երբեմն ավելի մանրակրկիտ ուսումնասիրվում են:
Շատ կարևոր է, որ կազմակերպությունները լինեն նախաձեռնող վտանգներին դիմակայելու հարցում, քանի որ մեքենայական ուսուցման կողմնակալությունը հաճախ կարող է խտրական կամ բացասական ազդեցություն ունենալ որոշ բնակչության վրա: Կարգավորվող համատեքստերի համար, մասնավորապես, պետք է հաշվի առնել մեքենայական ուսուցման մեջ կողմնակալության հնարավորությունը:
Օրինակ, բանկային ոլորտում մեքենայական ուսուցումը կարող է օգտագործվել հիփոթեքային վարկի դիմորդներին ինքնաբերաբար ընդունելու կամ մերժելու համար նախնական ստուգումից հետո: Մի մոդել, որը կողմնակալ է թեկնածուների որոշակի խմբի նկատմամբ, կարող է վնասակար ազդեցություն ունենալ և՛ թեկնածուի, և՛ կազմակերպության վրա:
Տեղակայման միջավայրում հայտնաբերված ցանկացած կողմնակալություն, որտեղ գործողությունները կարող են մանրակրկիտ ուսումնասիրվել, կարող է հանգեցնել լուրջ խնդիրների: Մոդելը կարող է չաշխատել, և ամենավատ սցենարներում նույնիսկ կարող է դիտավորյալ խտրական լինել:
Կողմնակալությունը պետք է ուշադիր գնահատվի և պատրաստվի դրա համար, քանի որ դա կարող է հանգեցնել նրան, որ մոդելն ամբողջությամբ հեռացվի տեղակայումից: Մոդելային որոշումների նկատմամբ վստահություն ձեռք բերելը պահանջում է հասկանալ և լուծել մեքենայական ուսուցման կողմնակալությունը:
Կազմակերպության ներսում և արտաքին ծառայությունների սպառողների միջև վստահության մակարդակը կարող է ազդել մոդելային որոշումների կայացման ժամանակ ընկալվող կողմնակալության վրա: Եթե մոդելներին չեն վստահում, հատկապես բարձր ռիսկային ընտրությունների ժամանակ, դրանք չեն օգտագործվի կազմակերպության ներսում իրենց ողջ ներուժով:
Մոդելի բացատրելիությունը գնահատելիս կողմնակալության հաշվառումը պետք է հաշվի առնվի: Մոդելի ընտրության վավերականությունն ու ճշգրտությունը կարող են լրջորեն ազդել չստուգված մեքենայական ուսուցման կողմնակալությունից:
Երբեմն դա կարող է հանգեցնել խտրական գործողությունների, որոնք կարող են ազդել որոշակի մարդկանց կամ խմբերի վրա: Գոյություն ունեն բազմաթիվ ծրագրեր մեքենայական ուսուցման մոդելների տարբեր տեսակների համար, և յուրաքանչյուրը որոշ չափով ենթակա է մեքենայական ուսուցման կողմնակալության:
Մեքենայի ուսուցման կողմնակալությունը պատկերված է հետևյալով.
- Մարզման տվյալների բազմազանության բացակայության պատճառով դեմքի ճանաչման ալգորիթմները կարող են ավելի քիչ ճշգրիտ լինել որոշ ռասայական խմբերի համար:
- Ծրագիրը կարող է հայտնաբերել ռասայական և գենդերային կողմնակալությունը տվյալների մեջ՝ մարդկային կամ պատմական նախապաշարմունքների պատճառով:
- Որոշակի բարբառով կամ առոգանությամբ բնական լեզվի մշակումը կարող է ավելի ճշգրիտ լինել, և այն կարող է չկարողանալ մշակել այն առոգանությունը, որը քիչ է ներկայացված վերապատրաստման տվյալների մեջ:
Մեքենայի ուսուցման մեջ կողմնակալության լուծում
Մոնիտորինգը և վերապատրաստման մոդելները, երբ հայտնաբերվում է կողմնակալություն, մեքենայական ուսուցման կողմնակալությունը լուծելու երկու եղանակ է: Շատ դեպքերում, մոդելի կողմնակալությունը ուսուցման տվյալների մեջ կողմնակալության ցուցիչ է, կամ գոնե կողմնակալությունը կարող է կապված լինել մեքենայական ուսուցման կյանքի ցիկլի վերապատրաստման փուլի հետ:
Մոդելի կյանքի ցիկլի յուրաքանչյուր փուլ պետք է ունենա ընթացակարգեր՝ կողմնակալությունը կամ մոդելի շեղումը հայտնաբերելու համար: Ներառված են նաև տեղակայումից հետո մեքենայական ուսուցման մոնիտորինգի գործընթացները: Կարևոր է հաճախակի ստուգել մոդելը և տվյալների հավաքածուները կողմնակալության համար:
Սա կարող է ներառել վերապատրաստման տվյալների բազայի ուսումնասիրություն՝ տեսնելու, թե ինչպես են խմբերը բաշխված և ներկայացված այնտեղ: Հնարավոր է փոփոխել և/կամ բարելավել տվյալների հավաքածուները, որոնք ամբողջովին ներկայացուցչական չեն:
Բացի այդ, մոդելի արդյունավետությունը գնահատելիս պետք է հաշվի առնել կողմնակալությունը: Մոդելի կատարողականի փորձարկումը տվյալների տարբեր ենթաբազմությունների վրա կարող է ցույց տալ, թե արդյոք այն կողմնակալ է կամ չափից ավելի հարմարեցված որոշակի խմբի հետ կապված:
Հնարավոր է գնահատել մեքենայական ուսուցման մոդելի աշխատանքը որոշակի տվյալների ենթաբազմությունների վրա՝ օգտագործելով խաչաձեւ վավերացման տեխնիկան: Ընթացակարգը ներառում է տվյալների բաժանումը առանձին ուսուցման և փորձարկման տվյալների հավաքածուների:
Դուք կարող եք վերացնել մեքենայական ուսուցման կողմնակալությունը հետևյալով.
- Անհրաժեշտության դեպքում վերապատրաստեք մոդելը՝ օգտագործելով ավելի մեծ, ավելի ներկայացուցչական ուսումնական հավաքածուներ:
- Կողմնակալ արդյունքների և անսովոր դատողությունների համար ակտիվորեն ուշադրություն դարձնելու ընթացակարգի սահմանում:
- Հատկությունների վերակշռումը և անհրաժեշտության դեպքում հիպերպարամետրերի ճշգրտումը կարող են օգնել հաշվի առնել կողմնակալությունը:
- Հայտնաբերված կողմնակալության լուծումը խրախուսելը հայտնաբերման և օպտիմալացման շարունակական ցիկլի միջոցով:
Եզրափակում
Գայթակղիչ է հավատալ, որ երբ վերապատրաստվի, մեքենայական ուսուցման մոդելը կգործի ինքնուրույն: Իրականում, մոդելի գործառնական միջավայրը միշտ փոխվում է, և ղեկավարները պետք է վերապատրաստեն մոդելները՝ օգտագործելով թարմ տվյալների հավաքածուները կանոնավոր հիմունքներով:
Մեքենայական ուսուցումը ներկայումս ամենահետաքրքիր տեխնոլոգիական հնարավորություններից մեկն է՝ իրական աշխարհի տնտեսական առավելություններով: Մեքենայական ուսուցումը, երբ զուգորդվում է մեծ տվյալների տեխնոլոգիաների և հանրային ամպի միջոցով հասանելի հսկայական հաշվողական հզորության հետ, ունի ներուժ փոխելու, թե ինչպես են անհատները փոխազդում տեխնոլոգիայի և, հավանաբար, ամբողջ արդյունաբերության հետ:
Այնուամենայնիվ, որքան էլ խոստումնալից է մեքենայական ուսուցման տեխնոլոգիան, այն պետք է մանրակրկիտ պլանավորվի՝ կանխամտածված կողմնակալություններից խուսափելու համար: Մեքենաների կողմից կայացված դատողությունների արդյունավետությունը կարող է խիստ ազդել կողմնակալության պատճառով, ինչը մեքենայական ուսուցման մոդելի մշակողները պետք է հաշվի առնեն:
Թողնել գրառում