Машиналық оқытудың қателіктері және оның алдын алу жолы

Мазмұны[Жасыру][Көрсету]

Сонымен, машинаны үйренуге бейімділік дегеніміз не?
Machine Learning Bias түрлері
Қандай факторлар машиналық оқытуда біржақтылыққа ықпал етеді?
Машиналық оқытудың біржақты тәуекелдері
Машиналық оқытудағы біржақтылықты шешу
қорытынды

Көптеген салалар операцияларды автоматтандыру және таңдау жасау үшін алгоритмдердің күшін пайдаланатындықтан, машиналық оқыту қазіргі әлемнің қалай жұмыс істейтінінің маңызды құрамдас бөлігіне айналуда.

Машиналық оқыту үлгілері әртүрлі ұйымдардың шешім қабылдау процестеріне біріктірілген кезде машиналық оқытудағы біржақтылық мәселесін ескеру өте маңызды.

Алгоритмдер арқылы жасалған таңдаулардың бейтарап екендігіне және біржақтылықсыз екендігіне кепілдік беру машиналық оқыту үлгілерін пайдаланатын кез келген ұйымның мақсаты болуы керек. Модель нәтижелеріне сенуге және әділ деп қарауға болатынын қамтамасыз ету үшін тану және шешу өте маңызды машина оқыту жағымсыздық.

Бұл модельдің түсіндірмесі немесе адамға машиналық оқыту моделінің қорытындыға қалай келгенін түсіну қаншалықты оңай деген сұрақтарға байланысты. Машиналық оқыту үлгілері картаға түсіретін және үйренетін үрдістер мен үлгілер адамның тікелей дамуы арқылы емес, деректердің өзінен туындайды.

Машиналық оқытудағы ауытқулар, егер ол басқарылмаса және тексерілмесе, әртүрлі себептермен пайда болуы мүмкін. Модельді қолданғанда, ол оқу деректерінің үлгісінде дәл көрсетілмеген жағдайлармен жиі кездеседі.

Модель осы репрезентативті емес оқу деректер жинағына шамадан тыс сәйкес келуі мүмкін. Жаттығу деректерінің тамаша сапасына қарамастан, модельге әлі де кеңірек мәдени әсерлерден туындайтын тарихи бейімділік әсер етуі мүмкін.

Енгізілгеннен кейін бейтарап үлгі белгілі бір топтарды ұнатуы немесе нақты деректер ішкі жиындарымен дәлдігін жоғалтуы мүмкін. Бұл нақты әлемге теріс әсер етуі мүмкін белгілі бір адамдар тобын әділетсіз жазалайтын үкімдерге әкелуі мүмкін.

Бұл мақалада машинаны үйренуге бейімділік, оның ішінде оның не екенін, оны қалай анықтауға болатынын, оның тудыратын қауіптерін және т.б. қарастырады.

Сонымен, машинаны үйренуге бейімділік дегеніміз не?

Машиналық оқыту процесі кезінде жасалған жалған болжамдардың нәтижесінде жүйелі түрде бұрмаланатын нәтижелерді шығаратын алгоритм машиналық оқытудың ауытқуы ретінде белгілі, сонымен қатар алгоритмнің ауытқуы ретінде белгілі немесе AI бұрмалауы деп аталады.

Машиналық оқытуға бейімділік – модельдің белгілі бір деректер жинағына немесе деректердің ішкі жиынына артықшылық беру үрдісі; ол жиі репрезентативті емес оқу деректер жинақтары арқылы беріледі. Белгілі бір деректер жиынтығымен объективті модель нашар жұмыс істейді, бұл оның дәлдігіне зиян келтіреді.

Нақты әлем жағдайында бұл бейтарап оқыту деректері белгілі бір нәсілге, демографиялық немесе жынысқа қолайлы үлгінің нәтижесіне әкелетінін білдіруі мүмкін.

Нәтижесінде, машиналық оқытудың нәтижелері әділетсіз немесе кемсітушілік болуы мүмкін. Өкілдік емес оқыту деректер жиыны бұрмалауға ықпал етуі мүмкін машиналық оқытуда.

Нәтижелі үлгі, егер оқыту деректері жетіспейтін немесе белгілі бір деректер топтамасын шамадан тыс репрезентативті болса, басқа, жеткіліксіз ұсынылған санаттарға бейім болуы мүмкін. Бұл жаттығу деректерінің үлгісі нақты әлемдегі орналастыру ортасына дәл сәйкес келмесе орын алуы мүмкін.

Пациент деректерін белгілі ауруларға немесе ауруларға қарсы тексеру үшін пайдаланылуы мүмкін денсаулық сақтау саласындағы машиналық оқыту ең жақсы мысал болып табылады. Модельдер дұрыс пайдаланылған кезде дәрігерлердің араласуын жылдамдата алады.

Дегенмен, алдын ала болжау мүмкін. Егде жастағы емделушідегі ықтимал ауруды болжау сұралғанда, оны құру үшін пайдаланылатын оқу деректері негізінен кішірек жас диапазонындағы пациент деректерінен тұратын болса, модель жақсы жұмыс істей алмайды.

Сонымен қатар, тарихи статистика бұрмалануы мүмкін. Мысалы, тарихи тұрғыдан алғанда, қызметкерлердің көпшілігі ер адамдар болғандықтан, жұмысқа үміткерлерді сүзуге үйретілген үлгі ер үміткерлерді ұнатады.

Машиналық оқытудың біржақтылығы екі сценарийде де модельдің дәлдігіне әсер етеді, ал ең нашар жағдайда ол тіпті кемсітетін және әділетсіз қорытындыларға әкелуі мүмкін.

Шешімдер біржақты болмау үшін мұқият қаралуы керек машиналық оқыту модельдері көбірек қол операцияларын ауыстырыңыз. Нәтижесінде, кез келген ұйымдағы үлгі басқару тәжірибесі машиналық оқытуға бейімділікке мониторингті қамтуы керек.

Көптеген әртүрлі салалардағы жұмыстардың көптеген түрлері машиналық оқыту үлгілері арқылы аяқталады. Бүгінгі таңда модельдер барған сайын қиын процестерді автоматтандыру және ұсыныстар жасау үшін қолданылады. Бұл шешім қабылдау процесінде қиғаштық модельдің белгілі бір топты екінші топтан үйренген бейімділікке негізделген артықшылыққа ие болуын білдіреді.

Нақты салдары бар қауіпті пайымдаулар жасау үшін пайдаланылғанда, бұл ауыр зардаптарға әкелуі мүмкін. Несие өтінімдерін автоматты түрде мақұлдау үшін пайдаланылған кезде, мысалы, бейтарап модель белгілі бір халыққа зиян келтіруі мүмкін. Кез келген әрекеттерді тексеруге немесе тексеруге болатын реттелетін кәсіпорындарда бұл ескеру қажет өте маңызды фактор.

Machine Learning Bias түрлері

Алгоритмнің ауытқуы – Бұл алгоритмде машиналық оқу есептеулерін жүргізетін есептеулерді жасайтын қате болған кезде орын алады.
Үлгі ауытқуы – Деректер пайдаланылған кезде машиналық оқытуды үйрету модельде мәселе бар, бұл орын алады. Мұндай ауытқу жағдайында жүйені оқыту үшін пайдаланылатын деректердің мөлшері немесе сапасы жеткіліксіз. Алгоритм, мысалы, оқыту деректері толығымен әйел мұғалімдерден тұратын болса, барлық мұғалімдер әйелдер екеніне сену үшін оқытылады.
Шығаруға бейімділік – Бұл пайдаланылатын деректер жинағында маңызды деректер нүктесі болмаған кезде орын алады, бұл модельдеушілер жетіспейтін деректер нүктесінің маңыздылығын түсінбеген жағдайда орын алуы мүмкін.
Алдын ала қарау – Бұл жағдайда машиналық оқытудың өзі біржақты болып табылады, өйткені жүйені оқыту үшін пайдаланылатын деректер жаңсақ пікір, стереотиптер және дұрыс емес әлеуметтік болжамдар сияқты нақты әлемдегі бейімділіктерді көрсетеді. Мысалы, егер медициналық қызметкерлер туралы деректер тек ер дәрігерлер мен әйел медбикелерді қамтитын компьютерлік жүйеге қосылса, денсаулық сақтау қызметкерлері туралы нақты әлемдегі гендерлік стереотип сақталады.
Өлшеу ауытқуы – Аты айтып тұрғандай, бұл біржақтылық деректердің сапасына және оны жинау немесе бағалау үшін қолданылатын әдістерге қатысты іргелі мәселелерден туындайды. Жаттығу деректеріндегі салмақтар дәйекті түрде дөңгеленген болса, салмақты дәл бағалау үшін оқытылатын жүйе біржақты болады және жұмыс орнындағы ортаны бағалауға арналған жүйені оқыту үшін қанағаттанған қызметкерлердің кескіндерін пайдалану, егер суреттердегі қызметкерлер білсе, біржақты болуы мүмкін. олар бақытпен өлшенді.

Қандай факторлар машиналық оқытуда біржақтылыққа ықпал етеді?

Машиналық оқытудың ауытқуының көптеген себептері бар болса да, ол көбінесе оқу деректеріндегі қиғаштықтан туындайды. Жаттығу деректеріндегі ауытқулардың бірнеше ықтимал негізгі себептері бар.

Ең айқын иллюстрация типтік емес орналастырылған жүйеде көрінетін жағдайлардың жиыны болып табылатын жаттығу деректері болып табылады. Бұл бір санаттың жеткіліксіз көрсетілуімен немесе басқасының пропорционалды емес санымен жаттығу деректері болуы мүмкін.

Бұл үлгінің ауытқуы ретінде белгілі және ол кездейсоқ емес оқу деректерін жинау нәтижесінде туындауы мүмкін. Деректерді жинау, талдау немесе жіктеу үшін қолданылатын әдістер, сондай-ақ деректердің тарихи тамырлары деректердің өзінде біржақтылыққа әкелуі мүмкін.

Ақпарат тіпті жиналған үлкен мәдениетте тарихи тұрғыдан біржақты болуы мүмкін.

Машиналық оқытуға бейімділік негізінен мыналарға байланысты:

Алгоритмдерді оқыту үшін тарихи деректерде адамдар немесе қоғам тудырған ауытқулар пайдаланылады.
Нақты әлемдегі жағдайларды көрсетпейтін жаттығу деректері.
Бақыланатын машиналық оқыту үшін деректерді таңбалау немесе дайындау кезінде ауытқу.

Мысалы, оқыту деректеріндегі әртүрліліктің болмауы өкілдіктің ауытқуын тудыруы мүмкін. Машиналық оқыту үлгілерінің дәлдігіне кеңірек мәдениеттегі тарихи бейімділік жиі әсер етеді.

Бұл кейде әлеуметтік немесе адами бейімділік деп аталады. Қоғамға бейім емес деректердің үлкен жинақтарын табу қиын болуы мүмкін. Машиналық оқытудың өмірлік циклінің деректерді өңдеу кезеңі адамның бейімділігіне бірдей сезімтал.

Деректер ғалымы немесе басқа сарапшы белгілеген және өңдеген деректер бақыланатын машиналық оқыту үшін қажет. Бұл тазартылатын деректердің әртүрлілігінен, деректер нүктелерінің таңбалану тәсілінен немесе мүмкіндіктерді таңдаудан туындайды ма, осы таңбалау процесіндегі қиғаштық машиналық оқытуда ауытқуға әкелуі мүмкін.

Машиналық оқытудың біржақты тәуекелдері

Модельдер деректерге негізделген шешім қабылдау құралдары болғандықтан, олар бейтарап пайымдаулар береді деп болжанады. Машинамен оқыту үлгілерінде нәтижелерге әсер ететін ауытқулар жиі кездеседі.

Көбірек салалар ескірген бағдарламалық қамтамасыз ету мен процедуралардың орнына машиналық оқытуды енгізуде. Неғұрлым күрделі тапсырмалар модельдер арқылы автоматтандырылған кезде, бейтарап үлгілер нақты әлемде теріс әсер етуі мүмкін.

Машиналық оқытудың басқа шешімдер қабылдау процестерінен еш айырмашылығы жоқ, бұл ұйымдар мен адамдар оның ашық және әділ болуын күтеді. Машиналық оқыту автоматтандырылған процесс болғандықтан, оны қолдану арқылы жасалған пайымдаулар кейде одан да мұқият зерттеледі.

Ұйымдардың қауіптерді жоюда белсенді болуы өте маңызды, өйткені машиналық оқытудағы біржақтылық кейбір популяцияларға жиі кемсітушілік немесе теріс әсер етуі мүмкін. Реттелетін контексттер үшін, атап айтқанда, машиналық оқытудағы біржақтылық мүмкіндігі ескерілуі керек.

Мысалы, банк ісіндегі машиналық оқытуды бастапқы скринингтен кейін ипотекаға үміткерлерді автоматты түрде қабылдау немесе қабылдамау үшін пайдалануға болады. Үміткерлердің белгілі бір тобына бейтарап үлгі кандидатқа да, ұйымға да зиянды әсер етуі мүмкін.

Әрекеттер тексерілуі мүмкін орналастыру ортасында табылған кез келген қиғаштық үлкен мәселелерге әкелуі мүмкін. Модель жұмыс істемеуі мүмкін және ең нашар сценарийлерде тіпті әдейі кемсітушілікке айналуы мүмкін.

Бағалауды мұқият бағалау және оған дайындалу керек, себебі ол модельді орналастырудан толығымен алып тастауы мүмкін. Модельдік шешімдерге сенімді болу үшін машиналық оқытуды түсіну және оны шешу қажет.

Ұйым ішіндегі және сыртқы қызмет тұтынушылары арасындағы сенім деңгейіне модельдік шешім қабылдауда қабылданатын қиғаштық әсер етуі мүмкін. Модельдер сенімсіз болса, әсіресе тәуекелі жоғары таңдауларды басқарғанда, олар ұйымдағы әлеуетін толық пайдаланбайды.

Модельдің түсіндірмелілігін бағалау кезінде біржақтылықты есепке алу ескерілетін фактор болуы керек. Модельді таңдаудың жарамдылығы мен дәлдігіне тексерілмеген машиналық оқытудың ауытқуы айтарлықтай әсер етуі мүмкін.

Бұл кейде белгілі бір адамдарға немесе топтарға әсер етуі мүмкін кемсітушілік әрекеттерге әкелуі мүмкін. Машиналық оқытудың әртүрлі үлгі түрлері үшін көптеген қолданбалар бар және олардың әрқайсысы белгілі бір дәрежеде машиналық оқытуға бейімділікке ие.

Машиналық оқытудың бұрмалануы келесідей суреттелген:

Жаттығу деректерінде әртүрліліктің болмауына байланысты бет-әлпетті тану алгоритмдері кейбір нәсілдік топтар үшін дәлірек болуы мүмкін.
Бағдарлама адам немесе тарихи теріс пікірге байланысты деректердегі нәсілдік және гендерлік ауытқуды анықтай алады.
Белгілі бір диалекті немесе екпінмен табиғи тілді өңдеу дәлірек болуы мүмкін және ол жаттығу деректерінде аз көрсетілген екпінді өңдей алмауы мүмкін.

Машиналық оқытудағы біржақтылықты шешу

Біржақтылық табылған кезде үлгілерді бақылау және қайта оқыту - бұл машиналық оқытуға бейімділікпен күресудің екі жолы. Көп жағдайда, модельді бұрмалау оқу деректеріндегі ауытқудың көрсеткіші болып табылады немесе кем дегенде, қиғаштық машинаны оқытудың өмірлік циклінің жаттығу кезеңіне қатысты болуы мүмкін.

Модельдің өмірлік циклінің әрбір кезеңінде ауытқуды немесе модельдің ауытқуын анықтау үшін процедуралар болуы керек. Орналастырудан кейін машиналық оқытуды бақылау процестері де қамтылған. Модельді және деректер жиынын бұрмалау үшін жиі тексеру маңызды.

Бұл топтардың қалай таратылатынын және ұсынылғанын көру үшін оқу деректер жинағын зерттеуді қамтуы мүмкін. Толық репрезентативті емес деректер жиынын өзгертуге және/немесе жақсартуға болады.

Сонымен қатар, модельдің өнімділігін бағалау кезінде біржақтылықты ескеру қажет. Модельдің өнімділігін деректердің әртүрлі ішкі жиындарында сынау оның белгілі бір топқа қатысты ығыстырылғанын немесе артық орнатылғанын көрсете алады.

Кросс-тексеру әдістерін қолдану арқылы белгілі бір деректер ішкі жиындарында машиналық оқыту үлгісінің өнімділігін бағалауға болады. Процедура деректерді әртүрлі оқыту және тестілеу деректер жиындарына бөлуді қамтиды.

Сіз машиналық оқытудағы біржақтылықты жоюға болады:

Қажет болған жағдайда, үлгіні үлкенірек, көбірек өкілдік жаттығулар жиынтықтары арқылы қайта оқытыңыз.
Бейтарап нәтижелер мен әдеттен тыс пайымдауларды белсенді түрде іздеу процедурасын құру.
Мүмкіндіктерді қайта өлшеу және қажет болған жағдайда гиперпараметрлерді реттеу ауытқуды есепке алуға көмектеседі.
Анықтаудың және оңтайландырудың үздіксіз циклі арқылы анықталған ауытқуларды шешуді ынталандыру.

қорытынды

Бір рет үйретілген машинамен оқыту моделі автономды түрде жұмыс істейтініне сену азғырылады. Шындығында, модельдің жұмыс ортасы үнемі өзгеріп отырады және менеджерлер жаңа деректер жиынын пайдаланып үлгілерді жүйелі түрде қайта даярлауы керек.

Қазіргі уақытта машиналық оқыту нақты әлемдегі экономикалық пайдасы бар ең қызықты технологиялық мүмкіндіктердің бірі болып табылады. Машиналық оқыту үлкен деректер технологияларымен және қоғамдық бұлт арқылы қол жетімді үлкен есептеу қуатымен жұптастырылған кезде, адамдардың технологиямен және, мүмкін, бүкіл салалармен өзара әрекеттесуін өзгерту мүмкіндігі бар.

Дегенмен, машиналық оқыту технологиясы қаншалықты перспективалы болса да, әдейі емес бұрмалануларды болдырмау үшін оны мұқият жоспарлау керек. Машиналар жасаған пайымдаулардың тиімділігіне біржақтылық қатты әсер етуі мүмкін, бұл машинаны оқыту моделін жасаушылар ескеруі керек.

Машиналық оқытудың қателіктері және оны қалай болдырмауға болады

Сонымен, машинаны үйренуге бейімділік дегеніміз не?

Machine Learning Bias түрлері

Қандай факторлар машиналық оқытуда біржақтылыққа ықпал етеді?

Машиналық оқытудың біржақты тәуекелдері

Машиналық оқытудағы біржақтылықты шешу

қорытынды

туралы Jay

HashDork туралы қосымша мақалалар:

Оқытуды күшейту: қателерінен үйренетін AI

Үйренуге арналған 10 үздік MLOps құралдары

Жаңадан бастаушыларға арналған тақырыпты модельдеуге кіріспе

Жаңадан бастаушыларға арналған машиналық оқытудың үздік 15 жобасы

Бұл Future Tech ақпараттық бюллетень сормайды

Машиналық оқытудың қателіктері және оны қалай болдырмауға болады

Сонымен, машинаны үйренуге бейімділік дегеніміз не?

Machine Learning Bias түрлері

Қандай факторлар машиналық оқытуда біржақтылыққа ықпал етеді?

Машиналық оқытудың біржақты тәуекелдері

Машиналық оқытудағы біржақтылықты шешу

қорытынды

туралы Jay

HashDork туралы қосымша мақалалар:

Оқытуды күшейту: қателерінен үйренетін AI

Үйренуге арналған 10 үздік MLOps құралдары

Жаңадан бастаушыларға арналған тақырыпты модельдеуге кіріспе

Жаңадан бастаушыларға арналған машиналық оқытудың үздік 15 жобасы

Оқырман өзара әрекеттестігі

пікір қалдыру Жауапты болдырмау

Бұл Future Tech ақпараттық бюллетень сормайды