Kun yhä useammat teollisuudenalat käyttävät algoritmien voimaa automatisoidakseen toimintaansa ja tehdäkseen valintoja, koneoppimisesta on tulossa ratkaiseva osa nykymaailman toimintaa.
Koneoppimisen bias-kysymys on ratkaisevan tärkeä ottaa huomioon, kun koneoppimismalleja integroidaan eri organisaatioiden päätöksentekoprosesseihin.
Jokaisen koneoppimismalleja käyttävän organisaation tavoitteena tulisi olla sen takaaminen, että algoritmien luomat valinnat ovat puolueettomia ja vailla puolueellisuutta. Sen varmistamiseksi, että mallin tuloksiin voidaan luottaa ja ne nähdään oikeudenmukaisina, on ratkaisevan tärkeää tunnistaa ja käsitellä koneoppiminen puolueellisuus.
Se liittyy kysymyksiin mallin selitettävyydestä tai siitä, kuinka helppoa ihmisen on käsittää, miten koneoppimismalli päätyi johtopäätökseen. Trendit ja mallit, joita koneoppimismallit kartoittavat ja oppivat, tulevat itse tiedoista eikä suorasta ihmisen kehityksestä.
Koneoppimisen harhaa voi ilmetä useista syistä, jos sitä ei hallita ja tarkisteta. Kun malli otetaan käyttöön, se kohtaa usein tilanteita, jotka eivät näy tarkasti opetusdatanäytteessä.
Malli olisi voinut olla liian sopiva tälle epäedustavalle koulutusdatajoukolle. Harjoitteludatan erinomaisesta laadusta huolimatta malliin saattaa silti vaikuttaa laajemmista kulttuurisista vaikutuksista johtuva historiallinen harha.
Kun puolueellinen malli on otettu käyttöön, se voi suosia tiettyjä ryhmiä tai menettää tarkkuuden tiettyjen data-alajoukkojen osalta. Tämä voi johtaa tuomioihin, jotka rankaisevat epäoikeudenmukaisesti tiettyä ryhmää yksilöitä, millä voi olla kielteisiä vaikutuksia todelliseen maailmaan.
Tässä artikkelissa käsitellään koneoppimisharhaa, mukaan lukien mitä se on, kuinka se havaitaan, sen aiheuttamat vaarat ja paljon muuta.
Joten mikä on koneoppimisharha?
Algoritmi, joka tuottaa tulosteita, jotka ovat systemaattisesti vääristyneitä koneoppimisprosessin aikana tehtyjen väärien oletusten seurauksena, tunnetaan nimellä koneoppimisharha, joka tunnetaan myös nimellä algoritmibias tai AI-bias.
Koneoppimisharha on mallin taipumus suosia tiettyä datajoukkoa tai datan osajoukkoa; se tuodaan usein esiin ei-edustavista koulutustietojoukoista. Tietyllä tiedonkeruulla puolueellinen malli toimii huonommin, mikä heikentää sen tarkkuutta.
Tosimaailmassa tämä voi tarkoittaa, että puolueelliset harjoitustiedot johtivat siihen, että mallin tulos suosii tiettyä rotua, väestörakennetta tai sukupuolta.
Tämän seurauksena koneoppimisen tulokset voivat olla epäoikeudenmukaisia tai syrjiviä. Ei-edustavaa koulutusta tietojoukot voivat edistää harhaa koneoppimisessa.
Tuloksena oleva malli voi olla vinoutunut muihin, aliedustettuihin luokkiin, jos harjoitusdata puuttuu tai edustaa liikaa tiettyä tietoryhmää. Tämä voi tapahtua, jos harjoitustietonäyte ei täsmää vastaa todellista käyttöönottoympäristöä.
Terveydenhuollon koneoppiminen, jonka avulla voidaan tarkistaa potilastietoja tunnettujen sairauksien tai sairauksien varalta, on hyvä esimerkki. Mallit voivat nopeuttaa lääkäreiden interventioita, kun niitä käytetään asianmukaisesti.
Ennakkoluulot ovat kuitenkin mahdollisia. Kun mallia pyydetään ennustamaan iäkkään potilaan mahdollista sairautta, malli ei voi toimia hyvin, jos sen muodostamiseen käytetty koulutusdata koostuu enimmäkseen pienemmän ikäryhmän potilastiedoista.
Lisäksi historialliset tilastot voivat olla vääristyneitä. Esimerkiksi koska historiallisesti suurin osa työntekijöistä oli miehiä, työnhakijoiden suodattamiseen koulutettu malli suosisi miespuolisia hakijoita.
Koneoppimisharha vaikuttaa mallin tarkkuuteen molemmissa skenaarioissa, ja pahimmassa tapauksessa se voi johtaa jopa syrjiviin ja epäoikeudenmukaisiin johtopäätöksiin.
Päätökset on tarkistettava huolellisesti, jotta varmistetaan, että ne eivät ole puolueettomia koneoppimismallit korvaa yhä useammat manuaaliset toiminnot. Tämän seurauksena minkä tahansa organisaation mallihallinnon käytäntöihin tulisi sisältyä koneoppimisharhojen seuranta.
Koneoppimismalleilla täydennetään monia erilaisia töitä monilla eri toimialoilla. Nykyään malleja käytetään automatisoimaan yhä vaikeampia prosesseja ja luomaan ehdotuksia. Tässä päätöksentekoprosessissa harha tarkoittaa sitä, että malli voisi suosia tiettyä ryhmää toisen edelle oppitun harhaan perustuen.
Kun sitä käytetään tekemään vaarallisia tuomioita, joilla on todellisia seurauksia, sillä voi olla vakavia seurauksia. Esimerkiksi lainahakemusten automaattiseen hyväksymiseen käytettynä puolueellinen malli voi vahingoittaa tiettyä väestöä. Säännellyissä yrityksissä, joissa kaikki toimet voidaan tarkastaa tai tarkastaa, tämä on erityisen tärkeä tekijä, joka on otettava huomioon.
Machine Learning Bias -tyypit
- Algoritmin harha – Tämä tapahtuu, kun algoritmissa on virhe, joka tekee koneoppimislaskelmia ohjaavat laskelmat.
- Sample Bias – Kun dataa ennen kouluttaa koneoppimista mallissa on ongelma, tämä tapahtuu. Tällaisissa harhoissa järjestelmän kouluttamiseen käytetyn datan määrä tai laatu on riittämätön. Algoritmi koulutetaan uskomaan, että kaikki opettajat ovat naisia, jos esimerkiksi koulutusdata koostuu kokonaan naisopettajista.
- Poissulkemisharha – Tämä tapahtuu, kun ratkaiseva tietopiste puuttuu käytettävästä datajoukosta, mikä saattaa tapahtua, jos mallintajat eivät ymmärrä puuttuvan datapisteen merkitystä.
- Ennakkoluulot – Tässä tapauksessa itse koneoppiminen on puolueellinen, koska järjestelmän kouluttamiseen käytetyt tiedot heijastavat todellisia ennakkoluuloja, kuten ennakkoluuloja, stereotypioita ja vääriä sosiaalisia oletuksia. Jos esimerkiksi lääketieteen ammattilaisia koskevat tiedot sisällytettäisiin tietokonejärjestelmään, joka sisältää vain mieslääkäreitä ja naishoitajia, terveydenhuollon työntekijöitä koskeva todellinen sukupuolistereotypia säilyisi.
- Mittausharha – Kuten nimestä voi päätellä, tämä harha johtuu perustavanlaatuisista ongelmista, jotka liittyvät tiedon laatuun ja sen keräämiseen tai arviointiin. Tarkkaan painon arvioimiseen koulutettu järjestelmä on puolueellinen, jos harjoitustiedoissa olevat painot pyöristetään johdonmukaisesti ylöspäin, ja tyytyväisten työntekijöiden kuvien käyttäminen työpaikan ympäristön arviointiin tarkoitetun järjestelmän kouluttamiseen voi olla puolueellinen, jos kuvissa näkyvät työntekijät tiesivät. heitä mitattiin onnellisuuden vuoksi.
Mitkä tekijät vaikuttavat harhaan koneoppimisessa?
Vaikka koneoppimisen harhaan on monia syitä, se johtuu usein harhasta itse harjoitusdatassa. Harjoitteludatan harhoille on useita mahdollisia taustalla olevia syitä.
Näkyvin esimerkki on koulutusdata, joka on käyttöönotetussa järjestelmässä havaittujen olosuhteiden osajoukko, joka ei ole tyypillinen. Tämä voi olla koulutustietoja, joissa yksi luokka on aliedustettuna tai suhteettoman suuri määrä toista.
Tätä kutsutaan näyteharhaksi, ja se voi johtua ei-satunnaistetusta harjoitustietojen keräämisestä. Tietojen keräämiseen, analysointiin tai luokitteluun käytetyt menetelmät sekä datan historialliset juuret voivat kaikki johtaa itse tiedon harhaan.
Tieto voi jopa olla historiallisesti puolueellinen siinä laajemmassa kulttuurissa, jossa se on kerätty.
Koneoppimisharha johtuu useimmiten:
- Ihmisten tai yhteiskunnan aiheuttamia harhoja historiallisissa tiedoissa käytetään algoritmien kouluttamiseen.
- Harjoittelutiedot, jotka eivät heijasta todellisia olosuhteita.
- Harha, kun tunnistetaan tai valmistellaan tietoja valvottua koneoppimista varten.
Esimerkiksi koulutusdatan monimuotoisuuden puute saattaa aiheuttaa esitysharhaa. Koneoppimismallien tarkkuuteen vaikuttaa usein laajemman kulttuurin historiallinen harha.
Tätä kutsutaan joskus sosiaaliseksi tai inhimilliseksi ennakkoluuloksi. Laajojen tietokokoelmien löytäminen, jotka eivät ole alttiita yhteiskunnallisille vinoille, voi olla haastavaa. Koneoppimisen elinkaaren tietojenkäsittelyvaihe on yhtä altis ihmisen harhaan.
Datatieteilijän tai muun asiantuntijan merkitsemä ja käsittelemä data on välttämätöntä ohjattua koneoppimista varten. Johtuuko se puhdistettavien tietojen moninaisuudesta, tietopisteiden merkitsemistavasta tai ominaisuuksien valinnasta, tässä merkintäprosessissa esiintyvä harha voi johtaa koneoppimisen harhaan.
Koneoppimisen harhariskit
Koska mallit ovat tietopohjaisia päätöksentekotyökaluja, niiden oletetaan antavan puolueettomia arvioita. Koneoppimismalleissa on usein harhaa, mikä voi vaikuttaa tuloksiin.
Yhä useammat teollisuudenalat ottavat koneoppimisen käyttöön vanhentuneiden ohjelmistojen ja menettelytapojen tilalle. Puolueellisilla malleilla voi olla kielteisiä vaikutuksia todellisessa maailmassa, kun monimutkaisempia töitä automatisoidaan malleilla.
Koneoppiminen ei eroa muista päätöksentekoprosesseista siinä, että organisaatiot ja yksilöt odottavat sen olevan läpinäkyvää ja tasapuolista. Koska koneoppiminen on automatisoitu prosessi, sen avulla tehtyjä tuomioita tarkastellaan toisinaan vieläkin tarkemmin.
On ratkaisevan tärkeää, että organisaatiot puuttuvat aktiivisesti vaaroihin, koska koneoppimisen ennakkoluulolla voi usein olla syrjiviä tai kielteisiä vaikutuksia joihinkin väestöryhmiin. Etenkin säännellyissä yhteyksissä koneoppimisen harhan mahdollisuus on otettava huomioon.
Esimerkiksi pankkialan koneoppimista voitaisiin käyttää automaattisesti hyväksymään tai hylkäämään asuntolainahakijoita alustavan seulonnan jälkeen. Mallilla, joka on puolueellinen tiettyyn ehdokasryhmään, voi hyvinkin olla haitallisia vaikutuksia sekä ehdokkaaseen että organisaatioon.
Käyttöönottoympäristössä, jossa toimia voidaan tutkia, havaittu harha voi johtaa suuriin ongelmiin. Malli ei ehkä toimi, ja pahimmassa tapauksessa se saattaa jopa osoittautua tarkoituksella syrjiväksi.
Bias on arvioitava huolellisesti ja varauduttava siihen, koska se voi johtaa siihen, että malli poistetaan kokonaan käytöstä. Mallipäätöksiin luottamuksen saaminen edellyttää koneoppimisharhaisuuden ymmärtämistä ja käsittelemistä.
Luottamuksen tasoon organisaation sisällä ja ulkoisten palvelunkuluttajien keskuudessa saattaa vaikuttaa mallipäätöksenteossa havaittu harha. Jos malleihin ei luoteta, etenkään riskialttiita valintoja ohjattaessa, niiden potentiaalia ei hyödynnetä organisaation sisällä.
Arvioitaessa mallin selitettävyyttä, harhan huomioon ottaminen tulisi ottaa huomioon. Tarkistamaton koneoppimisharha voi vaikuttaa vakavasti mallivalintojen pätevyyteen ja tarkkuuteen.
Se voi toisinaan johtaa syrjiviin toimiin, jotka voivat vaikuttaa tiettyihin ihmisiin tai ryhmiin. Eri koneoppimismallityypeille on olemassa lukuisia sovelluksia, ja jokainen niistä on jossain määrin altis koneoppimisharhalle.
Koneoppimisen harhaa kuvaa:
- Koska koulutusdata ei ole vaihtelevaa, kasvojentunnistusalgoritmit voivat olla vähemmän tarkkoja joillekin roturyhmille.
- Ohjelma voisi havaita tiedoissa rotuun ja sukupuoleen perustuvan vääristymän, joka johtuu inhimillisistä tai historiallisista ennakkoluuloista.
- Tietyllä murteella tai aksentilla luonnollisen kielen käsittely voisi olla tarkempaa, eikä se välttämättä pysty käsittelemään aksenttia, joka on aliedustettu harjoitustiedoissa.
Biasin ratkaiseminen koneoppimisessa
Seuranta- ja uudelleenkoulutusmallit, kun harhaa havaitaan, ovat kaksi tapaa käsitellä koneoppimisharhaa. Useimmissa tapauksissa mallin harha on osoitus harhasta koulutustiedoissa, tai ainakin harha voi liittyä koneoppimisen elinkaaren koulutusvaiheeseen.
Mallin elinkaaren jokaisessa vaiheessa tulisi olla käytössä menettelyt harhaan tai mallin ajautumiseen. Mukana on myös prosessit koneoppimisen seurantaan käyttöönoton jälkeen. On tärkeää tarkistaa usein mallin ja tietojoukot harhan varalta.
Tämä saattaa sisältää koulutustietojoukon tutkimisen nähdäksesi, kuinka ryhmät jakautuvat ja ovat edustettuina siellä. On mahdollista muokata ja/tai parantaa tietojoukkoja, jotka eivät ole täysin edustavia.
Lisäksi harhaa tulisi ottaa huomioon arvioitaessa mallin suorituskykyä. Mallin suorituskyvyn testaaminen datan eri osajoukkoilla voi osoittaa, onko se vino tai ylisovitettu suhteessa tiettyyn ryhmään.
On mahdollista arvioida koneoppimismallin suorituskykyä tietyissä data-alajoukoissa käyttämällä ristiinvalidointitekniikoita. Toimenpide sisältää tietojen jakamisen erillisiin koulutus- ja testaustietosarjoihin.
Voit poistaa puolueellisuuden koneoppimisessa seuraavasti:
- Tarvittaessa kouluta malli uudelleen käyttämällä suurempia, edustavampia koulutussarjoja.
- Menettelyn luominen puolueellisten tulosten ja epätavallisten tuomioiden ennakoimiseksi.
- Ominaisuuksien uudelleenpainottaminen ja hyperparametrien säätäminen tarvittaessa voivat auttaa huomioimaan harhan.
- Kannustetaan havaitun harhan ratkaisemiseen jatkuvan havainto- ja optimointisyklin avulla.
Yhteenveto
On houkuttelevaa uskoa, että koneoppimismalli toimisi itsenäisesti, kun se on koulutettu. Itse asiassa mallin toimintaympäristö muuttuu jatkuvasti, ja esimiesten on koulutettava malleja säännöllisesti uusien tietojoukkojen avulla.
Koneoppiminen on tällä hetkellä yksi kiehtovimmista teknologisista ominaisuuksista, jolla on todellista taloudellista hyötyä. Koneoppiminen yhdistettynä big datatekniikoihin ja julkisen pilven kautta saatavilla olevaan valtavaan laskentatehoon voi muuttaa yksilöiden vuorovaikutusta teknologian ja ehkä kokonaisten toimialojen kanssa.
Vaikka koneoppimisteknologia onkin lupaavaa, se on kuitenkin suunniteltava huolellisesti tahattomien harhojen välttämiseksi. Koneiden tekemien arvioiden tehokkuuteen voi vakavasti vaikuttaa harha, joka koneoppimismallien kehittäjien on otettava huomioon.
Jätä vastaus