Flest vélanám og djúpnámslíkön reiða sig mikið á gagnamagn og fjölbreytni til að virka vel. Rúmmál og fjölbreytileiki gagna sem veitt eru í þjálfun hafa veruleg áhrif á spánákvæmni þessara líkana.
Djúpnámslíkön sem hafa verið kennt að framkvæma á áhrifaríkan hátt í flóknum verkefnum innihalda oft faldar taugafrumur. Fjöldi þjálfanlegra stika eykst eftir fjölda falinna taugafrumna.
Gagnamagnið sem krafist er er í réttu hlutfalli við fjölda breytu sem hægt er að læra líkan. Ein aðferð til að takast á við erfiðleika takmarkaðra gagna er að beita ýmsum umbreytingum á núverandi gögn til að mynda ný gögn.
Tæknin við að búa til ný gögn úr fyrirliggjandi gögnum er kölluð „Data Augmentation“. Hægt er að nota gagnaaukningu til að uppfylla báðar kröfur: magn gagna og fjölbreytni þjálfunargagna sem þarf til að þróa nákvæmar vélanám eða djúpnámslíkön.
Í þessari færslu munum við skoða gagnaaukninguna, gerðir hennar, hvers vegna hún er nauðsynleg og margt fleira.
Svo, hvað er gagnaaukning?
Gagnaaukning er ferlið við að þróa ný og dæmigerð gögn úr núverandi gögnum. Þú getur náð þessu með því að taka með breyttar útgáfur af núverandi gögnum eða búa til ný gögn.
Gagnasöfnin sem framleidd eru með þessari aðferð munu bæta vélanám þitt eða djúpnámslíkön með því að lágmarka hættuna á offitun. Það er ferlið við að breyta, eða „auka“, gagnasafni með viðbótarupplýsingum.
Þetta viðbótarinntak gæti verið allt frá myndum til texta og það eykur afköst vélanámskerfa.
Gerum ráð fyrir að við viljum smíða líkan til að flokka hundategundir og við höfum mikinn fjölda ljósmynda af öllum afbrigðum nema mops. Fyrir vikið ætti líkanið í erfiðleikum með að flokka pugs.
Við gætum bætt fleiri (raunverulegum eða fölskum) myndum af pug við safnið, eða við gætum tvöfaldað núverandi pug ljósmyndir okkar (td með því að endurtaka og afbaka þær til að gera þær tilbúnar einstakar).
Hvaða gagn þjónar gagnaaukning í nútímanum?
Umsóknir um vél nám eru í örri þróun og fjölbreytni, sérstaklega á sviði djúpnáms. Hægt er að sigrast á þeim áskorunum sem gervigreindariðnaðurinn stendur frammi fyrir með gagnaaukningaraðferðum.
Gagnaaukning getur bætt árangur og útkomu vélanámslíkana með því að bæta nýjum og fjölbreyttum dæmum við þjálfunargagnasöfn.
Þegar gagnasafnið er stórt og nægjanlegt skilar vélanámslíkan sig betur og er nákvæmara. Fyrir vélanámslíkön getur gagnasöfnun og merking verið tímafrekt og dýrt.
Fyrirtæki geta dregið úr rekstrarkostnaði sínum með því að breyta gagnasöfnum og nota gagnaaukningaraðferðir.
Hreinsun gagna er eitt af þrepum í þróun gagnalíkans og þau eru nauðsynleg fyrir líkön með mikla nákvæmni. Hins vegar mun líkanið ekki geta séð fyrir rétta inntak frá hinum raunverulega heimi ef gagnahreinsun dregur úr framsetningu.
Hægt er að styrkja vélanámslíkön með því að nota gagnaaukningaraðferðir, sem framleiða frávik sem líkanið gæti lent í í hinum raunverulega heimi.
Tegundir gagnaauka
Raunveruleg gagnaaukning
Raunveruleg gagnaaukning á sér stað þegar þú bætir ósviknum viðbótargögnum við gagnasafn. Þetta getur verið allt frá textaskrám með viðbótareiginleikum (fyrir merktar myndir) til mynda af öðrum hlutum sem eru sambærilegir við upprunalega hlutinn, eða jafnvel upptökur af raunverulegum hlut.
Til dæmis, með því að bæta nokkrum eiginleikum í viðbót við myndskrá, getur vélanámslíkan greint hlutinn auðveldara.
Fleiri lýsigögn um hverja mynd (td nafn hennar og lýsing) gætu fylgt með svo gervigreind líkanið okkar viti meira um hvað hver mynd táknar áður en hún byrjar að þjálfa þessar myndir.
Þegar það kemur að því að flokka ferskar myndir í einn af fyrirfram ákveðnum flokkum okkar, eins og „köttur“ eða „hundur“, gæti líkanið verið betur í stakk búið til að greina hlutina sem eru til staðar á mynd og standa sig almennt betur fyrir vikið.
Tilbúin gögn Auka
Fyrir utan að bæta við fleiri raunverulegum gögnum geturðu líka lagt þitt af mörkum gervigögn eða gervigögn sem virðast ósvikin.
Þetta er gagnlegt fyrir erfið verkefni eins og flutning í taugastíl, en það er líka gott fyrir hvaða hönnun sem er, hvort sem þú notar GAN (Generative Adversarial Networks), CNN (Convolutional Neural Networks) eða annan djúpan taugakerfisarkitektúr.
Til dæmis, ef við viljum flokka mops á réttan hátt án þess að þurfa að fara út og taka fjölda mynda, gætum við bætt nokkrum fölskum mopsmyndum við safn hundamynda.
Þetta form gagnaauka er sérstaklega áhrifarík til að auka nákvæmni líkana þegar gagnasöfnun er erfið, dýr eða tímafrek. Við þessar aðstæður erum við að stækka gagnasafnið tilbúnar.
Gerum ráð fyrir að upphafshópurinn okkar með 1000 ljósmyndum af hundategundum innihaldi aðeins 5 pug myndir. Í stað þess að bæta við raunverulegum pug ljósmyndum frá alvöru hundum, skulum við búa til falsa með því að klóna eina af núverandi og afbaka hana örlítið þannig að hún virðist enn eins og mops.
Gögn Augmentation Techniques
Gagnaaukningaraðferðir fela í sér að gera litlar breytingar á núverandi gögnum. Það er það sama og að umorða yfirlýsingu. Við getum skipt gagnaaukningunni í þrjá flokka:
Texti
- Orðaskipti: Þessi gagnaaukning nálgun felur í sér að skipta út núverandi hugtökum fyrir samheiti. Sem dæmi getur „Þessi mynd er heimskuleg“ orðið „Þessi mynd er fávitaleg“.
- Setning/orð uppstokkun: Þessi aðferð felur í sér að skipta um röð orða eða orða á sama tíma og heildarsamhengi er viðhaldið.
- Syntax-Tree Manipulation: Þú breytir núverandi setningu til að vera málfræðilega nákvæm á meðan þú notar sömu hugtök.
- Tilviljunarkennd eyðing: Þó að þessi aðferð skili ljótum skrifum er hún áhrifarík. Fyrir vikið verður línan „Ég mun ekki kaupa þessa plötu vegna þess að hún er rispuð“ verður „Ég mun ekki kaupa þetta vegna þess að hún er rispuð“. Setningin er óljósari, en hún er áfram trúverðug viðbót.
- Bakþýðing: Þessi aðferð er bæði áhrifarík og skemmtileg. Taktu yfirlýsingu sem er skrifuð á þínu tungumáli, þýddu hana á annað tungumál og þýddu hana síðan aftur á upprunalegt tungumál.
Myndir
- Kjarnasíur: Þessi aðferð skerpir eða gerir mynd óskýr.
- Myndasamsetning: Þó að það kunni að virðast skrítið geturðu blandað saman myndum.
- Eyða af handahófi: Eyddu örlitlum hluta núverandi myndar.
- Geometrískar umbreytingar: Þessi nálgun felur meðal annars í sér að fletta, snúa, klippa eða þýða myndir af geðþótta.
- Snúa mynd: Þú getur snúið mynd úr láréttri til lóðréttri stefnu.
- Umbreyting litarýmis: Þú getur breytt RGB-litarásunum eða bætt hvaða lit sem er núna.
- Re-Scaling er ferlið við að stilla sjónrænan mælikvarða. Þú hefur möguleika á að skala inn eða út. Þegar þú skalar inn á við verður myndin minni en upphafsstærðin. Myndin verður stærri en upprunalega ef þú skalar hana út á við.
Audio
- Pitch: Þessi nálgun felur í sér að breyta hljóðhæðinni.
- Breyta hraða: Breyttu hraðanum á hljóðskránni eða upptökunni.
- Meira hávaði: Þú getur bætt meiri hávaða við hljóðskrána.
Notaðu Case
Læknisfræðileg myndgreining er áberandi notkunartilvik fyrir gagnaaukning núna. Læknismyndasöfn eru lítil og erfitt er að deila gögnum vegna reglna og persónuverndarsjónarmiða.
Ennfremur eru gagnasöfn miklu takmarkaðari þegar um sjaldgæfar sjúkdóma er að ræða. Læknisfræðileg myndgreiningarfyrirtæki nota gagnaaukning til að auka fjölbreytni í gagnasöfnum sínum.
Áskoranir
Sveigjanleiki, fjölbreytt gagnasöfn og mikilvægi eru nokkur af þeim málum sem þarf að leysa til að þróa skilvirka gagnaaukningartækni.
Hvað varðar sveigjanleika verða aukin gögn að vera skalanleg svo að mörg mismunandi gerðir geti notað þau. Þú vilt ganga úr skugga um að hægt sé að afrita þetta til að nota í framtíðarlíkönum þar sem uppsetning gagnaaukningakerfis sem býr til mikið magn af viðeigandi, verðmætum, endurbættum gögnum getur tekið nokkurn tíma.
Hvað varðar misleitni, hafa ýmis gagnasöfn sérstaka eiginleika sem þarf að hafa í huga þegar verið er að þróa aukin gögn. Til að þróa viðeigandi endurbætt gögn verður að nýta eiginleika hvers gagnasafns.
Með öðrum orðum, gagnaaukning mun vera mismunandi milli gagnasafna og notkunartilvika.
Að lokum, til að tryggja að kostir aukinna gagna séu umfram allar hættur, ætti að meta auknu gögnin með því að nota viðeigandi mælikvarða áður en þau eru notuð af vélanámslíkönum.
Til dæmis gæti tilvist verulegs bakgrunnshávaða eða óskyldra hluta í myndtengdum auknum gögnum haft skaðleg áhrif á frammistöðu líkansins.
Niðurstaða
Á endanum, hvort sem þú ert að reyna að spá fyrir um tap, bera kennsl á fjármálasvik eða smíða betur myndflokkun módel, gagnaaukning er mikilvæg leið til að byggja nákvæmari, öflugri líkön.
Með yfirburða þjálfunarferli getur einföld forvinnsla og gagnaaukning jafnvel aðstoðað teymi við að þróa háþróaða líkön.
Fyrirtæki geta notað gagnaaukning til að draga úr þeim tíma sem fer í að undirbúa þjálfunargögn og búa til vélanámslíkön sem eru nákvæmari og hraðari.
Með því að auka magn viðeigandi gagna í gagnasafninu getur gagnaaukning einnig gagnast vélanámslíkönum sem þegar hafa mikið af gögnum.
Skildu eftir skilaboð