Tabl Cynnwys[Cuddio][Dangos]
Un o'r prif feini prawf ar gyfer unrhyw fath o weithgarwch corfforaethol yw defnyddio gwybodaeth yn effeithiol. Ar ryw adeg, mae cyfaint y data a grëwyd yn fwy na chynhwysedd prosesu sylfaenol.
Dyna lle mae algorithmau dysgu peirianyddol yn dod i rym. Fodd bynnag, cyn y gall hyn ddigwydd, rhaid astudio a dehongli'r wybodaeth. Yn gryno, dyma beth y defnyddir dysgu peiriant heb oruchwyliaeth ar ei gyfer.
Yn yr erthygl hon, byddwn yn archwilio dysgu peirianyddol manwl heb oruchwyliaeth, gan gynnwys ei algorithmau, achosion defnydd, a llawer mwy.
Beth yw Dysgu Peiriannau Heb Oruchwyliaeth?
Mae algorithmau dysgu peirianyddol heb oruchwyliaeth yn nodi patrymau mewn set ddata nad oes ganddynt ganlyniad hysbys neu wedi'i labelu. Dan oruchwyliaeth algorithmau dysgu peiriannau cael allbwn wedi'i labelu.
Mae gwybod y gwahaniaeth hwn yn eich helpu i ddeall pam na ellir defnyddio dulliau dysgu peirianyddol heb oruchwyliaeth i ddatrys materion atchweliad neu ddosbarthu, gan nad ydych yn gwybod beth yw gwerth/ateb y data allbwn. Ni allwch hyfforddi algorithm fel arfer os nad ydych yn gwybod y gwerth/ateb.
At hynny, gellir defnyddio dysgu heb oruchwyliaeth i nodi strwythur sylfaenol y data. Mae'r algorithmau hyn yn canfod patrymau cudd neu grwpiau data heb fod angen rhyngweithio dynol.
Mae ei allu i ganfod tebygrwydd a chyferbyniadau mewn gwybodaeth yn ei wneud yn ddewis gwych ar gyfer dadansoddi data archwiliadol, technegau traws-werthu, segmentu defnyddwyr, ac adnabod lluniau.
Ystyriwch y senario canlynol: rydych mewn siop groser ac yn gweld ffrwyth anhysbys nad ydych erioed wedi'i weld o'r blaen. Gallwch chi wahaniaethu'n hawdd rhwng y ffrwythau anhysbys sy'n wahanol i ffrwythau eraill o gwmpas yn seiliedig ar eich arsylwadau o'i ffurf, maint, neu liw.
Algorithmau Dysgu Peiriannau Heb Oruchwyliaeth
Clwstwri
Heb os, clystyru yw’r dull dysgu heb oruchwyliaeth a ddefnyddir amlaf. Mae'r dull hwn yn rhoi eitemau data cysylltiedig mewn clystyrau a gynhyrchir ar hap.
Ar ei ben ei hun, mae model ML yn darganfod unrhyw batrymau, tebygrwydd a/neu wahaniaethau mewn strwythur data heb ei gategoreiddio. Bydd model yn gallu darganfod unrhyw grwpiau neu ddosbarthiadau naturiol mewn data.
Mathau
Mae sawl math o glystyru y gellir eu defnyddio. Gadewch i ni edrych ar y rhai pwysicaf yn gyntaf.
- Mae clystyru unigryw, a elwir weithiau yn glystyru “caled”, yn fath o grŵp lle mae un darn o ddata yn perthyn i un clwstwr yn unig.
- Mae clystyru gorgyffwrdd, a elwir yn glystyru “meddal” yn aml, yn caniatáu i wrthrychau data berthyn i fwy nag un clwstwr i raddau amrywiol. At hynny, gellir defnyddio clystyru tebygol i fynd i’r afael â chlystyru “meddal” neu broblemau amcangyfrif dwysedd, yn ogystal ag asesu tebygolrwydd neu debygolrwydd pwyntiau data sy’n perthyn i rai clystyrau.
- Creu hierarchaeth o eitemau data wedi'u grwpio yw nod clystyru hierarchaidd, fel y mae'r enw'n nodi. Mae eitemau data yn cael eu dadadeiladu neu eu cyfuno yn seiliedig ar yr hierarchaeth i gynhyrchu clystyrau.
Achosion defnydd:
- Canfod Anomaleddau:
Gellir canfod unrhyw fath o allanolyn mewn data trwy ddefnyddio clystyru. Gall cwmnïau cludiant a logisteg, er enghraifft, ddefnyddio dulliau canfod anghysondebau i ddarganfod rhwystrau logistaidd neu ddatgelu rhannau mecanyddol sydd wedi'u difrodi (cynnal a chadw rhagfynegol).
Gall sefydliadau ariannol ddefnyddio'r dechnoleg i ganfod trafodion twyllodrus ac ymateb yn gyflym, gan arbed llawer o arian o bosibl. Dysgwch fwy am ganfod annormaleddau a thwyll trwy wylio ein fideo.
- Segmentu cwsmeriaid a marchnadoedd:
Gall clystyru algorithmau helpu i grwpio pobl sydd â nodweddion tebyg a chreu personas defnyddwyr ar gyfer marchnata mwy effeithiol a mentrau wedi'u targedu.
K-Medr
Mae K-means yn ddull clystyru a elwir hefyd yn rhaniad neu segmentu. Mae'n rhannu'r pwyntiau data yn nifer rhagnodedig o glystyrau a elwir yn K.
Yn y dull K-moddion, K yw'r mewnbwn gan eich bod chi'n dweud wrth y cyfrifiadur faint o glystyrau rydych chi am eu nodi yn eich data. Yna caiff pob eitem ddata ei neilltuo i'r ganolfan glwstwr agosaf, a elwir yn centroid (smotiau du yn y llun).
Mae'r olaf yn fannau storio data. Gellir gwneud y dechneg clystyru sawl gwaith nes bod y clystyrau wedi'u diffinio'n dda.
Fuzzy K-yn golygu
Mae Fuzzy K-means yn estyniad o'r dechneg K-moddau, a ddefnyddir i wneud clystyru gorgyffwrdd. Yn wahanol i'r dechneg K-moddion, mae K-moddau niwlog yn dangos y gallai pwyntiau data berthyn i lawer o glystyrau gyda graddau amrywiol o agosrwydd at bob un.
Defnyddir y pellter rhwng pwyntiau data a centroid y clwstwr i gyfrifo agosrwydd. O ganlyniad, gall fod adegau pan fydd clystyrau amrywiol yn gorgyffwrdd.
Modelau Cymysgedd Gaussaidd
Mae Modelau Cymysgedd Gaussian (GMMs) yn ddull a ddefnyddir mewn clystyru tebygol. Gan nad yw'r cymedr a'r amrywiant yn hysbys, mae'r modelau'n rhagdybio bod nifer sefydlog o ddosraniadau Gaussian, pob un yn cynrychioli clwstwr penodol.
I benderfynu pa glwstwr y mae pwynt data penodol yn perthyn iddo, defnyddir y dull yn y bôn.
Clystyru Hierarchaidd
Gall y strategaeth glystyru hierarchaidd ddechrau gyda phob pwynt data wedi'i neilltuo i glwstwr gwahanol. Yna caiff y ddau glwstwr sydd agosaf at ei gilydd eu cyfuno'n un clwstwr. Mae uno iteraidd yn parhau nes mai dim ond un clwstwr sy'n aros ar y brig.
Gelwir y dull hwn o'r gwaelod i fyny neu'n grynodref. Os byddwch chi'n dechrau gyda'r holl eitemau data sydd wedi'u clymu i'r un clwstwr ac yna'n cynnal rhaniadau nes bod pob eitem ddata wedi'i neilltuo fel clwstwr ar wahân, gelwir y dull yn glystyru hierarchaidd o'r brig i'r gwaelod neu'n ymrannol.
Algorithm Apriori
Poblogeiddiwyd algorithmau apriori gan ddadansoddi basged y farchnad, gan arwain at wahanol beiriannau argymell ar gyfer llwyfannau cerddoriaeth a siopau ar-lein.
Cânt eu defnyddio mewn setiau data trafodion i ddod o hyd i setiau o eitemau aml, neu grwpiau o eitemau, er mwyn rhagweld y tebygolrwydd o ddefnyddio un cynnyrch yn seiliedig ar ddefnydd un arall.
Er enghraifft, os byddaf yn dechrau chwarae radio OneRepublic ar Spotify gyda “Counting Stars,” bydd un o’r caneuon eraill ar y sianel hon yn sicr yn gân Imagine Dragon, fel “Bad Liar.”
Mae hyn yn seiliedig ar fy arferion gwrando blaenorol yn ogystal â phatrymau gwrando eraill. Mae dulliau Apriori yn cyfrif setiau eitemau gan ddefnyddio coeden stwnsh, gan groesi ehangder y set ddata yn gyntaf.
Gostyngiad Dimensiwn
Mae lleihau dimensioldeb yn fath o ddysgu heb oruchwyliaeth sy'n defnyddio casgliad o strategaethau i leihau nifer y nodweddion - neu ddimensiynau - mewn set ddata. Gadewch inni egluro.
Gall fod yn demtasiwn ymgorffori cymaint o ddata â phosibl wrth greu eich data set ddata ar gyfer dysgu peirianyddol. Peidiwch â'n gwneud yn anghywir: mae'r strategaeth hon yn gweithio'n dda gan fod mwy o ddata fel arfer yn rhoi canfyddiadau mwy cywir.
Tybiwch fod data'n cael ei storio mewn gofod N-dimensiwn, gyda phob nodwedd yn cynrychioli dimensiwn gwahanol. Efallai y bydd cannoedd o ddimensiynau os oes llawer o ddata.
Ystyriwch daenlenni Excel, gyda cholofnau yn cynrychioli nodweddion a rhesi yn cynrychioli eitemau data. Pan fo gormod o ddimensiynau, gallai algorithmau ML berfformio'n wael a delweddu data yn gallu dod yn anodd.
Felly mae'n rhesymegol cyfyngu'r nodweddion neu'r dimensiynau, a chyfleu gwybodaeth berthnasol yn unig. Dim ond hynny yw lleihau dimensiwn. Mae'n caniatáu ar gyfer swm hylaw o fewnbynnau data heb gyfaddawdu cywirdeb y set ddata.
Dadansoddiad Prif Gydran (PCA)
Y prif ddadansoddiad o gydrannau yw dull lleihau dimensioldeb. Fe'i defnyddir i leihau nifer y nodweddion mewn setiau data enfawr, gan arwain at fwy o symlrwydd data heb aberthu cywirdeb.
Cyflawnir cywasgu set ddata trwy ddull a elwir yn echdynnu nodwedd. Mae'n dangos bod elfennau o'r set wreiddiol yn cael eu cymysgu i mewn i un newydd, llai. Gelwir y nodweddion newydd hyn yn gydrannau sylfaenol.
Wrth gwrs, mae yna algorithmau ychwanegol y gallwch eu defnyddio yn eich cymwysiadau dysgu heb oruchwyliaeth. Dim ond y rhai a restrir uchod yw'r rhai mwyaf cyffredin, a dyna pam y cânt eu trafod yn fanylach.
Cymhwyso dysgu heb oruchwyliaeth
- Defnyddir dulliau dysgu heb oruchwyliaeth ar gyfer tasgau canfyddiad gweledol megis adnabod gwrthrychau.
- Mae dysgu peiriannau heb oruchwyliaeth yn rhoi agweddau hanfodol ar systemau delweddu meddygol, megis adnabod delweddau, dosbarthu a segmentu, a ddefnyddir mewn radioleg a phatholeg i wneud diagnosis o gleifion yn gyflym ac yn ddibynadwy.
- Gall dysgu heb oruchwyliaeth helpu i nodi tueddiadau data y gellir eu defnyddio i greu strategaethau traws-werthu mwy effeithiol gan ddefnyddio data’r gorffennol ar ymddygiad defnyddwyr. Yn ystod y broses ddesg dalu, mae hyn yn cael ei ddefnyddio gan fusnesau ar-lein i awgrymu'r ychwanegion cywir i gleientiaid.
- Gall dulliau dysgu heb oruchwyliaeth sifftio trwy symiau enfawr o ddata i ddod o hyd i allgleifion. Gallai'r annormaleddau hyn godi'r rhybudd o ddiffyg offer, camgymeriad dynol, neu doriadau diogelwch.
Problemau gyda dysgu heb oruchwyliaeth
Mae dysgu heb oruchwyliaeth yn apelio mewn amrywiaeth o ffyrdd, o'r potensial i ddod o hyd i fewnwelediadau pwysig data er mwyn osgoi labelu data costus gweithrediadau. Fodd bynnag, mae sawl anfantais i ddefnyddio'r strategaeth hon i hyfforddi modelau dysgu peiriannau y dylech fod yn ymwybodol ohono. Dyma rai enghreifftiau.
- Gan nad oes gan ddata mewnbwn labeli sy'n gweithredu fel allweddi ymateb, gallai canlyniadau modelau dysgu heb oruchwyliaeth fod yn llai manwl gywir.
- Mae dysgu heb oruchwyliaeth yn aml yn gweithio gyda setiau data enfawr, a all gynyddu cymhlethdod cyfrifiannol.
- Mae'r dull yn gofyn am gadarnhad allbwn gan fodau dynol, naill ai'n arbenigwyr mewnol neu allanol yn y pwnc ymholi.
- Rhaid i algorithmau archwilio a chyfrifo pob senario posibl trwy gydol y cyfnod hyfforddi, sy'n cymryd peth amser.
Casgliad
Mae defnyddio data yn effeithiol yn allweddol i sefydlu mantais gystadleuol mewn marchnad benodol.
Gallwch segmentu'r data gan ddefnyddio algorithmau dysgu peirianyddol heb oruchwyliaeth i archwilio dewisiadau eich cynulleidfa darged neu i benderfynu sut mae haint penodol yn ymateb i driniaeth benodol.
Mae sawl cymhwysiad ymarferol, a gwyddonwyr data, gall peirianwyr, a phenseiri eich cynorthwyo i ddiffinio'ch nodau a datblygu atebion ML unigryw ar gyfer eich cwmni.
Gadael ymateb