Werrej[Aħbi][Uri]
Wieħed mill-kriterji primarji għal kwalunkwe tip ta' attività korporattiva huwa l-użu effettiv tal-informazzjoni. F'xi punt, il-volum ta 'data maħluqa jaqbeż il-kapaċità tal-ipproċessar bażiku.
Dan huwa fejn jidħlu l-algoritmi tat-tagħlim tal-magni. Madankollu, qabel ma jista' jseħħ xi ħaġa minn dan, l-informazzjoni trid tiġi studjata u interpretata. Fil-qosor, huwa għalxiex jintuża t-tagħlim tal-magni mhux sorveljat.
F'dan l-artikolu, aħna ser neżaminaw it-tagħlim tal-magni mhux sorveljat fil-fond, inklużi l-algoritmi tiegħu, il-każijiet ta 'użu, u ħafna aktar.
X'inhu Tagħlim Magni Mhux Supervisjat?
Algoritmi ta' tagħlim tal-magni mhux sorveljati jidentifikaw mudelli f'sett tad-dejta li m'għandhomx konsegwenza magħrufa jew tikkettata. Ssorveljat algoritmi ta 'tagħlim bil-magna għandhom output ittikkettat.
Li tkun taf din id-distinzjoni jgħinek tifhem għaliex metodi ta 'tagħlim tal-magni mhux sorveljati ma jistgħux jintużaw biex isolvu kwistjonijiet ta' rigressjoni jew klassifikazzjoni, peress li ma tafx x'jista 'jkun il-valur/tweġiba għad-dejta tal-output. Ma tistax tħarreġ algoritmu normalment jekk ma tafx il-valur/tweġiba.
Barra minn hekk, it-tagħlim mhux sorveljat jista' jintuża biex tiġi identifikata l-istruttura fundamentali tad-dejta. Dawn l-algoritmi jiskopru mudelli moħbija jew gruppi ta 'dejta mingħajr il-ħtieġa ta' interazzjoni umana.
Il-kapaċità tagħha li tiskopri xebh u kuntrasti fl-informazzjoni tagħmilha għażla kbira għall-analiżi tad-dejta esploratorja, tekniki ta 'bejgħ inkroċjat, segmentazzjoni tal-konsumatur, u identifikazzjoni tal-istampi.
Ikkunsidra x-xenarju li ġej: int f’ħanut tal-merċa u tara frott mhux identifikat li qatt ma rajt qabel. Tista 'faċilment tiddistingwi l-frott mhux magħruf differenti minn frott ieħor madwar ibbażat fuq l-osservazzjonijiet tiegħek tal-forma, id-daqs jew il-kulur tiegħu.
Algoritmi ta' Tagħlim tal-Magni mhux sorveljati
Raggruppament
Il-clustering huwa bla dubju l-aktar approċċ ta' tagħlim mhux sorveljat użat. Dan l-approċċ ipoġġi oġġetti tad-dejta relatati fi gruppi ġenerati b'mod każwali.
Waħdu, mudell ML jiskopri kwalunkwe xejriet, xebh, u/jew differenzi fi struttura tad-dejta mhux kategorizzata. Mudell ikun jista' jiskopri kwalunkwe raggruppament jew klassi naturali fid-dejta.
Tipi
Hemm diversi forom ta 'clustering li jistgħu jintużaw. Ejja nħarsu lejn l-aktar importanti l-ewwel.
- Raggruppament esklussiv, kultant magħruf bħala raggruppament "iebes", huwa tip ta 'raggruppament li fih biċċa waħda ta' dejta tappartjeni għal raggruppament wieħed biss.
- Raggruppament li jikkoinċidi, spiss magħruf bħala raggruppament "artab", jippermetti li oġġetti tad-dejta jappartjenu għal aktar minn raggruppament wieħed fi gradi differenti. Barra minn hekk, raggruppament probabilstiku jista' jintuża biex jiġu indirizzati problemi ta' raggruppament "artab" jew ta' stima tad-densità, kif ukoll biex tiġi vvalutata l-probabbiltà jew il-probabbiltà ta' punti tad-dejta li jappartjenu għal ċerti clusters.
- Il-ħolqien ta' ġerarkija ta' oġġetti ta' data raggruppati huwa l-għan ta' raggruppament ġerarkiku, kif jindika l-isem. L-oġġetti tad-dejta huma dekostrutti jew magħquda abbażi tal-ġerarkija biex jiġġeneraw raggruppamenti.
Użi tal-każijiet:
- Sejbien ta' anomaliji:
Kwalunkwe tip ta 'outlier fid-dejta jista' jiġi skopert bl-użu ta 'clustering. Kumpaniji fit-trasport u l-loġistika, pereżempju, jistgħu jutilizzaw skoperta ta 'anomaliji biex jiskopru impedimenti loġistiċi jew jiżvelaw partijiet mekkaniċi bil-ħsara (manutenzjoni ta' tbassir).
L-istituzzjonijiet finanzjarji jistgħu jużaw it-teknoloġija biex jiskopru transazzjonijiet frawdolenti u jirrispondu malajr, potenzjalment jiffrankaw ħafna flus. Tgħallem aktar dwar l-iskoperta ta' anormalitajiet u frodi billi tara l-vidjo tagħna.
- Segmentazzjoni tal-klijenti u s-swieq:
L-algoritmi ta' raggruppament jistgħu jassistu fil-grupp ta' nies li għandhom karatteristiċi simili u fil-ħolqien ta' persuni tal-konsumatur għal kummerċjalizzazzjoni aktar effettiva u inizjattivi mmirati.
K-Mezzi
K-means huwa metodu ta 'clustering li huwa magħruf ukoll bħala qsim jew segmentazzjoni. Taqsam il-punti tad-dejta f'numru predeterminat ta 'clusters magħrufa bħala K.
Fil-metodu K-means, K huwa l-input peress li tgħid lill-kompjuter kemm-il raggruppamenti trid tidentifika fid-dejta tiegħek. Kull oġġett tad-dejta huwa sussegwentement assenjat lill-eqreb ċentru tal-cluster, magħruf bħala centroid (tikek suwed fl-istampa).
Dawn tal-aħħar iservu bħala spazji għall-ħażna tad-dejta. It-teknika ta 'clustering tista' ssir bosta drabi sakemm ir-raggruppamenti jkunu definiti sew.
Fuzzy K-mezzi
Fuzzy K-means hija estensjoni tat-teknika tal-K-means, li tintuża biex tagħmel raggruppament li jikkoinċidi. B'differenza mit-teknika tal-K-means, il-K-means fuzzy jindikaw li l-punti tad-dejta jistgħu jappartjenu għal ħafna gruppi bi gradi varji ta 'prossimità għal kull wieħed.
Id-distanza bejn il-punti tad-dejta u ċ-ċentru tal-cluster tintuża biex tikkalkula l-prossimità. Bħala riżultat, jista 'jkun hemm okkażjonijiet meta diversi clusters jikkoinċidu.
Mudelli ta' Taħlit Gaussian
Mudelli ta' Taħlit Gaussjani (GMMs) huma metodu użat fil-clustering probabilistiku. Minħabba li l-medja u l-varjanza mhumiex magħrufa, il-mudelli jassumu li hemm numru fiss ta 'distribuzzjonijiet Gaussian, kull wieħed jirrappreżenta cluster distint.
Biex jiġi determinat għal liema cluster jappartjeni punt tad-dejta speċifiku, il-metodu huwa essenzjalment użat.
Raggruppament Ġerarkiku
L-istrateġija ta' raggruppament ġerarkiku tista' tibda b'kull punt tad-dejta assenjat lil cluster differenti. Iż-żewġ raggruppamenti li huma l-eqreb xulxin imbagħad jitħalltu fi raggruppament wieħed. Għaqda iterattiva tkompli sakemm raggruppament wieħed biss jibqa 'fil-quċċata.
Dan il-metodu huwa magħruf bħala minn isfel għal fuq jew agglomerattiv. Jekk tibda bl-oġġetti tad-dejta kollha marbuta mal-istess cluster u mbagħad twettaq qsim sakemm kull oġġett tad-dejta jiġi assenjat bħala cluster separat, il-metodu huwa magħruf bħala clustering ġerarkiku minn fuq għal isfel jew diviżiv.
Algoritmu Apriori
L-analiżi tal-basket tas-suq popolarizzat algoritmi apriori, li rriżultat f'diversi magni ta 'rakkomandazzjoni għal pjattaformi tal-mużika u ħwienet onlajn.
Jintużaw f'settijiet ta' dejta transazzjonali biex jinstabu settijiet ta' oġġetti frekwenti, jew gruppi ta' oġġetti, sabiex titbassar il-probabbiltà li jiġi kkunsmat prodott wieħed ibbażat fuq il-konsum ta' ieħor.
Pereżempju, jekk nibda ndoqq ir-radju ta’ OneRepublic fuq Spotify b’“Counting Stars”, waħda mill-kanzunetti l-oħra fuq dan il-kanal ċertament tkun kanzunetta Imagine Dragon, bħal “Bad Liar”.
Dan huwa bbażat fuq id-drawwiet tas-smigħ preċedenti tiegħi kif ukoll ix-xejriet tas-smigħ ta 'oħrajn. Il-metodi apriori jgħoddu settijiet ta' oġġetti bl-użu ta' siġra tal-hash, li jaqsmu s-sett tad-dejta l-ewwel.
Tnaqqis tad-Dimensjonalità
It-tnaqqis tad-dimensjonijiet huwa tip ta 'tagħlim mhux sorveljat li juża ġabra ta' strateġiji biex jimminimizza n-numru ta 'karatteristiċi - jew dimensjonijiet - f'sett tad-dejta. Ħallina niċċaraw.
Jista 'jitħajjar li tinkorpora data kemm jista' jkun waqt li toħloq tiegħek dataset għat-tagħlim tal-magni. Tqarraqx: din l-istrateġija taħdem tajjeb peress li aktar dejta ġeneralment tagħti sejbiet aktar preċiżi.
Assumi li d-data hija maħżuna fi spazju N-dimensjonali, b'kull karatteristika tirrappreżenta dimensjoni differenti. Jista 'jkun hemm mijiet ta' dimensjonijiet jekk ikun hemm ħafna dejta.
Ikkunsidra spreadsheets Excel, b'kolonni li jirrappreżentaw il-karatteristiċi u ringieli li jirrappreżentaw oġġetti tad-dejta. Meta jkun hemm wisq dimensjonijiet, algoritmi ML jistgħu jaħdmu ħażin u viżwalizzazzjoni tad-dejta jista’ jsir diffiċli.
Għalhekk jagħmilha loġika li jillimitaw il-karatteristiċi jew id-dimensjonijiet, u twassal biss informazzjoni pertinenti. It-tnaqqis tad-dimensjoni huwa biss dak. Jippermetti kwantità maniġġabbli ta' inputs ta' dejta mingħajr ma tiġi kompromessa l-integrità tas-sett tad-dejta.
Analiżi tal-Komponent Prinċipali (PCA)
L-analiżi tal-komponenti prinċipali hija approċċ għat-tnaqqis tad-dimensjonijiet. Jintuża biex jimminimizza n-numru ta 'karatteristiċi f'settijiet ta' dejta enormi, li jirriżulta f'sempliċità akbar tad-dejta mingħajr ma tiġi sagrifikata l-eżattezza.
Il-kompressjoni tas-sett tad-dejta titwettaq b'metodu magħruf bħala estrazzjoni tal-karatteristiċi. Tindika li elementi mis-sett oriġinali huma mħallta f'wieħed ġdid, iżgħar. Dawn il-karatteristiċi ġodda huma magħrufa bħala komponenti primarji.
Naturalment, hemm algoritmi addizzjonali li tista' tuża fl-applikazzjonijiet ta' tagħlim mhux sorveljat tiegħek. Dawk elenkati hawn fuq huma biss l-aktar prevalenti, u huwa għalhekk li huma diskussi f'aktar dettall.
Applikazzjoni ta' Tagħlim mhux sorveljat
- Metodi ta 'tagħlim mhux sorveljati huma utilizzati għal kompiti ta' perċezzjoni viżwali bħar-rikonoxximent ta 'oġġetti.
- It-tagħlim tal-magni mhux sorveljat jagħti aspetti kritiċi lis-sistemi tal-immaġini mediċi, bħall-identifikazzjoni tal-immaġni, il-klassifikazzjoni u s-segmentazzjoni, li huma utilizzati fir-radjoloġija u l-patoloġija biex jiġu djanjostikati l-pazjenti b'mod rapidu u affidabbli.
- It-tagħlim mhux sorveljat jista' jgħin biex jiġu identifikati tendenzi tad-dejta li jistgħu jintużaw biex jinħolqu strateġiji ta' bejgħ inkroċjat aktar effettivi li jutilizzaw dejta tal-passat dwar l-imġiba tal-konsumatur. Matul il-proċess ta 'checkout, dan jintuża min-negozji onlajn biex jissuġġerixxi l-add-ons it-tajbin lill-klijenti.
- Metodi ta 'tagħlim mhux sorveljati jistgħu jgħarblu volumi enormi ta' dejta biex isibu outliers. Dawn l-anormalitajiet jistgħu jqajmu l-avviż ta’ tagħmir li jaħdem ħażin, żball uman, jew ksur tas-sigurtà.
Kwistjonijiet b'Tagħlim Mhux Supervisjat
It-tagħlim mhux sorveljat huwa attraenti f'varjetà ta' modi, mill-potenzjal li ssib għarfien importanti dwar dejta biex jiġi evitat it-tikkettjar tad-dejta li jiswa ħafna flus operazzjonijiet. Madankollu, hemm diversi żvantaġġi biex tuża din l-istrateġija biex titħarreġ mudelli ta 'tagħlim bil-magna li inti għandek tkun konxju ta '. Hawn huma xi eżempji.
- Billi d-dejta tal-input m'għandhiex tikketti li jservu bħala ċwievet ta' rispons, ir-riżultati tal-mudelli ta' tagħlim mhux sorveljati jistgħu jkunu inqas preċiżi.
- Tagħlim mhux sorveljat spiss jaħdem b'settijiet ta' dejta massivi, li jistgħu jżidu l-kumplessità tal-komputazzjoni.
- L-approċċ jeħtieġ konferma tal-output mill-bnedmin, jew speċjalisti interni jew esterni fis-suġġett tal-inkjesta.
- L-algoritmi għandhom jeżaminaw u jikkalkulaw kull xenarju possibbli matul il-fażi tat-taħriġ, li tieħu xi żmien.
konklużjoni
L-użu effettiv tad-dejta huwa ċ-ċavetta biex jiġi stabbilit vantaġġ kompetittiv f'suq partikolari.
Tista 'segmenta d-dejta billi tuża algoritmi ta' tagħlim tal-magni mhux sorveljati biex teżamina l-preferenzi tal-udjenza fil-mira tiegħek jew biex tiddetermina kif ċerta infezzjoni tirrispondi għal trattament partikolari.
Hemm diversi applikazzjonijiet prattiċi, u xjenzati tad-dejta, inġiniera, u periti jistgħu jgħinuk biex tiddefinixxi l-miri tiegħek u tiżviluppa soluzzjonijiet ML uniċi għall-kumpanija tiegħek.
Ħalli Irrispondi