Daptar eusi[Sumputkeun][Témbongkeun]
Salah sahiji kritéria utama pikeun sagala jinis kagiatan perusahaan nyaéta panggunaan inpormasi anu efektif. Di sawatara titik, volume data dijieun ngaleuwihan kapasitas processing dasar.
Éta tempat algoritma pembelajaran mesin dimaénkeun. Nanging, sateuacan salah sahiji ieu tiasa kajantenan, inpormasi kedah ditaliti sareng diinterpretasi. Singkatna, éta anu dianggo pikeun diajar mesin anu teu diawaskeun.
Dina artikel ieu, urang bakal nalungtik mesin learning unsupervised jero, kaasup algoritma na, kasus pamakéan, jeung loba deui.
Naon Dupi Unsupervised Machine Learning?
Algoritma pembelajaran mesin anu teu diawaskeun ngaidentipikasi pola dina set data anu henteu gaduh akibat anu dipikanyaho atanapi dilabélan. Diawaskeun algoritma pembelajaran mesin gaduh kaluaran dilabélan.
Nyaho bédana ieu ngabantosan anjeun ngartos naha metode pembelajaran mesin anu teu diawaskeun henteu tiasa dianggo pikeun ngabéréskeun masalah régrési atanapi klasifikasi, sabab anjeun henteu terang naon nilai / jawaban pikeun data kaluaran. Anjeun teu bisa ngalatih hiji algoritma normal lamun teu nyaho nilai / jawaban.
Leuwih ti éta, Unsupervised learning bisa dipaké pikeun ngaidentipikasi struktur dasar data. Algoritma ieu ngadeteksi pola disumputkeun atanapi grup data tanpa peryogi interaksi manusa.
Kapasitasna pikeun ngadeteksi kamiripan sareng kontras inpormasi ngajadikeun éta pilihan anu hadé pikeun analisis data éksplorasi, téknik cross-selling, segmentasi konsumen, sareng idéntifikasi gambar.
Pertimbangkeun skénario ieu: anjeun nuju di toko grosir sareng ningali buah anu teu dipikanyaho anu teu acan kantos anjeun tingali. Anjeun gampang bisa ngabedakeun buah kanyahoan béda ti buah séjén sabudeureun dumasar kana observasi anjeun bentuk, ukuran, atawa warna.
Algoritma Pembelajaran Mesin Unsupervised
Klastering
Clustering tanpa ragu mangrupikeun pendekatan pembelajaran anu teu diawaskeun anu paling seueur dianggo. pendekatan ieu nempatkeun item data patali kana klaster dihasilkeun acak.
Ku sorangan, model ML manggihan pola, kamiripan, jeung/atawa béda dina struktur data uncategorized. Hiji model bakal tiasa manggihan sagala groupings alam atanapi kelas dina data.
tipe
Aya sababaraha bentuk klaster anu tiasa dianggo. Hayu urang tingali heula anu paling penting.
- Klaster éksklusif, sok katelah kluster "teuas", mangrupikeun jinis pengelompokeun dimana sapotong data ngan ukur milik hiji klaster.
- Tumpang tindih clustering, mindeng katelah "lemes" clustering, ngamungkinkeun objék data milik leuwih ti hiji klaster jeung varying derajat. Saterusna, clustering probabilistik bisa dipaké pikeun tackle "lemes" clustering atawa masalah estimasi dénsitas, kitu ogé pikeun assess probabiliti atawa likelihood titik data milik klaster tangtu.
- Nyiptakeun hirarki item data anu dikelompokkeun mangrupikeun tujuan tina klaster hirarkis, sakumaha nami nunjukkeun. Item data didekonstruksi atanapi digabungkeun dumasar kana hirarki pikeun ngahasilkeun klaster.
Anggo kasus:
- Deteksi Anomali:
Sakur jinis outlier dina data tiasa dideteksi nganggo clustering. Perusahaan dina transportasi sareng logistik, contona, tiasa ngagunakeun deteksi anomali pikeun mendakan halangan logistik atanapi nyingkab bagian mékanis anu ruksak (pangropéa prediktif).
Lembaga keuangan tiasa nganggo téknologi pikeun ngadeteksi transaksi curang sareng ngaréspon gancang, berpotensi ngahémat artos. Diajar langkung seueur ngeunaan némbongan abnormalitas sareng panipuan ku ningali pidéo kami.
- Segmentasi konsumén sareng pasar:
Algoritma Clustering tiasa ngabantosan dina ngagolongkeun jalma anu gaduh ciri anu sami sareng nyiptakeun personas konsumen pikeun pamasaran anu langkung efektif sareng inisiatif anu dituju.
K-Hartosna
K-means nyaéta métode clustering anu ogé katelah partitioning atanapi segmentation. Éta ngabagi titik-titik data kana sajumlah klaster anu tos ditangtukeun katelah K.
Dina metoda K-maksudna, K nyaéta input saprak anjeun ngabejaan komputer sabaraha klaster rék ngaidentipikasi dina data anjeun. Unggal item data anu salajengna ditugaskeun ka puseur klaster pangdeukeutna, katelah centroid a (titik hideung dina gambar).
Anu terakhir janten tempat panyimpen data. Téhnik clustering bisa dipigawé sababaraha kali nepi ka klaster anu well-didefinisikeun.
Fuzzy K-hartosna
Fuzzy K-means mangrupa kepanjangan tina téknik K-means, anu dipaké pikeun ngalakukeun klaster tumpang tindih. Beda jeung téknik K-means, Fuzzy K-means nunjukkeun yén titik data bisa jadi milik loba klaster kalawan rupa-rupa tingkat deukeutna ka unggal.
Jarak antara titik data jeung centroid kluster dipaké pikeun ngitung jarak. Hasilna, tiasa aya kasempetan nalika rupa-rupa klaster tumpang tindih.
Model Campuran Gaussian
Model Campuran Gaussian (GMMs) mangrupikeun metode anu dianggo dina klaster probabilistik. Kusabab rata-rata jeung varian teu kanyahoan, model nganggap yén aya sajumlah tetep sebaran Gaussian, unggal ngagambarkeun klaster béda.
Pikeun nangtukeun mana klaster hiji titik data husus milik, métode dasarna dipaké.
Clustering hirarki
Strategi clustering hirarki bisa dimimitian ku unggal titik data ditugaskeun ka klaster béda. Dua gugus anu pangdeukeutna hiji-hiji tuluy dihijikeun jadi hiji gugusan. Penggabungan iteratif terus dugi ka ngan ukur hiji klaster tetep di luhur.
Metoda ieu katelah bottom-up atanapi agglomerative. Upami anjeun ngawitan sadaya item data dihijikeun kana klaster anu sami sareng teras ngalaksanakeun pamisah dugi ka unggal item data ditugaskeun salaku klaster anu misah, metodena katelah klaster hirarkis luhur-handap atanapi divisive.
Algoritma Apriori
Analisis karinjang pasar ngapopulérkeun algoritma apriori, nyababkeun rupa-rupa mesin rekomendasi pikeun platform musik sareng toko online.
Éta dipaké dina datasets transactional pikeun manggihan itemsets sering, atawa groupings item, guna ngaduga likelihood tina consuming hiji produk dumasar kana konsumsi sejen.
Contona, upami kuring mimiti muterkeun radio OneRepublic di Spotify nganggo "Counting Stars", salah sahiji lagu sanés dina saluran ieu pasti bakal janten lagu Imagine Dragon, sapertos "Bad Liar."
Ieu dumasar kana kabiasaan déngékeun kuring saméméhna ogé pola déngékeun batur. Métode Apriori ngitung itemsets nganggo tangkal hash, ngalangkungan set data heula.
Réduksi Diménsi
Pangurangan dimensi mangrupikeun jinis pembelajaran anu teu diawasi anu ngagunakeun kumpulan strategi pikeun ngaleutikan jumlah fitur - atanapi dimensi - dina set data. Hayu urang netelakeun.
Bisa jadi pikabitaeun pikeun ngasupkeun saloba data sabisa bari nyieun Anjeun dataset pikeun machine learning. Tong lepat: strategi ieu tiasa dianggo saé sabab langkung seueur data biasana ngahasilkeun pamanggihan anu langkung akurat.
Anggap yén data disimpen dina spasi N-dimensi, kalawan unggal fitur ngagambarkeun dimensi béda. Bisa jadi aya ratusan dimensi lamun aya loba data.
Pertimbangkeun spreadsheets Excel, kalayan kolom ngagambarkeun ciri jeung baris ngagambarkeun item data. Lamun aya loba teuing diménsi, algoritma ML bisa ngalakukeun kirang na visualisasi data bisa jadi hésé.
Ku kituna ngajadikeun logis mun ngawatesan ciri atawa dimensi, sarta nepikeun informasi ngan pertinent. Ngurangan dimensi ngan éta. Éta ngamungkinkeun jumlah input data anu tiasa diurus tanpa ngaganggu integritas set data.
Analisis Komponén Pokok (PCA)
Analisis komponén poko nyaéta pendekatan réduksi dimensi. Hal ieu dianggo pikeun ngaminimalkeun jumlah fitur dina set data ageung, nyababkeun kesederhanaan data anu langkung ageung tanpa ngorbankeun akurasi.
Komprési set data dilaksanakeun ku cara anu katelah ékstraksi fitur. Ieu nunjukkeun yén elemen ti set aslina anu dicampurkeun kana anyar, hiji leuwih leutik. Tret anyar ieu katelah komponén primér.
Tangtosna, aya algoritma tambahan anu anjeun tiasa dianggo dina aplikasi diajar anu henteu diawasi. Anu didaptarkeun di luhur mangrupikeun anu paling umum, naha éta dibahas langkung rinci.
Aplikasi tina pangajaran Unsupervised
- Métode diajar anu teu diawaskeun dianggo pikeun tugas persépsi visual sapertos pangakuan obyék.
- Pembelajaran mesin anu teu diawaskeun masihan aspék kritis kana sistem pencitraan médis, sapertos idéntifikasi gambar, klasifikasi, sareng segmentasi, anu dianggo dina radiologi sareng patologi pikeun ngadiagnosa pasien kalayan gancang sareng dipercaya.
- Pangajaran anu teu diawasi tiasa ngabantosan ngaidentipikasi tren data anu tiasa dianggo pikeun nyiptakeun strategi cross-selling anu langkung efektif ngagunakeun data katukang ngeunaan paripolah konsumen. Salila prosés pamariksaan, ieu dianggo ku usaha online pikeun nyarankeun tambihan anu pas ka klien.
- Métode diajar anu teu diawaskeun tiasa ngayak data anu ageung pisan pikeun mendakan anu kaluar. Abnormalitas ieu tiasa nyababkeun béwara ngeunaan alat-alat anu teu berfungsi, kasalahan manusa, atanapi pelanggaran kaamanan.
Isu jeung pembelajaran Unsupervised
Pangajaran anu teu diawasi pikaresepeun dina sababaraha cara, tina poténsi pikeun mendakan wawasan anu penting data pikeun ngahindarkeun panyiri data anu mahal operasi. Sanajan kitu, aya sababaraha drawbacks mun ngagunakeun strategi ieu ngalatih modél pembelajaran mesin anu anjeun kedah terang. Ieu sababaraha conto.
- Kusabab data input kurang labél anu janten konci réspon, hasil modél pangajaran anu henteu diawasi tiasa kirang tepat.
- Pangajaran anu teu diawaskeun sering dianggo sareng set data anu ageung, anu tiasa ningkatkeun pajeulitna komputasi.
- Pendekatan merlukeun konfirmasi kaluaran ku manusa, boh spesialis internal atawa éksternal dina subyek panalungtikan.
- Algoritma kedah mariksa sareng ngitung unggal skenario anu mungkin sapanjang fase latihan, anu peryogi sababaraha waktos.
kacindekan
Pamakéan data anu épéktip mangrupikeun konci pikeun ngadamel keunggulan kompetitif dina pasar khusus.
Anjeun tiasa ngabagi data nganggo algoritma pembelajaran mesin anu teu diawaskeun pikeun nguji karesep pamiarsa target anjeun atanapi pikeun nangtoskeun kumaha inféksi tangtu ngabales perlakuan khusus.
Aya sababaraha aplikasi praktis, jeung élmuwan data, insinyur, sareng arsiték tiasa ngabantosan anjeun dina nangtukeun tujuan anjeun sareng ngembangkeun solusi ML unik pikeun perusahaan anjeun.
Leave a Reply