Nəzarətsiz Maşın Öyrənmə Alqoritmləri

Mündəricat[Gizlət][Göstər]

Nəzarətsiz Maşın Öyrənməsi nədir?
Nəzarətsiz Maşın Öyrənmə Alqoritmləri+-
Nəzarətsiz öyrənmənin tətbiqi
Nəzarətsiz öyrənmə ilə bağlı problemlər
Nəticə

İstənilən növ korporativ fəaliyyət üçün əsas meyarlardan biri məlumatdan səmərəli istifadə etməkdir. Bəzi məqamlarda yaradılan məlumatların həcmi əsas emal imkanlarını üstələyir.

Məhz burada maşın öyrənmə alqoritmləri işə düşür. Ancaq bunların hər hansı biri baş verməzdən əvvəl məlumat öyrənilməli və şərh edilməlidir. Bir sözlə, nəzarətsiz maşın öyrənməsi bunun üçün istifadə olunur.

Bu yazıda biz nəzarətsiz maşın öyrənməsini, o cümlədən onun alqoritmlərini, istifadə hallarını və daha çoxunu araşdıracağıq.

Nəzarətsiz Maşın Öyrənməsi nədir?

Nəzarətsiz maşın öyrənmə alqoritmləri məlum və ya etiketlənmiş nəticəsi olmayan verilənlər toplusunda nümunələri müəyyən edir. Nəzarət olunur maşın öyrənmə alqoritmləri etiketli çıxışı var.

Bu fərqi bilmək sizə nə üçün nəzarətsiz maşın öyrənmə metodlarının reqressiya və ya təsnifat məsələlərini həll etmək üçün istifadə edilə bilməyəcəyini anlamağa kömək edir, çünki siz çıxış məlumatlarının dəyərinin/cavabının nə ola biləcəyini bilmirsiniz. Dəyəri/cavabını bilmirsinizsə, alqoritmi normal şəkildə öyrədə bilməzsiniz.

Bundan əlavə, nəzarətsiz öyrənmə məlumatların əsas strukturunu müəyyən etmək üçün istifadə edilə bilər. Bu alqoritmlər insanların qarşılıqlı əlaqəsinə ehtiyac olmadan gizli nümunələri və ya məlumat qruplarını aşkar edir.

Məlumatdakı oxşarlıqları və təzadları aşkar etmək qabiliyyəti onu kəşfiyyat xarakterli məlumatların təhlili, çarpaz satış üsulları, istehlakçı seqmentasiyası və şəklin identifikasiyası üçün əla seçim edir.

Aşağıdakı ssenarini nəzərdən keçirin: siz ərzaq mağazasındasınız və əvvəllər heç vaxt görmədiyiniz naməlum meyvəni görürsünüz. Forması, ölçüsü və ya rəngi ilə bağlı müşahidələrinizə əsasən ətrafdakı digər meyvələrdən fərqlənən naməlum meyvəni asanlıqla ayırd edə bilərsiniz.

Nəzarətsiz Maşın Öyrənmə Alqoritmləri

Kümelenme

Klasterləşdirmə, şübhəsiz ki, ən çox istifadə edilən nəzarətsiz öyrənmə yanaşmasıdır. Bu yanaşma əlaqəli məlumat elementlərini təsadüfi yaradılan klasterlərə qoyur.

Öz-özünə ML modeli kateqoriyalaşdırılmamış məlumat strukturunda hər hansı nümunələri, oxşarlıqları və/yaxud fərqləri aşkar edir. Model verilənlərdə istənilən təbii qruplaşmaları və ya sinifləri kəşf edə biləcək.

Kümelenme

Növləri

İstifadə oluna bilən klasterləşdirmənin bir neçə forması var. Əvvəlcə ən vaciblərinə baxaq.

Eksklüziv klasterləşdirmə, bəzən “sərt” qruplaşma kimi tanınan, bir məlumat parçasının yalnız bir klasterə aid olduğu qruplaşma növüdür.
Çox vaxt “yumşaq” klasterləşdirmə kimi tanınan üst-üstə düşən klasterləmə məlumat obyektlərinin müxtəlif dərəcədə birdən çox klasterə aid olmasına imkan verir. Bundan əlavə, ehtimal qruplaşması "yumşaq" klasterləşmə və ya sıxlığın qiymətləndirilməsi problemlərini həll etmək, həmçinin müəyyən klasterlərə aid məlumat nöqtələrinin ehtimalını və ya ehtimalını qiymətləndirmək üçün istifadə edilə bilər.
Qruplaşdırılmış məlumat elementlərinin iyerarxiyasının yaradılması adından da göründüyü kimi iyerarxik klasterləşmənin məqsədidir. Data elementləri klasterlər yaratmaq üçün iyerarxiya əsasında dekonstruksiya edilir və ya birləşdirilir.

İşlərdən istifadə edin:

Anomaliya aşkarlanması:

Klasterləşmədən istifadə edərək verilənlərdəki hər hansı bir kənar göstərici aşkar edilə bilər. Nəqliyyat və logistika şirkətləri, məsələn, logistik maneələri aşkar etmək və ya zədələnmiş mexaniki hissələri açıqlamaq üçün anomaliyaların aşkarlanmasından istifadə edə bilərlər (proqnozlaşdırılan texniki xidmət).

Maliyyə institutları saxta əməliyyatları aşkar etmək və tez cavab vermək üçün texnologiyadan istifadə edərək potensial olaraq çox pula qənaət edə bilərlər. Videomuza baxaraq anormallıqları və saxtakarlığı aşkar etmək haqqında daha çox məlumat əldə edin.

Müştərilərin və bazarların seqmentasiyası:

Klasterləşdirmə alqoritmləri oxşar xüsusiyyətlərə malik insanları qruplaşdırmağa və daha effektiv marketinq və məqsədyönlü təşəbbüslər üçün istehlakçı personalarını yaratmağa kömək edə bilər.

K-O deməkdir

K-vasitələri bölmə və ya seqmentləşdirmə kimi də tanınan klaster üsuludur. O, məlumat nöqtələrini K kimi tanınan əvvəlcədən müəyyən edilmiş sayda klasterlərə bölür.

K-means metodunda K, məlumatlarınızda neçə klasteri müəyyən etmək istədiyinizi kompüterə bildirdiyiniz üçün girişdir. Hər bir məlumat elementi sonradan mərkəz kimi tanınan ən yaxın klaster mərkəzinə təyin edilir (şəkildəki qara nöqtələr).

K deməkdir

Sonuncu məlumat saxlama yerləri kimi xidmət edir. Klasterləşdirmə texnikası çoxluqlar yaxşı müəyyən edilənə qədər dəfələrlə edilə bilər.

Qeyri-səlis K deməkdir

Qeyri-səlis K-vasitələr üst-üstə düşən klasterləşməni həyata keçirmək üçün istifadə olunan K-vasitələr texnikasının genişləndirilməsidir. K-means texnikasından fərqli olaraq, qeyri-səlis K-vasitələr məlumat nöqtələrinin hər birinə müxtəlif dərəcədə yaxın olan bir çox klasterə aid ola biləcəyini göstərir.

Məlumat nöqtələri ilə klasterin mərkəzi arasındakı məsafə yaxınlığı hesablamaq üçün istifadə olunur. Nəticədə, müxtəlif klasterlərin üst-üstə düşdüyü hallar ola bilər.

Gauss Qarışıq Modelləri

Qauss Qarışıq Modelləri (GMM) ehtimal qruplaşmasında istifadə olunan bir üsuldur. Orta və dispersiya naməlum olduğundan, modellər hər biri fərqli bir çoxluğu təmsil edən sabit sayda Qauss paylamalarının olduğunu güman edirlər.

Müəyyən bir məlumat nöqtəsinin hansı klasterə aid olduğunu müəyyən etmək üçün metod mahiyyətcə istifadə olunur.

İyerarxik Klasterləşmə

İerarxik klasterləşdirmə strategiyası fərqli klasterə təyin edilmiş hər bir məlumat nöqtəsi ilə başlaya bilər. Bir-birinə ən yaxın olan iki klaster daha sonra vahid klasterə birləşdirilir. İterativ birləşmə yuxarıda yalnız bir klaster qalana qədər davam edir.

Bu üsul aşağıdan yuxarıya və ya aglomerativ olaraq tanınır. Eyni klasterə bağlanmış bütün məlumat elementləri ilə başlasanız və sonra hər bir məlumat elementi ayrıca klaster kimi təyin olunana qədər bölmələr aparsanız, üsul yuxarıdan aşağıya və ya bölücü iyerarxik klasterləşdirmə kimi tanınır.

Apriori alqoritmi

Bazar səbətinin təhlili apriori alqoritmləri populyarlaşdırdı, nəticədə musiqi platformaları və onlayn mağazalar üçün müxtəlif tövsiyə mühərrikləri yarandı.

Onlar digər məhsulun istehlakına əsaslanaraq bir məhsulun istehlak ehtimalını proqnozlaşdırmaq üçün tez-tez element dəstlərini və ya maddələr qruplarını tapmaq üçün əməliyyat məlumat dəstlərində istifadə olunur.

Məsələn, Spotify-da OneRepublic-in radiosunu “Sayım Ulduzları” ilə ifa etməyə başlasam, bu kanaldakı digər mahnılardan biri, şübhəsiz ki, “Bad Liar” kimi Imagine Dragon mahnısı olacaq.

Bu, mənim əvvəlki dinləmə vərdişlərimə, eləcə də başqalarının dinləmə tərzinə əsaslanır. Apriori üsulları, ilk olaraq verilənlər bazasını keçərək hash ağacından istifadə edərək element dəstlərini hesablayır.

Ölçü azaldılması

Ölçülərin azaldılması məlumat dəstindəki funksiyaların və ya ölçülərin sayını minimuma endirmək üçün strategiyalar toplusundan istifadə edən bir növ nəzarətsiz öyrənmədir. İcazə verin aydınlaşdıraq.

Yaradarkən mümkün qədər çox məlumat daxil etmək cazibədar ola bilər maşın öyrənməsi üçün verilənlər toplusu. Bizi səhv başa düşməyin: bu strategiya yaxşı işləyir, çünki daha çox məlumat adətən daha dəqiq tapıntılar verir.

Fərz edək ki, verilənlər N ölçülü fəzada saxlanılır, hər bir xüsusiyyət fərqli ölçüləri təmsil edir. Çox məlumat varsa, yüzlərlə ölçü ola bilər.

Xüsusiyyətləri təmsil edən sütunlar və verilənlər elementlərini təmsil edən sətirlərlə Excel cədvəllərini nəzərdən keçirin. Ölçülər çox olduqda, ML alqoritmləri zəif çıxış edə bilər və məlumat vizual çətinləşə bilər.

Beləliklə, xüsusiyyətləri və ya ölçüləri məhdudlaşdırmağı və yalnız müvafiq məlumatları çatdırmağı məntiqli edir. Ölçülərin azalması məhz bundan ibarətdir. Bu, verilənlər bazasının bütövlüyünə xələl gətirmədən idarə edilə bilən miqdarda məlumat daxil etməyə imkan verir.

Əsas Komponent Təhlili (PCA)

Əsas komponent təhlili ölçülərin azaldılması yanaşmasıdır. O, nəhəng verilənlər toplusunda funksiyaların sayını minimuma endirmək üçün istifadə olunur, nəticədə dəqiqlikdən ödün vermədən daha çox məlumat sadəliyi əldə edilir.

Məlumat toplusunun sıxılması xüsusiyyət çıxarılması kimi tanınan bir üsulla həyata keçirilir. Bu, orijinal dəstdəki elementlərin yeni, daha kiçik birinə qarışdırıldığını göstərir. Bu yeni xüsusiyyətlər əsas komponentlər kimi tanınır.

Əlbəttə ki, nəzarətsiz öyrənmə proqramlarınızda istifadə edə biləcəyiniz əlavə alqoritmlər var. Yuxarıda sadalananlar ən çox yayılmışdır, buna görə də onlar daha ətraflı müzakirə olunur.

Nəzarətsiz öyrənmənin tətbiqi

Nəzarətsiz öyrənmə üsulları obyektin tanınması kimi vizual qavrayış tapşırıqları üçün istifadə olunur.
Nəzarətsiz maşın öyrənməsi xəstələrə sürətli və etibarlı diaqnoz qoymaq üçün radiologiya və patologiyada istifadə olunan təsvirin identifikasiyası, təsnifatı və seqmentasiyası kimi tibbi görüntüləmə sistemlərinə kritik aspektlər verir.
Nəzarətsiz öyrənmə istehlakçı davranışı ilə bağlı keçmiş məlumatlardan istifadə edərək daha effektiv çarpaz satış strategiyaları yaratmaq üçün istifadə edilə bilən məlumat meyllərini müəyyən etməyə kömək edə bilər. Yoxlama prosesi zamanı bu, onlayn bizneslər tərəfindən müştərilərə düzgün əlavələr təklif etmək üçün istifadə olunur.
Nəzarət olunmayan öyrənmə metodları kənar göstəriciləri tapmaq üçün böyük həcmdə verilənləri süzə bilər. Bu anormallıqlar nasaz avadanlığın, insan səhvinin və ya təhlükəsizlik pozuntularının xəbərdarlığını artıra bilər.

Nəzarətsiz öyrənmə ilə bağlı problemlər

Nəzarətsiz öyrənmə, mühüm fikirlər tapmaq potensialından tutmuş müxtəlif yollarla cəlbedicidir məlumatların bahalı etiketlənməsinin qarşısını almaq üçün məlumat əməliyyatlar. Bununla belə, təlim üçün bu strategiyadan istifadə etməyin bir sıra çatışmazlıqları var maşın öyrənmə modelləri ki, xəbərdar olmalısan. Burada bəzi nümunələr var.

Daxil olan məlumatlarda cavab açarı kimi xidmət edən etiketlər olmadığı üçün nəzarətsiz öyrənmə modellərinin nəticələri daha az dəqiq ola bilər.
Nəzarətsiz öyrənmə tez-tez hesablama mürəkkəbliyini artıra bilən kütləvi məlumat dəstləri ilə işləyir.
Bu yanaşma sorğunun mövzusu üzrə istər daxili, istərsə də xarici mütəxəssislər tərəfindən insanlar tərəfindən nəticələrin təsdiqini tələb edir.
Alqoritmlər bir qədər vaxt aparan təlim mərhələsində hər bir mümkün ssenarini yoxlamalı və hesablamalıdır.

Nəticə

Məlumatların effektiv istifadəsi müəyyən bir bazarda rəqabət üstünlüyünün yaradılmasının açarıdır.

Siz hədəf auditoriyanızın seçimlərini araşdırmaq və ya müəyyən infeksiyanın müəyyən müalicəyə necə cavab verdiyini müəyyən etmək üçün nəzarətsiz maşın öyrənmə alqoritmlərindən istifadə edərək məlumatları seqmentləşdirə bilərsiniz.

Bir neçə praktik tətbiq var və məlumat alimləri, mühəndislər və memarlar hədəflərinizi müəyyənləşdirməkdə və şirkətiniz üçün unikal ML həlləri hazırlamaqda sizə kömək edə bilər.

Nəzarətsiz Maşın Öyrənmə Alqoritmləri

Nəzarətsiz Maşın Öyrənməsi nədir?