Мазмуну[Жашыруу][Көрсөтүү]
Корпоративдик иштин ар кандай түрү үчүн негизги критерийлердин бири маалыматты натыйжалуу пайдалануу болуп саналат. Кээ бир учурда, түзүлгөн маалыматтардын көлөмү негизги иштетүү кубаттуулугунан ашып кетет.
Мына ушул жерде машина үйрөнүү алгоритмдери ишке кирет. Бирок, мунун кайсынысы болбосун, маалымат изилденип, чечмелениши керек. Кыскача айтканда, бул көзөмөлсүз машина үйрөнүү үчүн колдонулат.
Бул макалада биз көзөмөлсүз машина үйрөнүүнү, анын ичинде анын алгоритмдерин, колдонуу учурларын жана башка көптөгөн нерселерди карап чыгабыз.
Көзөмөлсүз машина үйрөнүү деген эмне?
Көзөмөлсүз машина үйрөнүү алгоритмдери дайындар топтомундагы белгилүү же белгиленген натыйжасы жок үлгүлөрдү аныктайт. Көзөмөлдөнгөн машинаны үйрөнүү алгоритмдери белгиленген чыгаруу бар.
Бул айырмачылыкты билүү сизге эмне үчүн көзөмөлдөнбөгөн машинаны үйрөнүү ыкмаларын регрессия же классификация маселелерин чечүү үчүн колдонууга болбостугун түшүнүүгө жардам берет, анткени сиз чыгаруу маалыматтарынын мааниси/жооп кандай болорун билбейсиз. Наркы/жоопту билбесеңиз, алгоритмди кадимкидей үйрөтө албайсыз.
Мындан тышкары, көзөмөлсүз окутуу маалыматтардын фундаменталдык структурасын аныктоо үчүн колдонулушу мүмкүн. Бул алгоритмдер адамдардын өз ара аракеттенүүсүн талап кылбастан, жашыруун калыптарды же маалымат топторун аныктайт.
Анын маалыматтагы окшоштуктарды жана карама-каршылыктарды аныктоо мүмкүнчүлүгү аны чалгындоо маалыматтарды талдоо, кайчылаш сатуу ыкмалары, керектөөчүлөрдү сегментациялоо жана сүрөттү аныктоо үчүн эң сонун тандоо кылат.
Төмөнкү сценарийди карап көрөлү: сиз азык-түлүк дүкөнүндө болуп, мурда эч качан көрбөгөн жемиштерди көрүп жатасыз. Сиз анын формасына, өлчөмүнө же түсүнө байкоолоруңуздун негизинде башка жемиштерден айырмаланган белгисиз жемиштерди оңой эле айырмалай аласыз.
Көзөмөлсүз машина үйрөнүү алгоритмдери
кластерлөө
Кластерлөө, албетте, эң кеңири колдонулган көзөмөлсүз окутуу ыкмасы. Бул ыкма байланыштуу маалымат элементтерин кокус түзүлгөн кластерлерге салат.
Өзүнчө, ML модели категорияланбаган маалымат структурасындагы ар кандай үлгүлөрдү, окшоштуктарды жана/же айырмачылыктарды ачат. Модель маалыматтардагы табигый топторду же класстарды таба алат.
түрлөрү
Колдонулушу мүмкүн болгон кластерлердин бир нече формалары бар. Адегенде эң маанилүүлөрүн карап көрөлү.
- Эксклюзивдүү кластерлөө, кээде "катуу" кластерлөө деп аталат, бул бир гана маалымат бир кластерге таандык болгон топташтыруунун бир түрү.
- Көбүнчө "жумшак" кластерлөө катары белгилүү болгон кабатталган кластерлөө маалымат объекттерине ар кандай даражада бирден ашык кластерге таандык болууга мүмкүндүк берет. Мындан тышкары, ыктымалдык кластерлөө "жумшак" кластердик же тыгыздыкты баалоо көйгөйлөрүн чечүү үчүн, ошондой эле белгилүү бир кластерлерге тиешелүү маалымат чекиттеринин ыктымалдыгын же ыктымалдыгын баалоо үчүн колдонулушу мүмкүн.
- Топтолгон маалымат элементтеринин иерархиясын түзүү, аты айтып тургандай, иерархиялык кластерлөөнүн максаты болуп саналат. Кластерлерди түзүү үчүн маалымат элементтери деконструкцияланат же иерархиянын негизинде бириктирилет.
Колдонуу учурлары:
- Аномалияны аныктоо:
Кластерлөөнүн жардамы менен маалыматтардагы четтөөлөрдүн каалаган түрүн аныктоого болот. Мисалы, транспорт жана логистикалык компаниялар аномалияны аныктоону логистикалык тоскоолдуктарды табуу же бузулган механикалык бөлүктөрүн (болжолдуу тейлөө) ачуу үчүн колдоно алышат.
Финансы институттары алдамчылык транзакцияларды аныктоо жана тез жооп берүү үчүн технологияны колдонушу мүмкүн, бул көп акчаны үнөмдөй алат. Видеобузду көрүү менен аномалияларды жана алдамчылыкты аныктоо тууралуу көбүрөөк билиңиз.
- Кардарларды жана рынокторду сегменттөө:
Кластердик алгоритмдер окшош мүнөздөмөлөргө ээ адамдарды топтоштурууга жана натыйжалуу маркетинг жана максаттуу демилгелер үчүн керектөөчүлөрдүн инсандарын түзүүгө жардам берет.
K- билдирет
K-медициналык - бул бөлүү же сегменттөө катары белгилүү болгон кластердик ыкма. Ал маалымат чекиттерин К деп аталган кластерлердин алдын ала аныкталган санына бөлөт.
K-медициналык методдо, K бул киргизүү, анткени сиз компьютерге маалыматыңызда канча кластерди аныктагыңыз келгенин айтасыз. Ар бир маалымат пункту кийинчерээк центроид (сүрөттөгү кара чекиттер) катары белгилүү болгон эң жакын кластердик борборго дайындалат.
Акыркысы маалыматтарды сактоо мейкиндиги катары кызмат кылат. Кластердик ыкманы кластерлер так аныкталганга чейин көп жолу жасоого болот.
Fuzzy K-мааниси
Fuzzy K-means - бул бири-бирин кайталаган кластерлөө үчүн колдонулган K-меанс техникасынын кеңейтилиши. K-меанс техникасынан айырмаланып, бүдөмүк K-маалымат чекиттери ар бирине ар кандай даражада жакын жайгашкан көптөгөн кластерлерге таандык болушу мүмкүн экенин көрсөтүп турат.
Маалымат чекиттери менен кластердин центроидинин ортосундагы аралык жакындыкты эсептөө үчүн колдонулат. Натыйжада, ар кандай кластерлер бири-бирине дал келген учурлар болушу мүмкүн.
Гаусс аралашмасынын моделдери
Гаусс аралашмасынын моделдери (GMMs) - ыктымалдык кластерлөөдө колдонулган ыкма. Орточо жана дисперсия белгисиз болгондуктан, моделдер Гаусс бөлүштүрүүнүн белгиленген саны бар деп болжолдойт, алардын ар бири өзүнчө бир кластерди билдирет.
Белгилүү бир маалымат пункту кайсы кластерге таандык экенин аныктоо үчүн, метод негизинен колдонулат.
Иерархиялык кластерлөө
Иерархиялык кластердик стратегия башка кластерге дайындалган ар бир маалымат чекити менен башталышы мүмкүн. Бири-бирине эң жакын болгон эки кластер андан кийин бир кластерге бириктирилет. Итеративдик бириктирүү жогоруда бир гана кластер калганга чейин уланат.
Бул ыкма ылдыйдан өйдө же агломеративдик деп аталат. Эгер сиз бир эле кластерге байланган бардык маалымат элементтери менен баштасаңыз жана андан кийин ар бир маалымат элементи өзүнчө кластер катары дайындалмайынча бөлүүлөрдү жүргүзсөңүз, ыкма жогорудан ылдыйга же бөлүүчү иерархиялык кластерлөө катары белгилүү.
Априори алгоритми
Рынок корзинасын талдоо априори алгоритмдерин популярдуу кылып, натыйжада музыкалык платформалар жана интернет-дүкөндөр үчүн ар кандай сунуш кыймылдаткычтары пайда болду.
Алар транзакциялык берилиштер топтомдорунда башка продуктунун керектөөнүн негизинде бир өнүмдү керектөө ыктымалдыгын алдын ала билүү үчүн тез-тез буюмдардын топтомун же элементтердин топторун табуу үчүн колдонулат.
Мисалы, мен Spotifyда OneRepublic радиосун "Жылдыздарды эсептөө" менен ойной баштасам, бул каналдагы башка ырлардын бири "Жаман жалганчы" сыяктуу Imagine Dragon ыры болот.
Бул менин мурунку угуу адаттарыма, ошондой эле башкалардын угуу үлгүлөрүнө негизделген. Априори ыкмалары хэш дарагынын жардамы менен элементтердин топтомун санайт, биринчи кезекте берилиштер топтомун аралайт.
Өлчөмдүүлүктү азайтуу
Өлчөмдүүлүктү азайтуу – бул маалымат топтомундагы функциялардын же өлчөмдөрдүн санын азайтуу үчүн стратегиялардын жыйындысын колдонгон көзөмөлсүз окутуунун бир түрү. тактоого уруксат этиниздер.
Бул сиздин түзүүдө мүмкүн болушунча көбүрөөк маалыматтарды киргизүү азгырылышы мүмкүн машина үйрөнүү үчүн маалымат топтому. Бизди жаңылыштырбаңыз: бул стратегия жакшы иштейт, анткени көбүрөөк маалымат, адатта, тагыраак жыйынтыктарды берет.
Маалыматтар N-өлчөмдүү мейкиндикте сакталат деп ойлойлу, ар бир өзгөчөлүк башка өлчөмдү билдирет. Маалыматтар көп болсо, жүздөгөн өлчөмдөр болушу мүмкүн.
Excel электрондук жадыбалдарын карап көрөлү. Өтө көп өлчөмдөр болгондо, ML алгоритмдери начар иштеши мүмкүн маалыматтарды визуалдаштыруу кыйын болуп калышы мүмкүн.
Ошентип, бул мүнөздөмөлөрдү же өлчөмдөрдү чектөө жана жөн гана тиешелүү маалыматты берүү логикалык кылат. Өлчөмдүүлүктү азайтуу - бул. Бул берилиштердин бүтүндүгүн бузбастан башкарылуучу сандагы маалыматтарды киргизүүгө мүмкүндүк берет.
Негизги компоненттерди талдоо (PCA)
Негизги компоненттик анализ өлчөмдүүлүктү азайтуу ыкмасы болуп саналат. Ал чоң маалымат топтомдорундагы функциялардын санын азайтуу үчүн колдонулат, натыйжада тактыкты жоготпостон, маалымат жөнөкөйлөштүрүлөт.
Берилиштер топтомун кысуу өзгөчөлүктөрдү чыгаруу деп аталган ыкма менен ишке ашат. Бул баштапкы топтомдун элементтери жаңы, кичинесине аралашканын көрсөтөт. Бул жаңы сапаттар негизги компоненттери катары белгилүү.
Албетте, көзөмөлсүз окуу колдонмолоруңузда колдоно турган кошумча алгоритмдер бар. Жогоруда саналып өткөндөр эң кеңири таралган, ошондуктан алар кененирээк талкууланат.
Көзөмөлсүз окутууну колдонуу
- Көзөмөлсүз окутуу ыкмалары объектти таануу сыяктуу визуалдык кабылдоо милдеттери үчүн колдонулат.
- Көзөмөлсүз машина үйрөнүү бейтаптарды тез жана ишенимдүү диагностикалоо үчүн радиологияда жана патологияда колдонулган сүрөттөрдү идентификациялоо, классификациялоо жана сегментациялоо сыяктуу медициналык сүрөттөө системаларына критикалык аспектилерди берет.
- Көзөмөлсүз окутуу керектөөчүлөрдүн жүрүм-туруму боюнча мурунку маалыматтарды колдонуу менен натыйжалуу кайчылаш сатуу стратегияларын түзүү үчүн колдонула турган маалымат тенденцияларын аныктоого жардам берет. Текшерүү процессинде бул онлайн бизнес тарабынан кардарларга туура кошумчаларды сунуштоо үчүн колдонулат.
- Көзөмөлгө алынбаган окутуу ыкмалары өтө чоң көлөмдөгү маалыматтарды сүзүп өтүшү мүмкүн. Бул аномалиялар иштебей жаткан жабдык, адам катасы же коопсуздуктун бузулушу тууралуу эскертүүнү күчөтүшү мүмкүн.
Көзөмөлсүз окутуу маселелери
Көзөмөлсүз окутуу ар кандай жолдор менен кызыктырат, маанилүү түшүнүктөрдү табуу потенциалынан тарта маалыматтар кымбат баалуу маркировкалоодон качуу үчүн операциялар. Бирок, бул стратегияны окутуу үчүн колдонуунун бир нече кемчиликтери бар машина менен окутуунун моделдери сиз билишиңиз керек. Бул жерде кээ бир мисалдар келтирилген.
- Киргизилген маалыматтарда жооп ачкычтары катары кызмат кылган энбелгилер жок болгондуктан, көзөмөлсүз окутуу моделдеринин натыйжалары так эмес болушу мүмкүн.
- Көзөмөлсүз окутуу көбүнчө чоң маалымат топтомдору менен иштейт, бул эсептөө татаалдыгын жогорулатат.
- Бул ыкма адамдардын, же ички же тышкы адистердин иликтөөнүн предмети боюнча натыйжасын ырастоону талап кылат.
- Алгоритмдер бир аз убакытты талап кылган окутуу баскычында мүмкүн болгон ар бир сценарийди изилдеп, эсептеп чыгышы керек.
жыйынтыктоо
Натыйжалуу маалыматтарды пайдалануу белгилүү бир рынокто атаандаштыкка жөндөмдүүлүгүн түзүү үчүн ачкычы болуп саналат.
Сиз максаттуу аудиторияңыздын каалоолорун текшерүү үчүн же белгилүү бир инфекция белгилүү бир дарылоого кандай жооп берерин аныктоо үчүн көзөмөлсүз машина үйрөнүү алгоритмдерин колдонуп, маалыматтарды бөлсөңүз болот.
бир нече практикалык колдонмолор бар, жана маалымат илимпоздору, инженерлер жана архитекторлор максаттарыңызды аныктоодо жана компанияңыз үчүн уникалдуу ML чечимдерин иштеп чыгууда жардам бере алышат.
Таштап Жооп