Дастур барои шурӯъкунандагон барои Scikit-learn

Мундариҷа[Пинҳон кардан][Намоиш]

Scikit-learn чист?
Барномаҳои китобхонаи Scikit-learn+- ба
Насб кардани Scikit-learn
Вижагиҳо +- ба
тарафдор
Омӯз
хулоса

Агар шумо як барномасози Python бошед ё шумо як асбоби пурқувватеро ҷустуҷӯ кунед, ки барои ҷорӣ кардани омӯзиши мошинсозӣ дар системаи истеҳсолӣ истифода баред, Scikit-learn китобхонаест, ки шумо бояд онро тафтиш кунед.

Scikit-learn хуб ҳуҷҷатгузорӣ шудааст ва истифодааш осон аст, новобаста аз он ки шумо дар омӯзиши мошинсозӣ нав ҳастед, мехоҳед зуд ба кор шурӯъ кунед ё мехоҳед, ки абзори муосиртарини тадқиқоти ML-ро истифода баред.

Он ба шумо имкон медиҳад, ки модели пешгӯии маълумотро танҳо дар чанд сатри код созед ва сипас он моделро барои мувофиқ кардани маълумоти шумо ҳамчун китобхонаи сатҳи баланд истифода мебарад. Он чандир аст ва бо дигарон хуб кор мекунад Китобхонаҳои Python монанди Matplotlib барои диаграмма, NumPy барои векторизатсияи массив ва пандаҳо барои визуализатсияи додаҳо.

Дар ин дастур, шумо ҳама чизро дар бораи он, ки он чӣ гуна аст, чӣ гуна истифода бурдан мумкин аст, дар баробари ҷиҳатҳои мусбӣ ва манфии он мефаҳмед.

кадом аст Scikit-омӯзед?

Scikit-learn (инчунин бо номи sklearn маълум аст) маҷмӯи гуногуни моделҳои оморӣ ва омӯзиши мошинро пешниҳод мекунад. Баръакси аксари модулҳо, sklearn на дар Python таҳия шудааст, на C. Сарфи назар аз он, ки дар Python таҳия шудааст, самаранокии sklearn ба истифодаи NumPy барои алгебраи хаттӣ ва амалҳои массивии баландсифат марбут аст.

Scikit-Learn ҳамчун як қисми лоиҳаи Summer of Code-и Google сохта шудааст ва аз он вақт инҷониб ҳаёти миллионҳо олимони маълумот дар асоси Python-ро дар саросари ҷаҳон соддатар кард. Ин фасли силсила ба муаррифии китобхона ва тамаркуз ба як унсур - табдилдиҳии маҷмӯи додаҳо тамаркуз мекунад, ки қадами калидӣ ва муҳим барои пеш аз таҳияи модели пешгӯӣ мебошанд.

Склерн

Китобхона ба SciPy (Scientific Python) асос ёфтааст, ки бояд пеш аз истифодаи scikit-learn насб карда шавад. Ин стек ҷузъҳои зеринро дар бар мегирад:

NumPy: Бастаи стандартии массиви n-ченакаи Python
SciPy: Ин як бастаи бунёдӣ барои ҳисоббарории илмӣ мебошад
Pandas: Сохторҳои маълумот ва таҳлил
Matplotlib: Ин китобхонаи пурқудрати нақшакашии 2D/3D мебошад
Sympy: математикаи рамзӣ
IPython: Консол беҳтаршудаи интерактивӣ

Барномаҳои китобхонаи Scikit-learn

Scikit-learn як бастаи кушодаи Python бо таҳлили мураккаби додаҳо ва хусусиятҳои истихроҷи маъдан мебошад. Он бо як қатор алгоритмҳои дарунсохташуда меояд, ки ба шумо аз лоиҳаҳои илмии маълумотҳои худ бештар фоида меорад. Китобхонаи Scikit-learn бо роҳҳои зерин истифода мешавад.

1. Регрессия

Таҳлили регрессионӣ як усули оморӣ барои таҳлил ва дарки робитаи байни ду ё зиёда тағирёбандаҳо мебошад. Усуле, ки барои таҳлили регрессия истифода мешавад, барои муайян кардани он, ки кадом унсурҳо мувофиқанд, метавонанд нодида гирифта шаванд ва чӣ гуна онҳо бо ҳам ҳамкорӣ мекунанд. Масалан, усулҳои регрессия метавонанд барои беҳтар фаҳмидани рафтори нархҳои саҳмияҳо истифода шаванд.

Алгоритмҳои регрессия иборатанд аз:

Regression Linear
Регрессияи Ridge
Регрессияи Лассо
Регрессияи дарахти қарор
Ҷангали тасодуфӣ
Дастгирии мошинҳои векторӣ (SVM)

2. Тасниф

Усули таснифкунӣ равиши омӯзиши назоратшаванда мебошад, ки маълумоти омӯзишӣ барои муайян кардани категорияи мушоҳидаҳои навро истифода мебарад. Алгоритм дар Классификация аз як чизи додашуда меомӯзад маьлумот ё мушоњидањо ва баъд мушоњидањои иловагиро ба яке аз синфњо ё гурўњњои зиёд тасниф мекунад. Онҳо метавонанд, масалан, барои тасниф кардани иртиботи почтаи электронӣ ҳамчун спам ё не, истифода шаванд.

Алгоритмҳои гурӯҳбандӣ инҳоро дар бар мегиранд:

Регрессияи логистикӣ
K-Наздиктарин ҳамсояҳо
Дастгирии мошини векторӣ
Дарахти қарор
Ҷангали тасодуфӣ

3. Кластерсозӣ

Алгоритмҳои кластерӣ дар Scikit-learn барои ба таври худкор ҷойгир кардани додаҳо бо хосиятҳои шабеҳ ба маҷмӯаҳо истифода мешаванд. Кластеркунӣ раванди гурӯҳбандӣ кардани маҷмӯи ашёҳо мебошад, то онҳое, ки дар як гурӯҳ ба дигар гурӯҳҳо монанд бошанд. Масалан, маълумотҳои муштариён метавонанд вобаста ба ҷойгиршавии онҳо ҷудо карда шаванд.

Алгоритмҳои кластерӣ инҳоро дар бар мегиранд:

DB-SCAN
К-Воино дорад
Мини-партияи K- Воситаи
Кластеризатсияи спектрӣ

4. Интихоби модел

Алгоритмҳои интихоби модел усулҳои муқоиса, тасдиқ ва интихоби параметрҳо ва моделҳои оптималиро барои истифода дар ташаббусҳои илми маълумот таъмин мекунанд. Бо назардошти маълумот, интихоби модел масъалаи интихоби модели оморӣ аз як гурӯҳи моделҳои номзад мебошад. Дар шароити оддитарин ҷамъоварии маълумотҳои қаблан мавҷудбуда ба назар гирифта мешавад. Аммо, вазифа метавонад инчунин тарҳрезии таҷрибаҳоро дар бар гирад, то маълумоти гирифташуда ба масъалаи интихоби модел мувофиқат кунад.

Модулҳои интихоби модел, ки метавонанд тавассути танзими параметрҳо дақиқиро беҳтар кунанд, инҳоянд:

Тасдиқи байниҳамдигарӣ
Ҷустуҷӯи шабака
Метрҳо

5. Камшавии андоза

Интиқоли додаҳо аз фазои баландандоза ба фазои камҳаҷм, то ки муаррифии камченака баъзе ҷанбаҳои муҳими додаҳои аслиро, ки идеалӣ ба андозаи хоси он наздик аст, нигоҳ дорад, ҳамчун коҳиши андозагӣ маълум аст. Шумораи тағирёбандаҳои тасодуфӣ барои таҳлил ҳангоми кам шудани андозагирӣ кам мешавад. Масалан, маълумоти берунаро барои баланд бардоштани самаранокии визуализатсия баррасӣ кардан мумкин нест.

Алгоритми кам кардани андоза инҳоро дар бар мегирад:

Интихоби хосият
Таҳлили асосии компонент (PCA)

Насб кардани Scikit-learn

Пеш аз истифодаи Scikit-learn бояд NumPy, SciPy, Matplotlib, IPython, Sympy ва Pandas насб карда шаванд. Биёед онҳоро бо истифода аз pip аз консол насб кунем (танҳо барои Windows кор мекунад).

Зеркашӣ кунед

Биёед ҳоло Scikit-learn-ро насб кунем, ки мо китобхонаҳои лозимиро насб кардем.

Насб кардани Sklearn

Вижагиҳо

Scikit-learn, ки баъзан бо номи sklearn маъруф аст, як абзори Python барои татбиқи моделҳои омӯзиши мошинсозӣ ва моделсозии оморӣ мебошад. Мо метавонем онро барои сохтани якчанд моделҳои омӯзиши мошинсозӣ барои регрессия, тасниф ва кластерсозӣ, инчунин воситаҳои оморӣ барои арзёбии ин моделҳо истифода барем. Он инчунин кам кардани андоза, интихоби хусусият, истихроҷи хусусият, равишҳои ансамблӣ ва маҷмӯи додаҳои дарунсохтро дар бар мегирад. Мо ҳар як аз ин сифатҳоро як-як тафтиш хоҳем кард.

1. Воридоти маҷмӯи додаҳо

Scikit-learn як қатор маҷмӯаҳои додаҳои қаблан сохташударо дар бар мегирад, ба монанди маҷмӯаи додаҳои Айрис, маҷмӯаи маълумоти нархҳои хона, маҷмӯаи маълумоти титаникӣ ва ғайра. Бартариҳои асосии ин маҷмӯаҳои додаҳо дар он аст, ки онҳо фаҳмидан осонанд ва метавонанд барои фавран таҳияи моделҳои ML истифода шаванд. Ин маҷмӯаҳои додаҳо барои навкорон мувофиқанд. Ба ҳамин монанд, шумо метавонед sklearn-ро барои ворид кардани маҷмӯи додаҳои иловагӣ истифода баред. Ба ҳамин монанд, шумо метавонед онро барои ворид кардани маҷмӯи додаҳои иловагӣ истифода баред.

Dataset

2. Тақсим кардани маҷмӯаи маълумот барои омӯзиш ва санҷиш

Sklearn қобилияти тақсим кардани маҷмӯи маълумотро ба сегментҳои омӯзишӣ ва санҷишӣ дар бар мегирад. Тақсим кардани маҷмӯи додаҳо барои арзёбии беғаразонаи иҷрои пешгӯиҳо зарур аст. Мо метавонем муайян кунем, ки чӣ қадар маълумоти мо бояд ба маҷмӯи маълумотҳои қатора ва санҷиш дохил карда шаванд. Мо маҷмӯи маълумотро бо истифода аз тақсимоти санҷиши қатор тақсим кардем, ки маҷмӯи қатора 80% маълумотро дар бар мегирад ва маҷмӯи санҷиш 20%. Маҷмӯи маълумот метавонад ба таври зерин тақсим карда шавад:

Тақсим кардан

3. Регрессияи хатӣ

Регрессияи хатӣ як усули омӯзиши мошинсозӣ дар асоси назорат аст. Он кори регрессияро иҷро мекунад. Дар асоси тағирёбандаҳои мустақил, регрессия арзиши пешгӯии ҳадафро модел мекунад. Он асосан барои муайян кардани робитаи байни тағирёбандаҳо ва пешгӯӣ истифода мешавад. Моделҳои гуногуни регрессия аз рӯи намуди пайвастшавӣ, ки онҳо байни тағирёбандаҳои вобаста ва мустақил арзёбӣ мекунанд, инчунин шумораи тағирёбандаҳои мустақили истифодашуда фарқ мекунанд. Мо метавонем танҳо модели регрессияи хатиро бо истифода аз sklearn ба таври зерин эҷод кунем:

Regression Linear

4. Регресси логистика

Равиши маъмули гурӯҳбандӣ регрессияи логистикӣ мебошад. Он дар як оила бо регрессияи полиномӣ ва хатӣ ҷойгир аст ва ба оилаи таснифгари хатӣ тааллуқ дорад. Бозёфтҳои регрессияи логистикиро фаҳмидан осон ва ҳисоб кардан зуд аст. Ба монанди регрессияи хатӣ, регрессияи логистикӣ як усули регрессияи назоратшаванда мебошад. Тағйирёбандаи баромад категориявӣ аст, бинобар ин ягона фарқият ҳамин аст. Он метавонад муайян кунад, ки оё бемор бемории дил дорад ё не.

Масъалаҳои гуногуни таснифот, ба монанди ошкор кардани спам, метавонанд бо истифода аз регрессияи логистикӣ ҳал карда шаванд. Пешгӯии диабети қанд, муайян кардани он, ки истеъмолкунанда маҳсулоти мушаххасро мехарад ё ба рақиб мегузарад, муайян мекунад, ки оё корбар истиноди мушаххаси маркетингро клик мекунад ва сенарияҳои дигар танҳо чанд мисоланд.

Регрессияи логистикӣ

5. Дарахти қарорҳо

Техникаи пурқувват ва васеъ истифодашавандаи тасниф ва пешгӯӣ дарахти қарорҳо мебошад. Дарахти қарор сохтори дарахтест, ки ба диаграмма монанд аст, бо ҳар як гиреҳи дохилӣ санҷишро дар атрибут, ҳар як шоха хулосаи санҷишро ифода мекунад ва ҳар гиреҳи барг (гиреҳи терминал) дорои тамғаи синф мебошад.

Вақте ки тағирёбандаҳои вобаста бо тағирёбандаҳои мустақил муносибати хатӣ надоранд, яъне вақте ки регрессияи хатӣ бозёфтҳои дуруст намедиҳад, дарахтони қарорҳо фоидаоваранд. Объекти DecisionTreeRegression() метавонад ба ҳамин тарз барои истифодаи дарахти қарор барои регрессия истифода шавад.

Дарахти қарор

6. Ҷангали тасодуфӣ

Ҷангали тасодуфӣ а омӯзиши машқҳо равиши ҳалли масъалаҳои регрессия ва тасниф. Он омӯзиши ансамблиро истифода мебарад, ки як усулест, ки таснифоти сершуморро барои ҳалли мушкилоти мураккаб муттаҳид мекунад. Усули тасодуфии ҷангал аз шумораи зиёди дарахтони қарор иборат аст. Он метавонад барои гурӯҳбандӣ кардани дархостҳои қарз, ошкор кардани рафтори қаллобӣ ва пешгӯии хуруҷи беморӣ истифода шавад.

Ҷангали тасодуфӣ

7. Матритсаи нофаҳмиҳо

Матритсаи нофаҳмиҳо ҷадвалест, ки барои тавсифи иҷрои модели таснифот истифода мешавад. Барои баррасии матритсаи нофаҳмиҳо чаҳор калимаи зерин истифода мешаванд:

Муносибати ҳақиқӣ: Ин маънои онро дорад, ки модел натиҷаи мусоидро пешбинӣ кардааст ва он дуруст буд.
Манфии ҳақиқӣ: Ин маънои онро дорад, ки модел натиҷаи бадро пешгӯӣ кардааст ва он дуруст буд.
Манфии бардурӯғ: Ин маънои онро дорад, ки модел натиҷаи мусоидро интизор буд, аммо он воқеан манфӣ буд.
Манфии бардурӯғ: Ин маънои онро дорад, ки модел натиҷаи манфиро интизор буд, дар ҳоле ки натиҷа воқеан мусбат буд.

Сурати матритсаи ошуфтагӣ

Иҷрои матритсаи нофаҳмиҳо:

Метрикҳои нофаҳмиҳо

тарафдор

Истифодаи он оддӣ аст.
Бастаи Scikit-learn бениҳоят мутобиқшаванда ва муфид буда, ба ҳадафҳои воқеии ҷаҳонӣ, аз қабили пешгӯии рафтори истеъмолкунандагон, таҳияи нейроимидж ва ғайра хизмат мекунад.
Истифодабарандагоне, ки мехоҳанд алгоритмҳоро бо платформаҳои худ пайваст кунанд, дар вебсайти Scikit-learn ҳуҷҷатҳои муфассали API-ро пайдо мекунанд.
Муаллифони сершумор, ҳамкорон ва як ҷомеаи бузурги онлайн дар саросари ҷаҳон дастгирӣ мекунанд ва Scikit-learn-ро навсозӣ мекунанд.

Омӯз

Ин варианти беҳтарин барои омӯзиши амиқ нест.

хулоса

Scikit-learn як бастаи муҳимест барои ҳар як олими маълумот, ки дарки қавӣ ва каме таҷриба дошта бошад. Ин дастур бояд ба шумо дар коркарди додаҳо бо истифода аз sklearn кӯмак расонад. Имкониятҳои зиёди Scikit-learn мавҷуданд, ки шумо ҳангоми пешрафт тавассути саёҳати илмии худ кашф хоҳед кард. Фикрҳои худро дар шарҳҳо мубодила кунед.

Дастур барои шурӯъкунандагон барои Scikit-learn

кадом аст Scikit-омӯзед?