Мазмуну[Жашыруу][Көрсөтүү]
- 1. Титаник
- 2. Ирландиялык гүлдөрдүн классификациясы
- 3. Бостондогу үйдүн баасын болжолдоо
- 4. Шараптын сапатын текшерүү
- 5. Фондулук рынокту болжолдоо
- 6. Кино сунушу
- 7. Жүктөө жарамдуулугун болжолдоо
- 8. Twitter маалыматтарын колдонуу менен сезимдерди талдоо
- 9. Келечектеги сатууларды болжолдоо
- 10. Фейк жаңылыктарды аныктоо
- 11. Купондорду сатып алууну болжолдоо
- 12. Кардарлардын бузулушун болжолдоо
- 13. Wallmart сатууну болжолдоо
- 14. Uber маалыматтарын талдоо
- 15. Ковид-19 анализи
- жыйынтыктоо
Машина үйрөнүү - бул жогорку деңгээлде берилген белгилүү бир жумушта акырындык менен өркүндөтүү үчүн компьютердик программаны же алгоритмди кантип үйрөтүүнү жөнөкөй изилдөө. Сүрөттөрдү идентификациялоо, алдамчылыкты аныктоо, рекомендациялоо системалары жана башка машина үйрөнүү тиркемелери популярдуу болуп чыкты.
ML жумуштары адамдын жумушун жөнөкөй жана натыйжалуу кылып, убакытты үнөмдөйт жана жогорку сапаттагы натыйжаны камсыздайт. Ал тургай, дүйнөдөгү эң популярдуу издөө системасы Google колдонот машина үйрөнүү.
Колдонуучунун суроосун талдоодон жана натыйжалардын негизинде жыйынтыкты өзгөртүүдөн баштап, суроого байланыштуу тренддеги темаларды жана жарнамаларды көрсөтүүгө чейин, ар кандай варианттар бар.
Кабылдоочу жана өзүн өзү оңдоочу технология келечекте алыс эмес.
Баштоонун эң чоң жолдорунун бири - бул практикалык иш жана долбоорду иштеп чыгуу. Ошондуктан, биз сизди баштоо үчүн жаңы баштагандар үчүн 15 мыкты машина үйрөнүү долбоорлорунун тизмесин түздүк.
1. Титаник
Бул көбүнчө машина үйрөнүү жөнүндө көбүрөөк билгиси келгендер үчүн эң чоң жана эң жагымдуу милдеттердин бири болуп эсептелет. Титаник чакырыгы - бул Kaggle маалымат илим платформасы менен таанышуунун жакшы жолу катары кызмат кылган популярдуу машина үйрөнүү долбоору. Титаниктин маалымат топтому кырсыкка учураган кеменин чөгүп кетишинен алынган чыныгы маалыматтардан турат.
Анда адамдын жашы, социалдык-экономикалык абалы, жынысы, кабина номери, учуп кетүү порту жана эң негизгиси аман калганы сыяктуу маалыматтар камтылган!
K-Nearest Neighbor ыкмасы жана чечим дарагынын классификатору бул долбоор үчүн эң жакшы натыйжаларды берүү үчүн аныкталган. Эгерде сиз дем алыш күндөрүңүздү жакшыртуу үчүн тез чакырууну издеп жатсаңыз Machine Learning жөндөмдөрү, Kaggleдеги бул сиз үчүн.
2. Ирландиялык гүлдөрдүн классификациясы
Жаңы баштагандар ирис гүлүн категориялаштыруу долбоорун жакшы көрүшөт жана эгер сиз машина үйрөнүү үчүн жаңы болсоңуз, бул эң сонун жер. Чапчалардын жана гүл жалбырактарынын узундугу ирис гүлүн башка түрлөрдөн айырмалап турат. Бул долбоордун максаты гүлдөрдү үч түргө бөлүү: Virginia, setosa жана Versicolor.
Классификациялоо көнүгүүлөрү үчүн долбоор окуучуларга сандык баалуулуктар жана маалыматтар менен иштөөнүн негиздерин үйрөнүүгө жардам берген Iris гүлүнүн маалымат топтомун колдонот. Iris гүл маалымат топтому масштабдуу талап кылбастан эстутумда сактала турган кичинекей.
3. Бостондогу үйдүн баасын болжолдоо
Дагы бир белгилүү машина үйрөнүү жаңы баштагандар үчүн маалымат топтому Boston Housing маалыматтары болуп саналат. Анын максаты - Бостондун ар кандай райондорундагы үй баалуулуктарын болжолдоо. Ал жашы, мүлк салыгынын ставкасы, кылмыштуулуктун деңгээли, ал тургай жумуш борборлоруна жакындыгы сыяктуу маанилүү статистиканы камтыйт, алардын баары турак жайдын баасына таасир этиши мүмкүн.
Берилиштер топтому жөнөкөй жана кичинекей болгондуктан, жаңы баштагандар үчүн эксперимент жүргүзүү оңой. Бостондогу мүлктүн баасына кандай факторлор таасир этээрин билүү үчүн регрессиялык ыкмалар ар кандай параметрлер боюнча көп колдонулат. Бул регрессия ыкмаларын практикалоо жана алардын канчалык жакшы иштешин баалоо үчүн эң сонун жер.
4. Шараптын сапатын текшерүү
Шарап көп жылдык ачытууну талап кылган адаттан тыш алкоголдук суусундук. Натыйжада, антикалык бөтөлкө шарап кымбат жана сапаттуу шарап болуп саналат. Шараптын идеалдуу бөтөлкөсүн тандоо шараптын даамын татуу боюнча көп жылдык билимди талап кылат жана бул бир сокку же сагынуу процесси болушу мүмкүн.
Шараптын сапатын текшерүү долбоору шараптарды физикалык-химиялык тесттердин жардамы менен баалайт, мисалы, спирттин деңгээли, белгиленген кислоталык, тыгыздык, рН жана башка факторлор. Долбоор ошондой эле шараптын сапат критерийлерин жана көлөмүн аныктайт. Натыйжада, шарап сатып алуу жел болуп калат.
5. Биржа болжолдоо
Бул демилге сиз каржы тармагында иштейсизби же жокпу кызыктырат. Фондулук рыноктун маалыматтары окумуштуулар, ишканалар, ал тургай экинчи кирешенин булагы катары кеңири изилденет. Маалымат таануучунун убакыт серияларынын маалыматтарын изилдөө жана изилдөө жөндөмү да абдан маанилүү. Биржадан алынган маалыматтар баштоо үчүн сонун жер.
Аракеттин маңызы – акциянын келечектеги наркын болжолдоо. Бул учурдагы рыноктун көрсөткүчтөрүнө, ошондой эле мурунку жылдардагы статистикага негизделген. Kaggle 50-жылдан бери NIFTY-2000 индекси боюнча маалыматтарды чогултуп келет жана учурда ал жума сайын жаңыланып турат. 1-жылдын 2000-январынан бери ал 50дөн ашык уюмдардын акцияларынын баасын камтыйт.
6. Кино сунушу
Жакшы кино көргөндөн кийин сенде ушундай сезим пайда болгонуна ишенем. Ушул сыяктуу тасмаларды көрүү менен сезимдериңизди титиретүүгө түрткү болдуңуз беле?
Netflix сыяктуу OTT кызматтары алардын сунуштоо системаларын кыйла жакшыртканын билебиз. Машина үйрөнүү студенти катары сиз мындай алгоритмдер кардарларды алардын артыкчылыктары жана сын-пикирлеринин негизинде кантип максаттуу экенин түшүнүшүңүз керек.
Kaggle боюнча IMDB маалыматтар топтому, сыягы, сунуш моделдерин тасманын аталышы, кардарлардын рейтинги, жанр жана башка факторлордун негизинде тыянак чыгарууга мүмкүндүк берген эң толук маалыматтардын бири. Бул ошондой эле Мазмунга негизделген чыпкалоо жана Функция инженериясы жөнүндө билүү үчүн эң сонун ыкма.
7. Жүктөө жарамдуулугун божомолдоо
Дүйнө кредиттердин айланасында. Банктардын негизги киреше булагы кредиттердин пайыздарынан алынат. Демек, алар алардын негизги бизнеси болуп саналат.
Жеке адамдар же жеке адамдардын топтору келечекте анын наркынын жогорулашын көрүү үмүтү менен фирмага акча салуу менен гана экономиканы кеңейте алышат. Кээде ушундай мүнөздөгү тобокелчиликке баруу, ал тургай кээ бир дүйнөлүк ырахаттарга катышуу үчүн насыя издөө маанилүү.
Насыя кабыл алынганга чейин, банктар, адатта, бир кыйла катуу процесске ээ болушат. Насыялар көптөгөн адамдардын жашоосунун маанилүү аспектиси болгондуктан, кимдир бирөө кайрылган кредитке жарамдуулугун алдын ала айтуу абдан пайдалуу болуп, насыяны кабыл алуу же баш тартуудан тышкары жакшыраак пландаштырууга мүмкүндүк берет.
8. Twitter маалыматтарын колдонуу менен сезимдерди талдоо
Рахмат коомдук медиа тармактар Twitter, Facebook жана Reddit сыяктуу, ой-пикирлерди жана тенденцияларды экстраполяциялоо кыйла оңой болуп калды. Бул маалымат окуялар, адамдар, спорт жана башка темалар боюнча пикирлерди жок кылуу үчүн колдонулат. Пикир тоо-кен казып алуу менен байланышкан машина үйрөнүү демилгелери саясий кампанияларды жана Amazon продукт баалоо, анын ичинде ар кандай орнотуулар, колдонулуп жатат.
Бул долбоор сиздин портфолиоңузда укмуштуудай көрүнөт! Эмоцияларды аныктоо жана аспектиге негизделген талдоо үчүн колдоо вектордук машиналары, регрессия жана классификация алгоритмдери сыяктуу ыкмалар кеңири колдонулушу мүмкүн (фактыларды жана пикирлерди табуу).
9. Келечектеги сатууларды болжолдоо
Чоң B2C ишканалары жана соодагерлери өздөрүнүн инвентарындагы ар бир продукт канчага саларын билгиси келет. Сатууларды болжолдоо бизнес ээлерине кайсы товарларга суроо-талап жогору экенин аныктоого жардам берет. Сатууларды так болжолдоо ысырапкорчулукту олуттуу кыскартат, ошол эле учурда келечектеги бюджеттерге кошумча таасирин аныктайт.
Walmart, IKEA, Big Bazaar жана Big Bazaar сыяктуу чекене сатуучулар продукцияга суроо-талапты баалоо үчүн сатууну болжолдоону колдонушат. Мындай ML долбоорлорун куруу үчүн чийки маалыматтарды тазалоонун ар кандай ыкмалары менен тааныш болушуңуз керек. Ошондой эле, регрессиялык анализди, өзгөчө жөнөкөй сызыктуу регрессияны жакшы түшүнүү талап кылынат.
Мындай тапшырмалар үчүн Dora, Scrubadub, Pandas, NumPy жана башкалар сыяктуу китепканаларды колдонушуңуз керек болот.
10. Жасалма жаңылыктарды аныктоо
Бул мектеп окуучуларына багытталган дагы бир заманбап машина үйрөнүү аракети. Фейк жаңылыктар бардыгыбызга белгилүү болгондой жайылып баратат. Социалдык тармактарда жеке адамдарды байланыштыруудан баштап, күнүмдүк жаңылыктарды окууга чейин бардыгы жеткиликтүү.
Натыйжада, жалган кабарды аныктоо бүгүнкү күндө барган сайын кыйын болуп калды. Facebook жана Twitter сыяктуу көптөгөн чоң социалдык медиа тармактарында билдирүүлөрдөгү жана каналдардагы жалган жаңылыктарды аныктоо үчүн алгоритмдер бар.
Жалган кабарды аныктоо үчүн, ML долбоорунун бул түрү бир нече NLP ыкмаларын жана классификация алгоритмдерин (PassiveAggressiveClassifier же Naive Bayes классификатору) кылдат түшүнүшү керек.
11. Купондорду сатып алуу болжолдоо
Кардарлар 2020-жылы коронавирус планетага чабуул койгондо онлайн сатып алууну көбүрөөк ойлонушууда. Натыйжада, соода мекемелери бизнесин онлайн режимине өткөрүүгө аргасыз болушту.
Кардарлар, тескерисинче, дүкөндөрдө болгон сыяктуу, дагы эле сонун сунуштарды издеп жатышат жана супер үнөмдөөчү купондорду көбүрөөк издеп жатышат. Мындай кардарлар үчүн купондорду түзүүгө арналган веб-сайттар да бар. Сиз бул долбоор менен маалыматтарды визуализациялоо үчүн штрих диаграммаларды, тегерек диаграммаларды жана гистограммаларды чыгаруу жана инженердик функцияларды машиналык үйрөнүүдө маалыматтарды казып алуу жөнүндө биле аласыз.
Болжолдоолорду түзүү үчүн, сиз ошондой эле NA баалуулуктарын жана өзгөрмөлөрдүн косинус окшоштугун башкаруу үчүн маалыматтарды импутациялоо ыкмаларын карай аласыз.
12. Кардардын кыйроосун болжолдоо
Керектөөчүлөр компаниянын эң маанилүү активи болуп саналат жана аларды сактоо кирешени көбөйтүүгө жана алар менен узак мөөнөттүү маанилүү байланыштарды түзүүгө багытталган ар кандай бизнес үчүн өтө маанилүү.
Мындан тышкары, жаңы кардарды алуу баасы учурдагы кардарларды колдоо наркынан беш эсе жогору. Кардарлар же абоненттер кызмат же компания менен иш жүргүзүүнү токтото турган белгилүү бизнес көйгөйү.
Алар мындан ары акы төлөгөн кардар болбойт. Кардар компания менен акыркы жолу иштешкенден бери белгилүү бир убакыт өтсө, кардар иштен кетти деп эсептелет. Кардар иштебей калабы же жокпу аныктоо, ошондой эле кардарларды кармап калууга багытталган тиешелүү маалыматты ыкчам берүү, иштен чыгууну азайтуу үчүн абдан маанилүү.
Биздин мээбиз миллиондогон кардарлар үчүн кардарлардын жүгүртүүсүн күтүүгө жөндөмсүз; бул жерде машина үйрөнүү жардам бере алат.
13. Wallmart сатууну болжолдоо
Машинаны үйрөнүүнүн эң көрүнүктүү колдонмолорунун бири - сатууну болжолдоо, ал продукт сатууга таасир этүүчү мүнөздөмөлөрдү аныктоону жана келечектеги сатуу көлөмүн болжолдоону камтыйт.
Бул машина үйрөнүү изилдөөсүндө 45 жерден сатуу маалыматтарын камтыган Walmart маалымат топтому колдонулат. Дүкөн боюнча сатуулар, категориялар боюнча, жума сайын берилиштер топтомуна киргизилет. Бул машинаны үйрөнүү долбоорунун максаты - ар бир розеткадагы ар бир бөлүмдүн сатууну болжолдоо, алар маалыматка негизделген каналды оптималдаштыруу жана инвентаризациялоону пландаштыруу боюнча чечимдерди кабыл алуу.
Walmart берилиштер топтому менен иштөө кыйын, анткени анда сатууга таасир этүүчү тандалган чектөө окуялары камтылган жана каралышы керек.
14. Uber маалыматтарын талдоо
Машина үйрөнүүнү жана терең үйрөнүүнү алардын колдонмолоруна киргизүү жана интеграциялоо жөнүндө сөз болгондо, популярдуу рейд бөлүшүү кызматы артта калган эмес. Жыл сайын ал миллиарддаган саякаттарды иштетип, жүргүнчүлөргө күндүн же түндүн каалаган убагында саякаттоого мүмкүнчүлүк берет.
Ал ушунчалык чоң кардар базасына ээ болгондуктан, керектөөчүлөрдүн даттанууларын мүмкүн болушунча тезирээк чечүү үчүн өзгөчө кардарларды тейлөө керек.
Uberде миллиондогон тандоолордун маалымат топтому бар, ал кардарлардын саякаттарын талдоо жана көрсөтүү үчүн түшүнүктөрдү ачуу жана кардарлардын тажрыйбасын жакшыртуу үчүн колдоно алат.
15. Covid-19 анализи
COVID-19 бүгүн пандемия маанисинде эмес, жер шарын каптады. Медициналык эксперттер эффективдүү эмдөөлөрдү иштеп чыгууга жана дүйнөнү иммунизациялоого басым жасап жатышат. маалымат илимпоздору артта калган жок.
Жаңы учурлар, күнүмдүк активдүү сан, өлүмдөр жана тестирлөө статистикасы коомчулукка жарыяланып жатат. Болжолдор өткөн кылымдагы SARS эпидемиясынын негизинде күн сайын түзүлөт. Бул үчүн, сиз регрессиялык анализди колдоно аласыз жана вектордук машинага негизделген болжолдоо моделдерин колдой аласыз.
жыйынтыктоо
Жыйынтыктап айтканда, биз сизге Machine Learning программалоосун сынап көрүүгө, ошондой эле анын идеяларын жана ишке ашырууну түшүнүүгө жардам бере турган кээ бир мыкты ML долбоорлорун талкууладык. Machine Learningди кантип интеграциялоону билүү, технология ар бир тармакты ээлеп тургандыктан, кесибиңизде алга жылууга жардам берет.
Machine Learning үйрөнүп жатканда, биз сизге концепцияларыңызды практикалоону жана бардык алгоритмдериңизди жазууну сунуштайбыз. Үйрөнүү учурунда алгоритмдерди жазуу долбоорду аткаруудан маанилүүрөөк жана бул сизге предметтерди туура түшүнүүдө артыкчылык берет.
Таштап Жооп