Мазмұны[Жасыру][Көрсету]
- 1 Титаник
- 2. Ирландиялық гүлдердің классификациясы
- 3. Бостондағы үй бағасының болжамы
- 4. Шарап сапасын тексеру
- 5. Қор нарығын болжау
- 6. Фильм ұсынысы
- 7. Жүктеу жарамдылығын болжау
- 8. Twitter деректерін пайдалану арқылы көңіл-күйді талдау
- 9. Болашақ сату болжамы
- 10. Жалған жаңалықтарды анықтау
- 11. Купондарды сатып алу болжамы
- 12. Тұтынушының бұзылуын болжау
- 13. Wallmart сатуды болжау
- 14. Uber деректерін талдау
- 15. Ковид-19 талдауы
- қорытынды
Машиналық оқыту - бұл жоғары деңгейде ұсынылған белгілі бір жұмысты біртіндеп жақсарту үшін компьютерлік бағдарламаны немесе алгоритмді қалай оқыту керектігін қарапайым зерттеу. Кескінді идентификациялау, алаяқтықты анықтау, ұсыныстар беру жүйелері және машинаны оқытудың басқа қолданбалары қазірдің өзінде танымал болып шықты.
ML жұмыстары адам жұмысын қарапайым және тиімді етеді, уақытты үнемдейді және жоғары сапалы нәтижені қамтамасыз етеді. Тіпті Google, әлемдегі ең танымал іздеу жүйесі де пайдаланады машина оқыту.
Пайдаланушының сұрауын талдаудан және нәтижелер негізінде нәтижені өзгертуден бастап сұранысқа қатысты трендті тақырыптар мен жарнамаларды көрсетуге дейін әртүрлі опциялар қолжетімді.
Қабылдағыш және өзін-өзі түзететін технология болашақта алыс емес.
Жұмысты бастаудың ең жақсы тәсілдерінің бірі - тәжірибе жинақтау және жобаны әзірлеу. Сондықтан, біз сізді бастау үшін жаңадан бастаушыларға арналған машиналық оқытудың 15 үздік жобаларының тізімін жасадық.
1. Титаник
Бұл көбінесе машиналық оқыту туралы көбірек білгісі келетін кез келген адам үшін ең үлкен және ең жағымды тапсырмалардың бірі болып саналады. Titanic challenge - бұл Kaggle деректер ғылымының платформасымен танысудың жақсы тәсілі ретінде қызмет ететін танымал машиналық оқыту жобасы. Титаник деректер жинағы апатты кеменің батуынан алынған шынайы деректерден тұрады.
Ол адамның жасы, әлеуметтік-экономикалық жағдайы, жынысы, кабина нөмірі, жөнелту порты және, ең бастысы, олардың аман қалғаны сияқты мәліметтерді қамтиды!
K-En Nearest Neighbor әдісі және шешім ағашының жіктеуіші осы жоба үшін ең жақсы нәтиже беретіні анықталды. Егер сіз өзіңізді жақсарту үшін жылдам демалыс күнін іздеп жатсаңыз Машиналық оқыту қабілеттері, Kaggle-дегі бұл сізге арналған.
2. Ирландиялық гүлдердің классификациясы
Жаңадан бастаушылар ирис гүлдерін санаттау жобасын жақсы көреді және бұл машинамен оқытуды жаңадан бастаған болсаңыз, бастау үшін тамаша орын. Гүл шоқтары мен жапырақшалардың ұзындығы басқа түрлерден иристің гүлденуін ажыратады. Бұл жобаның мақсаты гүлді үш түрге бөлу: Вирджиния, сетоза және Версиколор.
Жіктеу жаттығулары үшін жоба оқушыларға сандық мәндер мен деректермен жұмыс істеу негіздерін үйренуге көмектесетін Ирис гүлінің деректер жинағын пайдаланады. Ирис гүлінің деректер жинағы масштабтауды қажет етпей жадта сақтауға болатын кішкентай.
3. Бостондағы үй бағасының болжамы
Тағы бір танымал машиналық оқытуды жаңадан бастағандарға арналған деректер жинағы Boston Housing деректері болып табылады. Оның мақсаты - Бостонның әртүрлі аудандарындағы үй құндылықтарын болжау. Ол жас, мүлік салығы ставкасы, қылмыс деңгейі және тіпті жұмыспен қамту орталықтарына жақындық сияқты маңызды статистиканы қамтиды, олардың барлығы тұрғын үй бағасына әсер етуі мүмкін.
Деректер жинағы қарапайым және кішкентай, сондықтан оны жаңадан бастағандар үшін тәжірибе жасау оңай. Бостондағы жылжымайтын мүлік бағасына қандай факторлар әсер ететінін анықтау үшін регрессия әдістері әртүрлі параметрлерде кеңінен қолданылады. Бұл регрессия әдістерін қолдану және олардың қаншалықты жақсы жұмыс істейтінін бағалау үшін тамаша орын.
4. Шарап сапасын тексеру
Шарап - көп жылдар бойы ашытуды қажет ететін ерекше алкогольді сусын. Нәтижесінде антикварлық шарап бөтелкесі қымбат және жоғары сапалы шарап болып табылады. Шараптың тамаша бөтелкесін таңдау шараптың дәмін білу туралы көп жылдық білімді қажет етеді және бұл соққы немесе жіберіп алу процесі болуы мүмкін.
Шарап сапасын тексеру жобасы алкоголь деңгейі, бекітілген қышқылдық, тығыздық, рН және басқа факторлар сияқты физика-химиялық сынақтарды пайдаланып шараптарды бағалайды. Жоба шараптың сапа критерийлері мен мөлшерін де анықтайды. Нәтижесінде шарап сатып алу желге айналады.
5. Қор нарығының болжамы
Бұл бастама сізді қаржы секторында жұмыс істей ме, жоқ па, қызықтырады. Қор нарығының деректерін ғалымдар, бизнес өкілдері, тіпті қайталама табыс көзі ретінде де кеңінен зерттейді. Деректер ғалымының уақыттық қатарлар деректерін зерттеу және зерттеу қабілеті де өте маңызды. Қор нарығынан алынған деректер - бастау үшін тамаша орын.
Талпыныстың мәні акцияның болашақ құнын болжау болып табылады. Бұл ағымдағы нарық көрсеткіштеріне, сондай-ақ өткен жылдардағы статистикаға негізделген. Kaggle 50 жылдан бері NIFTY-2000 индексі бойынша деректерді жинап келеді және қазіргі уақытта ол апта сайын жаңартылып отырады. 1 жылдың 2000 қаңтарынан бастап ол 50-ден астам ұйымның акцияларының бағасын қамтиды.
6. Фильм ұсынысы
Жақсы фильм көргеннен кейін сізде осындай сезім болғанына сенімдімін. Ұқсас фильмдерді тамашалау арқылы өз сезімдеріңізді оятуға түрткі болған кезіңіз болды ма?
Netflix сияқты OTT қызметтері өздерінің ұсыныстар жүйелерін айтарлықтай жақсартқанын білеміз. Машина үйрену студенті ретінде мұндай алгоритмдердің клиенттерге олардың қалауы мен шолулары негізінде қалай бағытталғанын түсінуіңіз керек.
Kaggle сайтындағы IMDB деректер жинағы фильм атауына, тұтынушы рейтингіне, жанрға және басқа факторларға негізделген ұсыныс үлгілерін шығаруға мүмкіндік беретін ең толықтардың бірі болуы мүмкін. Бұл сонымен қатар мазмұнға негізделген сүзгілеу және мүмкіндіктер инженериясы туралы білудің тамаша әдісі.
7. Жүктеу жарамдылығын болжау
Әлем несиелер төңірегінде айналады. Банктердің негізгі табыс көзі несиелер бойынша пайыздардан тұрады. Сондықтан олар олардың негізгі бизнесі болып табылады.
Жеке адамдар немесе жеке адамдар тобы болашақта құнының өсуін көру үмітімен фирмаға ақша салу арқылы ғана экономиканы кеңейте алады. Кейде осындай тәуекелге бару, тіпті кейбір дүниелік ләззаттарға қатысу үшін несие іздеу маңызды.
Несие қабылданбай тұрып, банктерде әдетте өте қатаң процесс бар. Несиелер көптеген адамдардың өмірінің маңызды аспектісі болғандықтан, біреудің өтініш берген несиеге жарамдылығын болжау өте пайдалы болады, бұл несиені қабылдау немесе бас тартудан басқа жақсы жоспарлауға мүмкіндік береді.
8. Twitter деректерін пайдалана отырып, көңіл-күйді талдау
Рахмет әлеуметтік медиа желілері Twitter, Facebook және Reddit сияқты пікірлер мен трендтерді экстраполяциялау айтарлықтай оңай болды. Бұл ақпарат оқиғалар, адамдар, спорт және басқа тақырыптар туралы пікірлерді жою үшін пайдаланылады. Пікір өндіруге қатысты машинаны оқыту бастамалары әртүрлі параметрлерде, соның ішінде саяси науқандарда және Amazon өнімдерін бағалауда қолданылады.
Бұл жоба сіздің портфолиоңызда керемет көрінеді! Эмоцияларды анықтау және аспектіге негізделген талдау үшін қолдау векторлық машиналары, регрессия және жіктеу алгоритмдері сияқты әдістерді кеңінен қолдануға болады (фактілер мен пікірлерді табу).
9. Болашақ сату болжамы
Үлкен B2C компаниялары мен саудагерлері өздерінің қорындағы әрбір өнімнің қанша сатылатынын білгісі келеді. Сатуды болжау бизнес иелеріне қай тауарлардың жоғары сұранысқа ие екенін анықтауға көмектеседі. Сатуды дәл болжау ысырапты айтарлықтай азайтады, сонымен бірге болашақ бюджеттерге қосымша әсерді анықтайды.
Walmart, IKEA, Big Bazaar және Big Bazaar сияқты бөлшек саудагерлер өнімге сұранысты бағалау үшін сату болжамын пайдаланады. Осындай ML жобаларын құру үшін бастапқы деректерді тазалаудың әртүрлі әдістерімен таныс болуыңыз керек. Сондай-ақ, регрессиялық талдауды, әсіресе қарапайым сызықтық регрессияны жақсы меңгеру қажет.
Мұндай тапсырмалар үшін Dora, Scrubadub, Pandas, NumPy және т.б. сияқты кітапханаларды пайдалану қажет.
10. Жалған жаңалықтарды анықтау
Бұл мектеп оқушыларына бағытталған машинамен оқытудың тағы бір озық әрекеті. Фейк жаңалықтар жалын сияқты таралып жатыр, мұны бәріміз білеміз. Әлеуметтік желілерде жеке адамдарды байланыстырудан бастап күнделікті жаңалықтарды оқуға дейін бар.
Нәтижесінде жалған жаңалықтарды анықтау бүгінгі күні қиындай түсті. Facebook және Twitter сияқты көптеген ірі әлеуметтік желілерде хабарламалар мен арналардағы жалған жаңалықтарды анықтау үшін алгоритмдер бар.
Жалған жаңалықтарды анықтау үшін ML жобасының бұл түрі бірнеше NLP тәсілдерін және жіктеу алгоритмдерін (PassiveAggressiveClassifier немесе Naive Bayes классификаторы) мұқият түсінуді қажет етеді.
11. Купондарды сатып алу болжамы
2020 жылы коронавирус ғаламшарға шабуыл жасағанда, тұтынушылар онлайн сатып алу туралы көбірек ойлануда. Нәтижесінде сауда мекемелері өз бизнесін интернетке ауыстыруға мәжбүр болды.
Екінші жағынан, тұтынушылар дүкендердегі сияқты әлі де керемет ұсыныстарды іздейді және өте үнемдейтін купондарды көбірек іздейді. Мұндай клиенттер үшін купондар жасауға арналған веб-сайттар да бар. Сіз осы жоба арқылы деректерді визуализациялау үшін штрих-графиктерді, дөңгелек диаграммаларды және гистограммаларды жасау және мүмкіндіктерді инженерия арқылы машиналық оқытуда деректерді өндіру туралы біле аласыз.
Болжамдарды жасау үшін NA мәндерін және айнымалылардың косинус ұқсастығын басқаруға арналған деректерді есептеу тәсілдерін де қарастыруға болады.
12. Тұтынушының шығынын болжау
Тұтынушылар компанияның ең маңызды активі болып табылады және оларды сақтау кірісті арттыруға және олармен ұзақ мерзімді мағыналы байланыс орнатуға бағытталған кез келген бизнес үшін өте маңызды.
Сонымен қатар, жаңа клиентті алу құны бар клиентті қолдау құнынан бес есе жоғары. Тұтынушының бұзылуы/тозуы - бұл тұтынушылар немесе жазылушылар қызметпен немесе компаниямен бизнесті тоқтататын белгілі бизнес мәселесі.
Олар бұдан былай төлейтін тұтынушы болмайды. Тұтынушы компаниямен соңғы рет әрекеттескеннен бері белгілі бір уақыт өткен болса, тұтынушы тоқтатылған болып саналады. Клиенттің бас тартуын анықтау, сондай-ақ тұтынушыны ұстап тұруға бағытталған тиісті ақпаратты жылдам беру тұтынушылықты азайту үшін өте маңызды.
Біздің миымыз миллиондаған клиенттер үшін тұтынушы айналымын болжауға қабілетсіз; мұнда машиналық оқыту көмектесе алады.
13. Wallmart сатуды болжау
Машиналық оқытудың ең көрнекті қолданбаларының бірі өнімді сатуға әсер ететін сипаттамаларды анықтауды және болашақ сату көлемін болжауды қамтитын сатуды болжау болып табылады.
45 орындағы сату деректерін қамтитын Walmart деректер жинағы осы машинаны оқыту зерттеуінде пайдаланылады. Дүкенге, санат бойынша, апта сайынғы сатылымдар деректер жинағына енгізілген. Бұл машиналық оқыту жобасының мақсаты - деректерге негізделген арналарды оңтайландыру және түгендеуді жоспарлау шешімдерін қабылдау үшін әрбір бөлімшенің сатылымдарын болжау.
Walmart деректер жинағымен жұмыс істеу қиын, өйткені онда сатылымдарға әсер ететін және ескерілуі тиіс таңдалған шектеу оқиғалары бар.
14. Uber деректерін талдау
Машиналық оқытуды және олардың қолданбаларында терең оқытуды енгізу және біріктіру туралы сөз болғанда, танымал рейд бөлісу қызметі артта қалмайды. Жыл сайын ол миллиардтаған сапарларды өңдейді, бұл коммутаторларға күннің немесе түннің кез келген уақытында саяхаттауға мүмкіндік береді.
Оның соншалықты үлкен клиенттік базасы болғандықтан, тұтынушылардың шағымдарын мүмкіндігінше тезірек шешу үшін тұтынушыларға ерекше қызмет көрсету қажет.
Uber-те миллиондаған таңдаулардан тұратын деректер жинағы бар, ол түсініктерді ашу және тұтынушы тәжірибесін жақсарту үшін клиент сапарларын талдау және көрсету үшін пайдалана алады.
15. Ковид-19 талдауы
COVID-19 бүгін жай ғана пандемия мағынасында емес, бүкіл әлемді шарпыды. Медициналық сарапшылар тиімді вакциналар жасауға және әлемді иммунизациялауға шоғырланған кезде, деректер ғалымдары артта қалған жоқ.
Жаңа жағдайлар, күнделікті белсенді сандар, өлім-жітім және тестілеу статистикасы барлығы жариялануда. Болжамдар өткен ғасырдағы SARS індеті негізінде күнделікті негізде жасалады. Ол үшін регрессиялық талдауды және векторлық машина негізіндегі болжау үлгілерін қолдауға болады.
қорытынды
Қорытындылай келе, біз сізге Machine Learning бағдарламалауын тестілеуге, сондай-ақ оның идеялары мен жүзеге асырылуын түсінуге көмектесетін ең жақсы ML жобаларын талқыладық. Machine Learning-ті қалай біріктіру керектігін білу сізге кәсібіңізде ілгерілеуге көмектеседі, өйткені технология әр салада орын алады.
Machine Learning-ді үйрену кезінде біз сізге өз тұжырымдамаларыңызды жаттықтыруды және барлық алгоритмдеріңізді жазуды ұсынамыз. Оқу кезінде алгоритмдерді жазу жобаны орындаудан маңыздырақ, сонымен қатар ол пәндерді дұрыс түсінуде артықшылық береді.
пікір қалдыру