Съдържание[Крия][Покажи]
- 1. Титаник
- 2. Класификация на ирландските цветя
- 3. Прогнозиране на цената на къщата в Бостън
- 4. Тестване на качеството на виното
- 5. Прогноза на фондовия пазар
- 6. Препоръка за филм
- 7. Прогноза за допустимост на натоварване
- 8. Анализ на настроенията с помощта на данни от Twitter
- 9. Прогноза за бъдещи продажби
- 10. Откриване на фалшиви новини
- 11. Прогноза за покупка на купони
- 12. Прогноза за оттичане на клиенти
- 13. Прогнозиране на продажбите на Wallmart
- 14. Анализ на данни Uber
- 15. Анализ на Covid-19
- Заключение
Машинното обучение е просто изследване за това как да обучавате компютърна програма или алгоритъм за постепенно подобряване на конкретна работа, представена на високо ниво. Идентифицирането на изображения, откриването на измами, системите за препоръки и други приложения за машинно обучение вече се оказаха популярни.
Работните места за машинно обучение правят човешката работа лесна и ефективна, спестявайки време и гарантирайки висококачествен резултат. Дори Google, най-популярната търсачка в света, използва машинно обучение.
От анализиране на заявката на потребителя и промяна на резултата въз основа на резултатите до показване на актуални теми и реклами във връзка със заявката, има различни налични опции.
Технология, която е едновременно възприемаща и самокоригираща се, не е далеч в бъдещето.
Един от най-добрите начини да започнете е да получите практически опит и да проектирате проект. Затова съставихме списък с 15 най-добри проекта за машинно обучение за начинаещи, за да започнете.
1. титаничен
Това често се смята за една от най-големите и приятни задачи за всеки, който се интересува да научи повече за машинното обучение. Предизвикателството Titanic е популярен проект за машинно обучение, който също така служи като добър начин да се запознаете с платформата за наука за данни Kaggle. Наборът от данни на Титаник е съставен от истински данни от потъването на злополучния кораб.
Включва подробности като възраст на лицето, социално-икономически статус, пол, номер на кабината, пристанище на заминаване и най-важното дали е оцелял!
Техниката K-Nearest Neighbor и класификаторът на дървото на решенията бяха решени да дадат най-добри резултати за този проект. Ако търсите бързо предизвикателство през уикенда, за да подобрите своя Способности за машинно обучение, този на Kaggle е за вас.
2. Класификация на ирландските цветя
Начинаещите харесват проекта за категоризиране на цветя ирис и това е чудесно място да започнете, ако сте нов в машинното обучение. Дължината на чашелистчетата и венчелистчетата отличава цъфтежа на ириса от другите видове. Целта на този проект е да раздели цъфтежа на три вида: Virginia, setosa и Versicolor.
За упражненията за класификация проектът използва набора от данни за цветя на ириса, който помага на учащите да научат основите на работа с числови стойности и данни. Наборът от данни за цветя на ириса е малък, който може да се съхранява в паметта без необходимост от мащабиране.
3. Прогноза за цената на къщата в Бостън
Друг добре известен набор от данни за начинаещи в машинното обучение са данните на Boston Housing. Целта му е да прогнозира стойностите на жилищата в различни квартали на Бостън. Тя включва жизненоважни статистически данни като възраст, ставка на данък върху имотите, ниво на престъпност и дори близост до центрове за работа, всички от които могат да повлияят на цените на жилищата.
Наборът от данни е прост и малък, което го прави лесен за експериментиране за начинаещи. За да се разбере кои фактори влияят върху цената на имота в Бостън, регресионните техники се използват широко за различни параметри. Това е чудесно място за практикуване на техники за регресия и оценка на това колко добре работят.
4. Тестване на качеството на виното
Виното е необичайна алкохолна напитка, която изисква години на ферментация. В резултат на това античната бутилка вино е скъпо и висококачествено вино. Изборът на идеалната бутилка вино изисква години познания за дегустация на вино и това може да бъде процес, който ще бъде успешен.
Проектът за тестване на качеството на виното оценява вината с помощта на физикохимични тестове като алкохолно ниво, фиксирана киселинност, плътност, pH и други фактори. Проектът също така определя критериите за качество и количествата на виното. В резултат на това закупуването на вино става лесно.
5. Прогноза на фондовия пазар
Тази инициатива е интригуваща дали работите във финансовия сектор или не. Данните от фондовия пазар се изучават обстойно от учени, бизнеси и дори като източник на вторичен доход. Способността на учените по данни да изучава и изследва данни от времеви серии също е жизненоважна. Данните от фондовия пазар са чудесно място за начало.
Същността на начинанието е да се прогнозира бъдещата стойност на акциите. Това се основава на текущото представяне на пазара, както и на статистически данни от предходни години. Kaggle събира данни за индекса NIFTY-50 от 2000 г. и в момента се актуализира ежеседмично. От 1 януари 2000 г. той съдържа цени на акции за над 50 организации.
6. Препоръка за филм
Сигурен съм, че сте имали това чувство, след като сте гледали добър филм. Изпитвали ли сте някога импулса да възбудите сетивата си, като гледате прекомерно подобни филми?
Знаем, че OTT услуги като Netflix са подобрили значително своите системи за препоръки. Като студент по машинно обучение ще трябва да разберете как такива алгоритми са насочени към клиенти въз основа на техните предпочитания и отзиви.
Наборът от данни на IMDB на Kaggle вероятно е един от най-пълните, позволявайки моделите за препоръки да бъдат изведени въз основа на заглавието на филма, клиентската оценка, жанра и други фактори. Това също е отличен метод да научите за филтриране, базирано на съдържание и инженеринг на функции.
7. Прогноза за допустимост за зареждане
Светът се върти около заемите. Основният източник на печалба на банките идва от лихвите по заеми. Следователно те са основен бизнес.
Индивиди или групи от индивиди могат да разширят икономиките си само като инвестират пари във фирма с надеждата да видят, че стойността й се покачва в бъдеще. Понякога е важно да потърсите заем, за да можете да поемате рискове от това естество и дори да участвате в определени светски удоволствия.
Преди да бъде приет заем, банките обикновено трябва да следват доста строг процес. Тъй като заемите са толкова важен аспект от живота на много хора, прогнозирането на допустимостта за заем, за който някой кандидатства, би било изключително полезно, позволявайки по-добро планиране извън приемането или отказа на заема.
8. Анализ на настроенията с помощта на данни от Twitter
Благодарение на социални медийни мрежи като Twitter, Facebook и Reddit, екстраполирането на мнения и тенденции стана значително лесно. Тази информация се използва за премахване на мнения по събития, хора, спорт и други теми. Инициативите за машинно обучение, свързани с копаене на мнения, се прилагат в различни условия, включително политически кампании и оценки на продуктите на Amazon.
Този проект ще изглежда фантастично във вашето портфолио! За откриване на емоции и анализ, базиран на аспекти, техники като поддържащи векторни машини, регресия и алгоритми за класификация могат да се използват широко (намиране на факти и мнения).
9. Прогноза за бъдещи продажби
Големите B2C бизнеси и търговци искат да знаят колко ще продаде всеки продукт в техния инвентар. Прогнозирането на продажбите помага на собствениците на фирми да определят кои артикули са с голямо търсене. Точното прогнозиране на продажбите значително ще намали загубата, като същевременно ще определи допълнителното въздействие върху бъдещите бюджети.
Търговци на дребно като Walmart, IKEA, Big Basket и Big Bazaar използват прогнозиране на продажбите, за да преценят търсенето на продукти. Трябва да сте запознати с различни техники за почистване на необработени данни, за да изградите такива проекти за ML. Също така е необходимо добро разбиране на регресионния анализ, особено простата линейна регресия.
За тези видове задачи ще трябва да използвате библиотеки като Dora, Scrubadub, Pandas, NumPy и други.
10. Откриване на фалшиви новини
Това е още едно авангардно усилие за машинно обучение, насочено към учениците. Фалшивите новини се разпространяват като горски пожар, както всички знаем. Всичко е достъпно в социалните медии, от свързване на хора до четене на ежедневни новини.
В резултат на това откриването на фалшиви новини става все по-трудно в наши дни. Много големи социални медийни мрежи, като Facebook и Twitter, вече имат въведени алгоритми за откриване на фалшиви новини в публикации и емисии.
За да се идентифицират фалшиви новини, този тип ML проект се нуждае от задълбочено разбиране на множество НЛП подходи и алгоритми за класификация (PassiveAggressiveClassifier или Naive Bayes classifier).
11. Прогноза за покупка на купони
Клиентите все повече обмислят онлайн пазаруване, когато коронавирусът атакува планетата през 2020 г. В резултат на това търговските заведения бяха принудени да изместят бизнеса си онлайн.
Клиентите, от друга страна, все още търсят страхотни оферти, точно както бяха в магазините, и все повече търсят суперспестяващи купони. Има дори уебсайтове, посветени на създаването на купони за такива клиенти. Можете да научите за копаене на данни в машинното обучение, създаване на лентови графики, кръгови диаграми и хистограми за визуализиране на данни и инженеринг на функции с този проект.
За да генерирате прогнози, можете също да разгледате подходи за импутиране на данни за управление на стойности на NA и косинусово сходство на променливи.
12. Прогноза за оттичане на клиенти
Потребителите са най-важният актив на компанията и поддържането им е жизненоважно за всеки бизнес, който има за цел да увеличи приходите и да изгради дългосрочни значими връзки с тях.
Освен това разходите за придобиване на нов клиент са пет пъти по-високи от разходите за поддържане на съществуващ. Източването/изтриването на клиенти е добре познат бизнес проблем, при който клиентите или абонатите спират да правят бизнес с услуга или компания.
В идеалния случай те вече няма да бъдат плащащи клиенти. Клиент се счита за отхвърлен, ако е минало определено време от последното взаимодействие на клиента с компанията. Идентифицирането дали даден клиент ще се оттегли, както и бързото предоставяне на подходяща информация, насочена към задържане на клиенти, са от решаващо значение за намаляване на оттока.
Нашите мозъци не са в състояние да предвидят клиентски оборот за милиони клиенти; тук може да помогне машинното обучение.
13. Прогнозиране на продажбите на Wallmart
Едно от най-известните приложения на машинното обучение е прогнозирането на продажбите, което включва откриване на характеристики, които влияят върху продажбите на продукти и предвиждане на бъдещия обем на продажбите.
Наборът от данни на Walmart, който съдържа данни за продажбите от 45 места, се използва в това проучване за машинно обучение. Продажбите на магазин, по категории, на седмична база са включени в набора от данни. Целта на този проект за машинно обучение е да предвиди продажбите за всеки отдел във всеки търговски обект, така че те да могат да вземат по-добра оптимизация на канали, базирани на данни, и решения за планиране на инвентара.
Работата с набора от данни на Walmart е трудна, тъй като съдържа избрани събития за намаление, които оказват влияние върху продажбите и трябва да бъдат взети предвид.
14. Анализ на данни от Uber
Когато става въпрос за внедряване и интегриране на машинно обучение и задълбочено обучение в техните приложения, популярната услуга за споделяне на пътувания не изостава. Всяка година той обработва милиарди пътувания, позволявайки на пътуващите да пътуват по всяко време на деня и нощта.
Тъй като има толкова голяма клиентска база, той се нуждае от изключително обслужване на клиентите, за да отговори на оплакванията на потребителите възможно най-бързо.
Uber разполага с набор от данни от милиони пикапи, които може да използва за анализиране и показване на пътувания на клиенти, за да разкрие прозрения и да подобри клиентското изживяване.
15. Анализ на Covid-19
COVID-19 обхвана земното кълбо днес, а не просто в смисъл на пандемия. Докато медицинските експерти се концентрират върху създаването на ефективни ваксинации и имунизирането на света, учени по данни не са много по-назад.
Нови случаи, ежедневен активен брой, смъртни случаи и статистически данни от тестовете се оповестяват публично. Прогнозите се правят ежедневно на базата на епидемията от ТОРС от предходния век. За това можете да използвате регресионен анализ и да поддържате векторни машинно-базирани модели за прогнозиране.
Заключение
За да обобщим, обсъдихме някои от най-добрите ML проекти, които ще ви помогнат да тествате програмирането с машинно обучение, както и да разберете неговите идеи и реализация. Познаването как да интегрирате машинното обучение може да ви помогне да напреднете в професията си, тъй като технологията завладява всяка индустрия.
Докато изучавате машинно обучение, ви препоръчваме да практикувате своите концепции и да напишете всичките си алгоритми. Писането на алгоритми по време на учене е по-важно от изпълнението на проект и също така ви предоставя предимство при правилното разбиране на предметите.
Оставете коментар