Содржина[Крие][Прикажи]
- 1 Титаник
- 2. Класификација на ирски цветови
- 3. Предвидување на цената на куќата во Бостон
- 4. Тестирање на квалитетот на виното
- 5. Предвидување на берзата
- 6. Препорака за филм
- 7. Предвидување за подобност на вчитување
- 8. Анализа на чувствата со помош на податоци на Твитер
- 9. Предвидување на идните продажби
- 10. Откривање на лажни вести
- 11. Предвидување за купување купони
- 12. Предвидување на отфрлање на клиентите
- 13. Волмарт прогнозирање на продажбата
- 14. Анализа на податоци на Uber
- 15. Анализа на Ковид-19
- Заклучок
Машинското учење е едноставна студија за тоа како да се едуцира компјутерска програма или алгоритам за постепено подобрување на одредена работа претставена на високо ниво. Идентификацијата на слики, откривањето измами, системите за препораки и другите апликации за машинско учење веќе се покажаа како популарни.
ML Работите ја прават човечката работа едноставна и ефикасна, заштедувајќи време и обезбедувајќи висококвалитетен резултат. Дури и Google, најпопуларниот пребарувач во светот, користи машинско учење.
Од анализа на барањето на корисникот и менување на резултатот врз основа на резултатите до прикажување трендовски теми и реклами во врска со барањето, достапни се различни опции.
Технологијата која истовремено е перцептивна и самокорегирачка не е далеку во иднина.
Еден од најголемите начини да започнете е да започнете со работа и да дизајнирате проект. Затоа, составивме листа од 15 врвни проекти за машинско учење за почетници за да започнете.
1. Титаник
Ова често се смета за една од најголемите и најпријатните задачи за секој кој е заинтересиран да научи повеќе за машинското учење. Предизвикот Титаник е популарен проект за машинско учење кој исто така служи како добар начин за запознавање со платформата за наука за податоци Kaggle. Базата на податоци на Титаник е составена од вистински податоци од потонувањето на несреќниот брод.
Вклучува детали како што се возраста на лицето, социо-економскиот статус, полот, бројот на кабината, пристаништето на поаѓање и, што е најважно, дали преживеале!
Техниката К-Најблизок сосед и класификаторот на стеблото на одлуки беа одредени да дадат најдобри резултати за овој проект. Ако барате брз викенд предизвик за да го подобрите вашето Способности за машинско учење, оваа на Kaggle е за вас.
2. Класификација на ирски цветови
Почетниците го сакаат проектот за категоризација на цветот на ирисот и тоа е одлично место за почеток ако сте нови во машинското учење. Должината на сепалите и ливчињата ги разликува цутите на ирисот од другите видови. Целта на овој проект е да се подели цутот на три вида: Вирџинија, сетоза и Версиколор.
За вежби за класификација, проектот ја користи базата на податоци за цвеќе на Ирис, која им помага на учениците да ги научат основите за справување со нумерички вредности и податоци. Податокот за цвеќе на ирисот е мал што може да се складира во меморија без потреба од скалирање.
3. Предвидување на цената на куќата во Бостон
Друга добро позната база на податоци за почетници во машинското учење се податоците на Бостон Хаусинг. Неговата цел е да ги предвиди вредностите на домовите во различни населби во Бостон. Вклучува витални статистички податоци како што се возраста, стапката на данок на имот, стапката на криминал, па дури и близината до центрите за работа, а сето тоа може да влијае на цените на становите.
Базата на податоци е едноставна и мала, што го прави едноставен за експериментирање за почетниците. За да дознаеме кои фактори влијаат на цената на имотот во Бостон, техниките на регресија се многу користени за различни параметри. Тоа е одлично место за вежбање техники на регресија и проценка на тоа колку добро функционираат.
4. Тестирање на квалитетот на виното
Виното е необичен алкохолен пијалок кој бара долгогодишно ферментирање. Како резултат на тоа, античкото шише вино е скапо и висококвалитетно вино. Изборот на идеалното шише вино бара долгогодишно знаење за дегустација на вино, а тоа може да биде процес кој може да се погоди или пропушти.
Проектот за тестирање на квалитетот на виното ги проценува вината користејќи физичко-хемиски тестови како што се нивото на алкохол, фиксна киселост, густина, pH и други фактори. Проектот ги одредува и критериумите и количествата за квалитет на виното. Како резултат на тоа, купувањето вино станува лесно.
5. Предвидување на берзата
Оваа иницијатива е интригантна без разлика дали работите во финансискиот сектор или не. Податоците од берзата опширно се проучуваат од академици, бизниси, па дури и како извор на секундарен приход. Способноста на научникот за податоци да проучува и истражува податоци за временски серии е исто така од витално значење. Податоците од берзата се одлично место за почеток.
Суштината на потфатот е да се предвиди идната вредност на акциите. Ова се заснова на тековните перформанси на пазарот, како и статистиката од претходните години. Kaggle собира податоци за индексот NIFTY-50 од 2000 година и моментално се ажурира неделно. Од 1 јануари 2000 година, тој содржи цени на акции за над 50 организации.
6. Препорака за филм
Сигурен сум дека сте го имале тоа чувство откако сте гледале добар филм. Дали некогаш сте почувствувале импулс да ги поттикнете вашите сетила со прекумерно гледање слични филмови?
Знаеме дека ОТТ услугите како што е Netflix значително ги подобрија своите системи за препораки. Како студент за машинско учење, ќе треба да разберете како таквите алгоритми таргетираат клиенти врз основа на нивните преференции и прегледи.
Комплетот на податоци на IMDB на Kaggle е веројатно еден од најкомплетните, што дозволува моделите за препораки да се заклучат врз основа на насловот на филмот, рејтингот на клиентите, жанрот и други фактори. Тоа е исто така одличен метод за учење за филтрирање базирано на содржина и инженерство на карактеристики.
7. Вчитај предвидување подобност
Светот се врти околу заемите. Главниот извор на профит на банките доаѓа од каматите на заемите. Оттука тие се нивната основна дејност.
Поединци или групи на поединци можат да ги прошират економиите само со инвестирање пари во фирма со надеж дека ќе видат дека нивната вредност се зголемува во иднина. Понекогаш е важно да барате заем за да можете да преземете ризици од ваква природа, па дури и да учествувате во одредени светски задоволства.
Пред да биде прифатен заемот, банките вообичаено имаат прилично строг процес што треба да го следат. Бидејќи заемите се толку клучен аспект од животот на многу луѓе, предвидувањето на подобноста за заем за кој некој аплицира би било исклучително корисно, овозможувајќи подобро планирање надвор од прифаќањето или одбивањето на заемот.
8. Анализа на сентимент користејќи податоци на Твитер
Благодарение на мрежи на социјални медиуми како Твитер, Фејсбук и Редит, екстраполирањето на мислењата и трендовите стана значително лесно. Оваа информација се користи за елиминирање на мислењата за настани, луѓе, спортови и други теми. Иницијативите за машинско учење поврзани со рударството на мислење се применуваат во различни поставки, вклучувајќи политички кампањи и проценки на производите на Амазон.
Овој проект ќе изгледа фантастично во вашето портфолио! За откривање емоции и анализа заснована на аспекти, техниките како што се машините за вектор за поддршка, регресија и алгоритми за класификација може да се користат опширно (пронаоѓање факти и мислења).
9. Предвидување на идните продажби
Големите B2C бизниси и трговци сакаат да знаат колку ќе се продаде секој производ од нивниот инвентар. Прогнозирањето на продажбата им помага на сопствениците на бизниси да одредат кои артикли се многу барани. Точното прогнозирање на продажбата значително ќе го намали трошењето, а истовремено ќе го одреди дополнителното влијание врз идните буџети.
Трговците на мало како Walmart, IKEA, Big Basket и Big Bazaar користат прогнозирање на продажбата за да ја проценат побарувачката на производи. Мора да сте запознаени со различни техники за чистење на необработени податоци за да конструирате такви ML проекти. Исто така, потребно е добро разбирање на регресивната анализа, особено едноставна линеарна регресија.
За вакви задачи, ќе треба да користите библиотеки како што се Dora, Scrubadub, Pandas, NumPy и други.
10. Откривање на лажни вести
Тоа е уште еден врвен напор за машинско учење наменет за ученици. Лажните вести се шират како шумски пожар, како што сите знаеме. Сè е достапно на социјалните мрежи, од поврзување поединци до читање дневни вести.
Како резултат на тоа, откривањето на лажни вести стана сè потешко овие денови. Многу големи социјални мрежи, како што се Фејсбук и Твитер, веќе имаат алгоритми за откривање лажни вести во објавите и доводите.
За да се идентификуваат лажните вести, на овој тип на ML проект му треба темелно разбирање на повеќе NLP пристапи и алгоритми за класификација (PassiveAggressiveClassifier или Naive Bayes класификатор).
11. Предвидување за купување купони
Клиентите се повеќе размислуваат за купување преку Интернет кога коронавирусот ја нападна планетата во 2020 година. Како резултат на тоа, трговските претпријатија беа принудени да го префрлат својот бизнис преку Интернет.
Клиентите, од друга страна, сè уште бараат одлични понуди, исто како што беа во продавниците, и се повеќе ловат купони за супер заштеда. Постојат дури и веб-страници посветени на создавање купони за такви клиенти. Можете да научите за ископувањето податоци во машинското учење, производството на столбести графикони, дијаграми со пити и хистограми за визуелизација на податоците и инженерството на карактеристики со овој проект.
За да генерирате предвидувања, можете да погледнете и во пристапите за импутација на податоци за управување со вредностите на NA и косинусната сличност на променливите.
12. Предвидување за отфрлање на клиентите
Потрошувачите се најважното богатство на компанијата и нивното чување е од витално значење за секој бизнис кој има за цел да ги зголеми приходите и да изгради долгорочни значајни врски со нив.
Понатаму, трошоците за стекнување на нов клиент се пет пати повисоки од трошоците за одржување на постоечки. Откажување/намалување на клиентите е добро познат деловен проблем во кој клиентите или претплатниците престануваат да работат со услуга или компанија.
Идеално, тие повеќе нема да бидат клиенти што плаќаат. Клиентот се смета за разбиен ако поминало одредено време откако клиентот последен пат имал интеракција со компанијата. Идентификувањето дали клиентот ќе се разнежни, како и брзото давање релевантни информации насочени кон задржување на клиентите, се од клучно значење за намалување на отчукувањата.
Нашите мозоци не се способни да го предвидат обртот на клиентите за милиони клиенти; еве каде машинското учење може да помогне.
13. Волмарт прогнозирање на продажбата
Една од најистакнатите апликации на машинското учење е прогнозирањето на продажбата, кое вклучува откривање на карактеристики кои влијаат на продажбата на производите и предвидување на идниот обем на продажба.
Базата на податоци на Walmart, која содржи податоци за продажба од 45 локации, се користи во оваа студија за машинско учење. Продажбата по продавница, по категорија, на неделна основа е вклучена во базата на податоци. Целта на овој проект за машинско учење е да се предвиди продажбата за секој оддел во секој продажен центар за да можат да донесат подобри одлуки за оптимизација на каналот и планирање на залихите водени од податоци.
Работата со базата на податоци на Walmart е тешка бидејќи содржи избрани настани за обележување кои имаат влијание врз продажбата и треба да се земат предвид.
14. Анализа на податоци на Uber
Кога станува збор за имплементација и интегрирање на машинското учење и длабокото учење во нивните апликации, популарната услуга за споделување возење не заостанува. Секоја година обработува милијарди патувања, овозможувајќи им на патниците да патуваат во секое време од денот или ноќта.
Бидејќи има толку голема база на клиенти, му треба исклучителна услуга за клиентите за да ги реши поплаките на потрошувачите што е можно побрзо.
Uber има збирка податоци од милиони преземања што може да ги користи за да ги анализира и прикажува патувањата на клиентите за да открие увид и да го подобри искуството на клиентите.
15. Анализа на Ковид-19
СОВИД-19 денес го зафати светот, а не само во смисла на пандемија. Додека медицинските експерти се концентрираат на генерирање ефективни вакцини и имунизација на светот, научници за податоци не се далеку зад себе.
Новите случаи, дневниот активен број, смртните случаи и статистиката за тестирање се објавуваат во јавноста. Прогнозите се прават на дневна основа врз основа на појавата на САРС од претходниот век. За ова, можете да користите регресивна анализа и да поддржувате векторски машински модели на предвидување.
Заклучок
Да резимираме, разговаравме за некои од најдобрите ML проекти кои ќе ви помогнат во тестирањето на програмирањето за машинско учење, како и да ги сфатите неговите идеи и имплементација. Знаењето како да го интегрирате машинското учење може да ви помогне да напредувате во вашата професија бидејќи технологијата ја презема контролата во секоја индустрија.
Додека го учите машинското учење, ви препорачуваме да ги вежбате вашите концепти и да ги напишете сите ваши алгоритми. Пишувањето алгоритми додека учите е поважно од изведувањето проект, а исто така ви дава предност во правилното разбирање на предметите.
Оставете Одговор