15 najboljih projekata mašinskog učenja za početnike

Sadržaj[Sakrij][Prikaži]

1 Titanic
2. Irska klasifikacija cvijeća
3. Predviđanje cijene kuća u Bostonu
4. Ispitivanje kvaliteta vina
5. Predviđanje berze
6. Preporuka filma
7. Predviđanje podobnosti opterećenja
8. Analiza raspoloženja pomoću Twitter podataka
9. Predviđanje buduće prodaje
10. Detekcija lažnih vijesti
11. Predviđanje kupovine kupona
12. Predviđanje odljeva kupaca
13. Wallmart predviđanje prodaje
14. Uber analiza podataka
15. Covid-19 analiza
zaključak

Mašinsko učenje je jednostavna studija o tome kako educirati kompjuterski program ili algoritam kako bi se postepeno poboljšao na određenom poslu predstavljenom na visokom nivou. Identifikacija slika, detekcija prevara, sistemi preporuka i druge aplikacije za mašinsko učenje već su se pokazale popularnim.

ML poslovi čine ljudski rad jednostavnim i efikasnim, štedeći vrijeme i osiguravajući visokokvalitetne rezultate. Čak i Google, najpopularniji svjetski pretraživač, koristi mašinsko učenje.

Od analize korisničkog upita i izmjene rezultata na osnovu rezultata do prikazivanja trendovskih tema i oglasa u odnosu na upit, na raspolaganju su razne opcije.

Tehnologija koja je i perceptivna i samoispravljajuća nije daleko u budućnosti.

Jedan od najboljih načina da započnete je prakticiranje i dizajniranje projekta. Stoga smo sastavili listu od 15 najboljih projekata mašinskog učenja za početnike kako bismo vam pomogli.

1. titanski

Ovo se često smatra jednim od najvećih i najugodnijih zadataka za svakoga ko želi da sazna više o mašinskom učenju. Izazov Titanic je popularan projekat mašinskog učenja koji takođe služi kao dobar način da se upoznate sa Kaggle platformom za nauku o podacima. Titanic skup podataka sastoji se od autentičnih podataka o potonuću nesretnog broda.

Uključuje detalje kao što su starost osobe, socioekonomski status, spol, broj kabine, luka polaska i, što je najvažnije, da li je preživjela!

Tehnika K-nearest Neighbor i klasifikator stabla odluka su određeni da daju najbolje rezultate za ovaj projekat. Ako tražite brzi vikend izazov da poboljšate svoj Sposobnosti mašinskog učenja, ovaj na Kaggleu je za vas.

titanski

2. Irska klasifikacija cvijeća

Početnicima se sviđa projekat kategorizacije cvijeta irisa i to je odlično mjesto za početak ako ste tek počeli s mašinskim učenjem. Dužina listova i latica razlikuje cvjetove irisa od drugih vrsta. Svrha ovog projekta je razdvajanje cvjetova u tri vrste: Virginia, Setosa i Versicolor.

Za vježbe klasifikacije, projekt koristi skup podataka cvijeta perunike, koji pomaže učenicima da nauče osnove rada s numeričkim vrijednostima i podacima. Skup podataka o cvijetu irisa je mali koji se može pohraniti u memoriju bez potrebe za skaliranjem.

Irska klasifikacija cvijeća

3. Predviđanje cijene kuće u Bostonu

Još jedan dobro poznat skup podataka za početnike u mašinskom učenju je Boston Housing podaci. Njegov cilj je predviđanje vrijednosti kuća u raznim bostonskim četvrtima. Uključuje vitalne statistike kao što su starost, stopa poreza na imovinu, stopa kriminala, pa čak i blizina centara za zapošljavanje, a sve to može uticati na cijene stanova.

Skup podataka je jednostavan i sićušan, što ga čini lakim za eksperimentiranje za početnike. Da bi se otkrilo koji faktori utječu na cijenu nekretnine u Bostonu, regresijske tehnike se intenzivno koriste za različite parametre. To je odlično mjesto za vježbanje tehnika regresije i procjenu koliko dobro rade.

Predviđanje cijene kuće u Bostonu

4. Ispitivanje kvaliteta vina

Vino je neobično alkoholno piće za koje su potrebne godine fermentacije. Kao rezultat toga, antikna boca vina je skupo i kvalitetno vino. Odabir idealne boce vina zahtijeva godine znanja o degustaciji vina, a to može biti proces hit-or-miss.

Projekt ispitivanja kvaliteta vina ocjenjuje vina korištenjem fizičko-hemijskih testova kao što su nivo alkohola, fiksna kiselost, gustina, pH i drugi faktori. Projekt također utvrđuje kriterije kvalitete i količine vina. Kao rezultat toga, kupovina vina postaje laka.

Kvalitet vina

5. Predviđanje berze

Ova inicijativa je intrigantna da li radite u finansijskom sektoru ili ne. Podatke o berzi opsežno proučavaju akademici, preduzeća, pa čak i kao izvor sekundarnog prihoda. Sposobnost naučnika podataka da proučava i istražuje podatke vremenskih serija je takođe od vitalnog značaja. Podaci sa berze su odlično mesto za početak.

Suština nastojanja je da se predvidi buduća vrijednost dionice. Ovo se zasniva na trenutnim tržišnim performansama, kao i na statistikama iz prethodnih godina. Kaggle prikuplja podatke o NIFTY-50 indeksu od 2000. godine, a trenutno se ažurira sedmično. Od 1. januara 2000. sadrži cijene akcija za preko 50 organizacija.

Predviđanje berze

6. Movie Recommendation

Siguran sam da ste imali taj osjećaj nakon što ste pogledali dobar film. Jeste li ikada osjetili poriv da uzburkate svoja čula gledanjem sličnih filmova?

Znamo da su OTT usluge kao što je Netflix značajno poboljšale svoje sisteme preporuka. Kao student mašinskog učenja, moraćete da razumete kako takvi algoritmi ciljaju klijente na osnovu njihovih preferencija i recenzija.

IMDB skup podataka na Kaggleu je vjerovatno jedan od najkompletnijih, omogućavajući modele preporuka da se zaključi na osnovu naslova filma, ocjene korisnika, žanra i drugih faktora. To je također odlična metoda za učenje o filtriranju zasnovanom na sadržaju i inženjeringu karakteristika.

Moview Recommendation

7. Predviđanje podobnosti učitavanja

Svijet se vrti oko kredita. Najveći izvor profita banaka potiče od kamata na kredite. Stoga su oni njihov osnovni posao.

Pojedinci ili grupe pojedinaca mogu samo proširiti ekonomiju ulaganjem novca u firmu u nadi da će joj u budućnosti povećati vrijednost. Ponekad je važno tražiti zajam da biste mogli preuzeti rizike ove prirode, pa čak i sudjelovati u određenim svjetskim zadovoljstvima.

Prije nego što se zajam prihvati, banke obično moraju slijediti prilično strog proces. Kako su zajmovi tako ključni aspekt života mnogih ljudi, predviđanje podobnosti za kredit za koji se neko prijavi bilo bi izuzetno korisno, omogućavajući bolje planiranje nakon prihvatanja ili odbijanja kredita.

Predviđanje prihvatljivosti opterećenja

8. Analiza raspoloženja pomoću Twitter podataka

Hvala za mreže društvenih medija poput Twittera, Facebooka i Reddita, ekstrapolacija mišljenja i trendova je postala prilično laka. Ove informacije se koriste za uklanjanje mišljenja o događajima, ljudima, sportu i drugim temama. Inicijative za strojno učenje vezane za rudarenje mišljenja primjenjuju se u različitim okruženjima, uključujući političke kampanje i procjene proizvoda Amazona.

Ovaj projekat će izgledati fantastično u vašem portfoliju! Za detekciju emocija i analizu zasnovanu na aspektu, tehnike kao što su mašine za vektore podrške, regresija i klasifikacioni algoritmi mogu se u velikoj meri koristiti (pronalaženje činjenica i mišljenja).

9. Predviđanje buduće prodaje

Velike B2C kompanije i trgovci žele znati koliko će se svaki proizvod u njihovom inventaru prodati. Predviđanje prodaje pomaže vlasnicima preduzeća da odrede za kojim artiklima postoji velika potražnja. Precizno predviđanje prodaje značajno će smanjiti gubitak, a istovremeno će odrediti inkrementalni uticaj na buduće budžete.

Trgovci na malo kao što su Walmart, IKEA, Big Basket i Big Bazaar koriste predviđanje prodaje za procjenu potražnje za proizvodima. Morate biti upoznati s različitim tehnikama čišćenja neobrađenih podataka da biste napravili takve ML projekte. Takođe, potrebno je dobro poznavanje regresione analize, posebno jednostavne linearne regresije.

Za ove vrste zadataka, morat ćete koristiti biblioteke kao što su Dora, Scrubadub, Pandas, NumPy i druge.

Predviđanje buduće prodaje

10. Detekcija lažnih vijesti

To je još jedan najsavremeniji pokušaj mašinskog učenja namenjen školskoj deci. Lažne vijesti se šire poput požara, kao što svi znamo. Sve je dostupno na društvenim mrežama, od povezivanja pojedinaca do čitanja dnevnih vijesti.

Kao rezultat toga, otkrivanje lažnih vijesti ovih dana postaje sve teže. Mnoge velike društvene mreže, kao što su Facebook i Twitter, već imaju algoritme za otkrivanje lažnih vijesti u objavama i feedovima.

Da bi se identifikovale lažne vesti, ovoj vrsti ML projekta potrebno je detaljno razumevanje višestrukih NLP pristupa i klasifikacionih algoritama (pasivno agresivni klasifikator ili naivni Bayesov klasifikator).

Detekcija lažnih vijesti

11. Predviđanje kupovine kupona

Kupci sve više razmišljaju o kupovini putem interneta kada je koronavirus napao planetu 2020. godine. Kao rezultat toga, trgovački objekti bili su primorani da prebace svoje poslovanje na internet.

Kupci, s druge strane, i dalje traže odlične ponude, baš kao i u trgovinama, i sve više traže super-štedljive kupone. Postoje čak i web stranice posvećene kreiranju kupona za takve klijente. Možete naučiti o rudarenju podataka u mašinskom učenju, izradi trakastih grafikona, tortnih dijagrama i histograma za vizualizaciju podataka i inženjering karakteristika pomoću ovog projekta.

Da biste generirali predviđanja, također možete pogledati pristupe imputacije podataka za upravljanje NA vrijednostima i kosinusnom sličnošću varijabli.

Predviđanje kupovine kupona

12. Predviđanje odljeva kupaca

Potrošači su najvažnija imovina kompanije i njihovo očuvanje je od vitalnog značaja za svako poslovanje koje ima za cilj povećanje prihoda i izgradnju dugoročnih smislenih veza s njima.

Nadalje, trošak sticanja novog klijenta je pet puta veći od troškova održavanja postojećeg. Odljev/odbacivanje kupaca je dobro poznati poslovni problem u kojem kupci ili pretplatnici prestaju poslovati sa uslugom ili kompanijom.

U idealnom slučaju, oni više neće biti klijent koji plaća. Kupac se smatra odbačenim ako je prošlo određeno vrijeme od posljednje interakcije kupca s kompanijom. Utvrđivanje da li će klijent odustati, kao i brzo davanje relevantnih informacija usmjerenih na zadržavanje kupaca, ključni su za smanjenje odljeva.

Naš mozak nije u stanju da predvidi promet kupaca za milione klijenata; evo gdje mašinsko učenje može pomoći.

Predviđanje odljeva kupaca

13. Wallmart predviđanje prodaje

Jedna od najistaknutijih primjena mašinskog učenja je predviđanje prodaje, koje uključuje otkrivanje karakteristika koje utiču na prodaju proizvoda i predviđanje budućeg obima prodaje.

Walmart skup podataka, koji sadrži podatke o prodaji sa 45 lokacija, koristi se u ovoj studiji mašinskog učenja. Prodaja po prodavnici, po kategorijama, na sedmičnoj bazi je uključena u skup podataka. Svrha ovog projekta mašinskog učenja je da predvidi prodaju za svako odeljenje u svakom prodajnom mestu kako bi oni mogli da donesu bolju optimizaciju kanala zasnovanu na podacima i odluke o planiranju zaliha.

Rad s Walmart skupom podataka je težak jer sadrži odabrane događaje smanjenja vrijednosti koji imaju utjecaj na prodaju i treba ih uzeti u obzir.

Walmart Sales Forcasting

14. Uber analiza podataka

Kada je riječ o implementaciji i integraciji strojnog učenja i dubokog učenja u njihove aplikacije, popularna usluga dijeljenja vožnje ne zaostaje mnogo. Svake godine obrađuje milijarde putovanja, omogućavajući putnicima da putuju u bilo koje doba dana ili noći.

Budući da ima tako veliku bazu klijenata, potrebna mu je izuzetna korisnička usluga kako bi se što prije riješile žalbe potrošača.

Uber ima skup podataka od miliona preuzimanja koje može koristiti za analizu i prikaz putovanja klijenata kako bi otkrio uvide i poboljšao korisničko iskustvo.

Uber analiza podataka

15. Covid-19 analiza

COVID-19 je danas zahvatio svijet, i to ne samo u smislu pandemije. Dok se medicinski stručnjaci koncentrišu na stvaranje efikasnih vakcina i imunizaciju svijeta, naučnici za podatke ne zaostaju mnogo.

Novi slučajevi, dnevno aktivno prebrojavanje, smrtni slučajevi i statistika testiranja se objavljuju. Prognoze se izrađuju na dnevnoj bazi na osnovu izbijanja SARS-a iz prošlog stoljeća. Za ovo možete koristiti regresijsku analizu i podržati modele predviđanja zasnovane na vektorskim mašinama.

Covid 19 analiza

zaključak

Da rezimiramo, raspravljali smo o nekim od najboljih ML projekata koji će vam pomoći u testiranju programiranja strojnog učenja, kao i da shvatite njegove ideje i implementaciju. Poznavanje kako da integrišete mašinsko učenje može vam pomoći da napredujete u svojoj profesiji dok tehnologija preuzima maha u svakoj industriji.

Dok učite mašinsko učenje, preporučujemo da vježbate svoje koncepte i napišete sve svoje algoritme. Pisanje algoritama tokom učenja važnije je od izvođenja projekta, a također vam pruža prednost u pravilnom razumijevanju predmeta.

15 najboljih projekata mašinskog učenja za početnike

1. titanski

2. Irska klasifikacija cvijeća

3. Predviđanje cijene kuće u Bostonu

4. Ispitivanje kvaliteta vina

5. Predviđanje berze

6. Movie Recommendation

7. Predviđanje podobnosti učitavanja

8. Analiza raspoloženja pomoću Twitter podataka

9. Predviđanje buduće prodaje

10. Detekcija lažnih vijesti

11. Predviđanje kupovine kupona

12. Predviđanje odljeva kupaca

13. Wallmart predviđanje prodaje

14. Uber analiza podataka

15. Covid-19 analiza

zaključak

Oko kreja

Više članaka na HashDork-u:

Učenje s pojačanjem: AI koja uči na svojim greškama

Top 10 MLOps alata za učenje

Uvod u tematsko modeliranje za početnike

5 vještina koje morate imati za inženjere mašinskog učenja

Ovaj bilten o tehnologiji budućnosti nije loš

15 najboljih projekata mašinskog učenja za početnike

1. titanski

2. Irska klasifikacija cvijeća

3. Predviđanje cijene kuće u Bostonu

4. Ispitivanje kvaliteta vina

5. Predviđanje berze

6. Movie Recommendation

7. Predviđanje podobnosti učitavanja

8. Analiza raspoloženja pomoću Twitter podataka

9. Predviđanje buduće prodaje

10. Detekcija lažnih vijesti

11. Predviđanje kupovine kupona

12. Predviđanje odljeva kupaca

13. Wallmart predviđanje prodaje

14. Uber analiza podataka

15. Covid-19 analiza

zaključak

Oko kreja

Više članaka na HashDork-u:

Učenje s pojačanjem: AI koja uči na svojim greškama

Top 10 MLOps alata za učenje

Uvod u tematsko modeliranje za početnike

5 vještina koje morate imati za inženjere mašinskog učenja

Reader Interakcije

Ostavite odgovor Odustani od odgovora

Ovaj bilten o tehnologiji budućnosti nije loš