Pregled sadržaja[Sakriti][Pokazati]
- 1. titanski
- 2. Klasifikacija irskog cvijeća
- 3. Predviđanje cijene kuće u Bostonu
- 4. Ispitivanje kvalitete vina
- 5. Predviđanje tržišta dionica
- 6. Preporuka filma
- 7. Predviđanje prihvatljivosti opterećenja
- 8. Analiza osjećaja pomoću Twitter podataka
- 9. Predviđanje buduće prodaje
- 10. Detekcija lažnih vijesti
- 11. Predviđanje kupnje kupona
- 12. Predviđanje odljeva kupaca
- 13. Wallmart predviđanje prodaje
- 14. Uberova analiza podataka
- 15. Analiza Covid-19
- Zaključak
Strojno učenje je jednostavna studija o tome kako educirati računalni program ili algoritam za postupno poboljšanje na određenom poslu predstavljenom na visokoj razini. Identifikacija slika, otkrivanje prijevara, sustavi preporuka i druge aplikacije za strojno učenje već su se pokazale popularnima.
ML poslovi čine ljudski rad jednostavnim i učinkovitim, štedeći vrijeme i osiguravajući visokokvalitetne rezultate. Čak i Google, najpopularnija svjetska tražilica, koristi stroj za učenje.
Od analize korisničkog upita i izmjene rezultata na temelju rezultata do prikazivanja trendovskih tema i oglasa u odnosu na upit, na raspolaganju su razne opcije.
Tehnologija koja je i perceptivna i samoispravljajuća nije daleko u budućnosti.
Jedan od najboljih načina za početak je prakticiranje i dizajniranje projekta. Stoga smo sastavili popis od 15 najboljih projekata strojnog učenja za početnike kako biste mogli započeti.
1. Titanski
Ovo se često smatra jednim od najvećih i najugodnijih zadataka za svakoga tko želi saznati više o strojnom učenju. Izazov Titanic popularan je projekt strojnog učenja koji također služi kao dobar način da se upoznate s platformom za znanost podataka Kaggle. Skup podataka Titanica sastoji se od autentičnih podataka o potonuću nesretnog broda.
Uključuje pojedinosti kao što su dob osobe, socioekonomski status, spol, broj kabine, luka polaska i, što je najvažnije, jesu li preživjeli!
Utvrđeno je da tehnika K-najbližeg susjeda i klasifikator stabla odlučivanja daju najbolje rezultate za ovaj projekt. Ako tražite brzi vikend izazov da poboljšate svoje Sposobnosti strojnog učenja, ovaj na Kaggleu je za vas.
2. Klasifikacija irskog cvijeća
Početnici vole projekt kategorizacije cvijeta irisa i to je sjajno mjesto za početak ako ste tek počeli s strojnim učenjem. Duljina sepala i latica razlikuje cvjetove irisa od drugih vrsta. Svrha ovog projekta je razdvojiti cvjetove u tri vrste: Virginia, setosa i Versicolor.
Za vježbe klasifikacije, projekt koristi skup podataka cvijeta perunike, koji pomaže učenicima u učenju osnova rada s brojčanim vrijednostima i podacima. Skup podataka cvijeta irisa malen je koji se može pohraniti u memoriju bez potrebe za skaliranjem.
3. Predviđanje cijene kuća u Bostonu
Još jedan dobro poznat skup podataka za početnike u strojnom učenju je Boston Housing podaci. Njegov je cilj predviđanje vrijednosti kuća u raznim bostonskim četvrtima. Uključuje vitalne statistike kao što su dob, stopa poreza na imovinu, stopa kriminala, pa čak i blizina centara za zapošljavanje, a sve to može utjecati na cijene stanova.
Skup podataka je jednostavan i sićušan, što ga početnicima čini jednostavnim za eksperimentiranje. Kako bi se otkrilo koji čimbenici utječu na cijenu nekretnine u Bostonu, regresijske tehnike se intenzivno koriste na različitim parametrima. To je sjajno mjesto za vježbanje tehnika regresije i procjenu koliko dobro rade.
4. Ispitivanje kvalitete vina
Vino je neobično alkoholno piće koje zahtijeva godine fermentacije. Kao rezultat toga, starinska boca vina je skupo i kvalitetno vino. Odabir idealne boce vina zahtijeva godine znanja o kušanju vina, a to može biti proces hit-or-miss.
Projekt ispitivanja kvalitete vina ocjenjuje vina pomoću fizikalno-kemijskih testova kao što su razina alkohola, fiksna kiselost, gustoća, pH i drugi čimbenici. Projekt također utvrđuje kriterije kvalitete i količine vina. Kao rezultat toga, kupnja vina postaje povjetarac.
5. Predviđanje tržišta dionica
Ova inicijativa je intrigantna bez obzira radite li ili ne u financijskom sektoru. Podatke o burzi opsežno proučavaju akademici, poduzeća, pa čak i kao izvor sekundarnog prihoda. Sposobnost podatkovnog znanstvenika da proučava i istražuje podatke vremenskih serija također je od vitalnog značaja. Podaci s burze izvrsno su mjesto za početak.
Bit nastojanja je predvidjeti buduću vrijednost dionice. To se temelji na trenutnom tržišnom učinku, kao i na statistikama iz prethodnih godina. Kaggle prikuplja podatke o indeksu NIFTY-50 od 2000. godine, a trenutno se ažurira tjedno. Od 1. siječnja 2000. sadrži cijene dionica za preko 50 organizacija.
6. Preporuka za film
Siguran sam da ste imali taj osjećaj nakon što ste pogledali dobar film. Jeste li ikada osjetili poriv da razdražite svoja osjetila gledajući slične filmove?
Znamo da su OTT usluge kao što je Netflix značajno poboljšale svoje sustave preporuka. Kao student strojnog učenja, morat ćete razumjeti kako takvi algoritmi ciljaju klijente na temelju njihovih preferencija i recenzija.
IMDB skup podataka na Kaggleu vjerojatno je jedan od najcjelovitijih, što omogućuje da se modeli preporuka mogu zaključiti na temelju naslova filma, ocjene korisnika, žanra i drugih čimbenika. To je također izvrsna metoda za učenje o filtriranju na temelju sadržaja i inženjerstvu značajki.
7. Predviđanje prihvatljivosti opterećenja
Svijet se vrti oko kredita. Najveći izvor dobiti banaka dolazi od kamata na kredite. Stoga su oni njihov temeljni posao.
Pojedinci ili grupe pojedinaca mogu samo proširiti gospodarstva ulaganjem novca u tvrtku u nadi da će joj u budućnosti povećati vrijednost. Ponekad je važno tražiti zajam da biste mogli preuzeti rizike ove prirode, pa čak i sudjelovati u određenim svjetovnim zadovoljstvima.
Prije nego što se zajam prihvati, banke obično moraju slijediti prilično strogi postupak. Kako su zajmovi tako ključni aspekt života mnogih ljudi, predviđanje podobnosti za zajam za koji se netko prijavi bilo bi izuzetno korisno, omogućujući bolje planiranje nakon prihvaćanja ili odbijanja zajma.
8. Analiza osjećaja pomoću podataka s Twittera
Zahvaljujući mreže društvenih medija poput Twittera, Facebooka i Reddita, ekstrapoliranje mišljenja i trendova postalo je znatno jednostavno. Ove informacije se koriste za uklanjanje mišljenja o događajima, ljudima, sportu i drugim temama. Inicijative strojnog učenja povezane s rudarenjem mišljenja primjenjuju se u raznim okruženjima, uključujući političke kampanje i procjene proizvoda Amazona.
Ovaj će projekt izgledati fantastično u vašem portfelju! Za otkrivanje emocija i analizu temeljenu na aspektu, tehnike kao što su strojevi vektora podrške, regresija i klasifikacijski algoritmi mogu se uvelike koristiti (pronalaženje činjenica i mišljenja).
9. Predviđanje buduće prodaje
Velike B2C tvrtke i trgovci žele znati koliko će se svaki proizvod u njihovom inventaru prodati. Predviđanje prodaje pomaže vlasnicima tvrtki u određivanju za kojim artiklima postoji velika potražnja. Točno predviđanje prodaje značajno će smanjiti gubitak, a također će odrediti inkrementalni utjecaj na buduće proračune.
Trgovci na malo kao što su Walmart, IKEA, Big Basket i Big Bazaar koriste predviđanje prodaje za procjenu potražnje za proizvodima. Morate biti upoznati s raznim tehnikama čišćenja neobrađenih podataka kako biste izradili takve ML projekte. Također, potrebno je dobro razumijevanje regresijske analize, posebno jednostavne linearne regresije.
Za ove vrste zadataka morat ćete koristiti knjižnice kao što su Dora, Scrubadub, Pandas, NumPy i druge.
10. Detekcija lažnih vijesti
To je još jedan vrhunski napor strojnog učenja namijenjen školarcima. Lažne vijesti se šire poput požara, kao što svi znamo. Sve je dostupno na društvenim mrežama, od povezivanja pojedinaca do čitanja dnevnih vijesti.
Kao rezultat toga, otkrivanje lažnih vijesti postaje sve teže ovih dana. Mnoge velike društvene mreže, kao što su Facebook i Twitter, već imaju algoritme za otkrivanje lažnih vijesti u objavama i feedovima.
Kako bi se identificirale lažne vijesti, ova vrsta ML projekta treba temeljito razumijevanje višestrukih NLP pristupa i klasifikacijskih algoritama (PassiveAggressiveClassifier ili Naive Bayes klasifikator).
11. Predviđanje kupnje kupona
Kupci sve više razmišljaju o kupnji putem interneta kada je koronavirus napao planet 2020. godine. Kao rezultat toga, trgovački objekti bili su prisiljeni prebaciti svoje poslovanje na internet.
Kupci, s druge strane, i dalje traže izvrsne ponude, baš kao i u trgovinama, i sve više traže super-štedljive kupone. Postoje čak i web stranice posvećene izradi kupona za takve klijente. Uz ovaj projekt možete naučiti o rudarenju podataka u strojnom učenju, izradi stupčastih grafikona, tortnih grafikona i histograma za vizualizaciju podataka i inženjering značajki.
Da biste generirali predviđanja, također možete pogledati pristupe imputacije podataka za upravljanje NA vrijednostima i kosinusnom sličnošću varijabli.
12. Predviđanje odljeva kupaca
Potrošači su najvažnija imovina tvrtke, a njihovo očuvanje je od vitalnog značaja za svako poslovanje s ciljem povećanja prihoda i izgradnje dugoročnih smislenih veza s njima.
Nadalje, trošak stjecanja novog klijenta pet je puta veći od troškova održavanja postojećeg. Odljev/opadanje kupaca je dobro poznati poslovni problem u kojem kupci ili pretplatnici prestaju poslovati s uslugom ili tvrtkom.
Idealno bi bilo da više neće biti kupac koji plaća. Kupac se smatra odbačenim ako je prošlo određeno vrijeme od posljednje interakcije kupca s tvrtkom. Utvrđivanje hoće li klijent odustati, kao i brzo davanje relevantnih informacija usmjerenih na zadržavanje kupaca, ključni su za smanjenje odljeva.
Naš mozak nije u stanju predvidjeti promet kupaca za milijune klijenata; ovdje može pomoći strojno učenje.
13. Wallmart predviđanje prodaje
Jedna od najistaknutijih primjena strojnog učenja je predviđanje prodaje, koje uključuje otkrivanje karakteristika koje utječu na prodaju proizvoda i predviđanje budućeg obujma prodaje.
Walmartov skup podataka, koji sadrži podatke o prodaji s 45 lokacija, koristi se u ovoj studiji strojnog učenja. Prodaja po trgovini, po kategorijama, na tjednoj bazi uključena je u skup podataka. Svrha ovog projekta strojnog učenja je predvidjeti prodaju za svaki odjel u svakoj poslovnici kako bi mogli donijeti bolju optimizaciju kanala na temelju podataka i odluke o planiranju zaliha.
Rad s Walmartovim skupom podataka je težak jer sadrži odabrane događaje smanjenja vrijednosti koji utječu na prodaju i treba ih uzeti u obzir.
14. Uberova analiza podataka
Kada je riječ o implementaciji i integraciji strojnog učenja i dubokog učenja u njihove aplikacije, popularna usluga dijeljenja vožnje ne zaostaje mnogo. Svake godine obrađuje milijarde putovanja, omogućujući putnicima da putuju u bilo koje doba dana ili noći.
Budući da ima tako veliku bazu klijenata, potrebna mu je iznimna korisnička usluga kako bi se što prije riješile pritužbe potrošača.
Uber ima skup podataka od milijuna preuzimanja koje može koristiti za analizu i prikaz putovanja klijenata kako bi otkrio uvide i poboljšao korisničko iskustvo.
15. Analiza Covid-19
COVID-19 je danas zahvatio svijet, i to ne samo u smislu pandemije. Dok se medicinski stručnjaci koncentriraju na stvaranje učinkovitih cijepljenja i imunizaciju svijeta, znanstvenici podataka ne zaostaju daleko.
Novi slučajevi, dnevno aktivno prebrojavanje, smrtni slučajevi i statistika testiranja se objavljuju. Prognoze se izrađuju na dnevnoj bazi na temelju izbijanja SARS-a iz prošlog stoljeća. Za to možete koristiti regresijsku analizu i podržati modele predviđanja temeljene na vektoru.
Zaključak
Ukratko, raspravljali smo o nekim od najboljih ML projekata koji će vam pomoći u testiranju programiranja strojnog učenja, kao i u razumijevanju njegovih ideja i implementacije. Znati kako integrirati strojno učenje može vam pomoći da napredujete u svojoj profesiji dok tehnologija preuzima maha u svakoj industriji.
Dok učite strojno učenje, preporučujemo da vježbate svoje koncepte i napišete sve svoje algoritme. Pisanje algoritama tijekom učenja važnije je od izvođenja projekta, a također vam daje prednost u pravilnom razumijevanju predmeta.
Ostavi odgovor