Top 15 maskinlæringsprojekter for begyndere

Indholdsfortegnelse[Skjule][At vise]

1. Titanic
2. Klassificering af irske blomster
3. Forudsigelse af Boston huspris
4. Test af vinkvalitet
5. Aktiemarkedsforudsigelse
6. Filmanbefaling
7. Forudsigelse af indlæsningsberettigelse
8. Følelsesanalyse ved hjælp af Twitter-data
9. Fremtidig salgsforudsigelse
10. Opdagelse af falske nyheder
11. Kuponkøbsforudsigelse
12. Forudsigelse af kundeafgang
13. Wallmart-salgsprognoser
14. Uber Data Analyse
15. Covid-19 Analyse
Konklusion

Machine learning er en simpel undersøgelse af, hvordan man uddanner et computerprogram eller en algoritme til gradvist at forbedre et specifikt job, der præsenteres på et højt niveau. Billedidentifikation, svindeldetektion, anbefalingssystemer og andre maskinlæringsapplikationer har allerede vist sig at være populære.

ML-job gør menneskeligt arbejde enkelt og effektivt, sparer tid og sikrer et resultat af høj kvalitet. Selv Google, verdens mest populære søgemaskine, bruger machine learning.

Fra at analysere brugerens forespørgsel og ændre resultatet baseret på resultaterne til at vise trending emner og annoncer i forhold til forespørgslen, er der en række muligheder tilgængelige.

Teknologi, der er både opfattende og selvkorrigerende, er ikke langt væk i fremtiden.

En af de bedste måder at komme i gang på er at komme i gang og designe et projekt. Derfor har vi samlet en liste over 15 top maskinlæringsprojekter for begyndere for at komme i gang.

1. Titanic

Dette anses ofte for at være en af de største og mest underholdende opgaver for alle, der er interesseret i at lære mere om maskinlæring. Titanic-udfordringen er et populært maskinlæringsprojekt, der også fungerer som en god måde at stifte bekendtskab med Kaggles datavidenskabsplatform. Titanic-datasættet består af ægte data fra forliset af det skæbnesvangre skib.

Det inkluderer detaljer såsom personens alder, socioøkonomiske status, køn, kahytsnummer, afgangshavn og, vigtigst af alt, om de overlevede!

K-Nearest Neighbor-teknikken og beslutningstræklassificeringen var fast besluttet på at producere de bedste resultater for dette projekt. Hvis du leder efter en hurtig weekendudfordring til at forbedre din Machine Learning evner, denne på Kaggle er til dig.

Titanic

2. Klassificering af irske blomster

Begyndere elsker kategoriseringsprojektet for irisblomster, og det er et godt sted at starte, hvis du er ny inden for maskinlæring. Længden af bægerblade og kronblade adskiller irisblomster fra andre arter. Dette projekts formål er at adskille blomstringen i tre arter: Virginia, setosa og Versicolor.

Til klassificeringsøvelser anvender projektet Iris-blomstdatasættet, som hjælper eleverne med at lære det grundlæggende i at håndtere numeriske værdier og data. Irisblomstdatasættet er et lille, der kan gemmes i hukommelsen uden behov for skalering.

Klassificering af irske blomster

3. Forudsigelse af Boston huspris

En anden velkendt datasæt til begyndere inden for maskinlæring er Boston Housing-data. Dens mål er at forudsige boligværdier i forskellige Boston-kvarterer. Det inkluderer vitale statistikker såsom alder, ejendomsskattesats, kriminalitetsrate og endda nærhed til jobcentre, som alle kan påvirke boligpriserne.

Datasættet er enkelt og lille, hvilket gør det nemt at eksperimentere med for nybegyndere. For at finde ud af, hvilke faktorer der påvirker ejendomsprisen i Boston, er regressionsteknikker stærkt anvendt på forskellige parametre. Det er et godt sted at øve regressionsteknikker og vurdere, hvor godt de virker.

Forudsigelse af Boston huspris

4. Test af vinkvalitet

Vin er en usædvanlig alkoholisk drik, der kræver flere års gæring. Som et resultat er den antikke flaske vin en dyr vin af høj kvalitet. At vælge den ideelle flaske vin kræver mange års viden om vinsmagning, og det kan være en hit-eller-miss-proces.

Vinkvalitetstestprojektet evaluerer vine ved hjælp af fysisk-kemiske tests såsom alkoholniveau, fast surhedsgrad, massefylde, pH og andre faktorer. Projektet fastlægger også vinens kvalitetskriterier og mængder. Som et resultat bliver vinindkøb en leg.

Vin kvalitet

5. Aktiemarkedsforudsigelse

Dette initiativ er spændende, uanset om du arbejder i den finansielle sektor eller ej. Aktiemarkedsdata studeres indgående af akademikere, virksomheder og endda som en kilde til sekundær indkomst. En dataforskers evne til at studere og udforske tidsseriedata er også afgørende. Data fra aktiemarkedet er et godt sted at starte.

Essensen af bestræbelsen er at forudsige den fremtidige værdi af en aktie. Dette er baseret på aktuelle markedsresultater samt statistikker fra tidligere år. Kaggle har indsamlet data om NIFTY-50-indekset siden 2000, og det opdateres i øjeblikket ugentligt. Siden 1. januar 2000 har den indeholdt aktiekurser for over 50 organisationer.

Aktiemarkedsforudsigelse

6. Filmanbefaling

Jeg er sikker på, at du har haft den følelse efter at have set en god film. Har du nogensinde følt impulsen til at pirre dine sanser ved at binge-se lignende film?

Vi ved, at OTT-tjenester som Netflix har forbedret deres anbefalingssystemer markant. Som maskinlæringsstuderende skal du forstå, hvordan sådanne algoritmer målretter kunder baseret på deres præferencer og anmeldelser.

IMDB-datasættet på Kaggle er sandsynligvis et af de mest komplette, hvilket gør det muligt at udlede anbefalingsmodeller baseret på filmens titel, kundevurdering, genre og andre faktorer. Det er også en fremragende metode til at lære om indholdsbaseret filtrering og funktionsteknik.

Moview-anbefaling

7. Indlæs kvalifikationsforudsigelse

Verden kredser om lån. Bankernes største profitkilde kommer fra renter på lån. Derfor er de deres grundlæggende virksomhed.

Enkeltpersoner eller grupper af individer kan kun udvide økonomier ved at investere penge i en virksomhed i håb om at se den stige i værdi i fremtiden. Det er nogle gange vigtigt at søge et lån for at kunne tage risici af denne art og endda deltage i visse verdslige fornøjelser.

Inden et lån kan accepteres, har banker normalt en ret stram proces at følge. Da lån er så afgørende et aspekt af mange menneskers liv, ville det være yderst fordelagtigt at forudsige berettigelse til et lån, som nogen ansøger om, hvilket giver mulighed for bedre planlægning ud over det lån, der bliver accepteret eller afvist.

Indlæs elligbilitetsforudsigelse

8. Sentimentanalyse ved hjælp af Twitter-data

Tak til sociale medienetværk ligesom Twitter, Facebook og Reddit er det blevet betydeligt nemt at ekstrapolere meninger og tendenser. Disse oplysninger bruges til at fjerne meninger om begivenheder, mennesker, sport og andre emner. Opinionsmining-relaterede maskinlæringsinitiativer anvendes i en række forskellige sammenhænge, herunder politiske kampagner og Amazon-produktevalueringer.

Dette projekt vil se fantastisk ud i din portefølje! Til følelsesdetektering og aspektbaseret analyse kan teknikker såsom støttevektormaskiner, regression og klassifikationsalgoritmer bruges i vid udstrækning (finde fakta og meninger).

9. Forudsigelse af fremtidigt salg

Store B2C-virksomheder og handlende ønsker at vide, hvor meget hvert produkt i deres lager vil sælge. Salgsprognose hjælper virksomhedsejere med at afgøre, hvilke varer der er i høj efterspørgsel. Nøjagtige salgsprognoser vil reducere spild markant, samtidig med at det bestemmer den trinvise indvirkning på fremtidige budgetter.

Forhandlere som Walmart, IKEA, Big Basket og Big Bazaar bruger salgsprognoser til at estimere produktefterspørgslen. Du skal være bekendt med forskellige teknikker til at rense rådata for at kunne konstruere sådanne ML-projekter. Også en god forståelse af regressionsanalyse, især simpel lineær regression, er påkrævet.

Til denne slags opgaver skal du bruge biblioteker som Dora, Scrubadub, Pandas, NumPy og andre.

Forudsigelse af fremtidigt salg

10. Detektion af falske nyheder

Det er endnu en banebrydende maskinlæringsindsats rettet mod skolebørn. Falske nyheder spreder sig som en steppebrand, som vi alle ved. Alt er tilgængeligt på sociale medier, lige fra at forbinde enkeltpersoner til at læse de daglige nyheder.

Som et resultat er det blevet stadig sværere at opdage falske nyheder i disse dage. Mange store sociale medier, såsom Facebook og Twitter, har allerede algoritmer på plads til at opdage falske nyheder i opslag og feeds.

For at identificere falske nyheder har denne type ML-projekt brug for en grundig forståelse af flere NLP-tilgange og klassifikationsalgoritmer (PassiveAggressiveClassifier eller Naive Bayes classifier).

Detektion af falske nyheder

11. Forudsigelse af kuponkøb

Kunder overvejer i stigende grad at købe online, da coronavirus angreb planeten i 2020. Som følge heraf er indkøbsvirksomheder blevet tvunget til at flytte deres forretning online.

Kunder på den anden side søger stadig gode tilbud, ligesom de var i butikkerne, og jagter i stigende grad efter superbesparende kuponer. Der er endda websteder dedikeret til at skabe kuponer til sådanne kunder. Du kan lære om datamining i maskinlæring, fremstilling af søjlediagrammer, cirkeldiagrammer og histogrammer for at visualisere data og funktionsteknik med dette projekt.

For at generere forudsigelser kan du også se på dataimputeringstilgange til styring af NA-værdier og cosinus-lighed mellem variabler.

Forudsigelse af kuponkøb

12. Forudsigelse af kundeafgang

Forbrugerne er en virksomheds vigtigste aktiv, og at beholde dem er afgørende for enhver virksomhed, der sigter mod at øge omsætningen og opbygge langsigtede meningsfulde forbindelser med dem.

Desuden er omkostningerne ved at erhverve en ny kunde fem gange højere end omkostningerne ved at opretholde en eksisterende. Customer Churn/Attrition er et velkendt forretningsproblem, hvor kunder eller abonnenter holder op med at handle med en tjeneste eller en virksomhed.

De vil ideelt set ikke længere være en betalende kunde. En kunde anses for at være afbrudt, hvis det har været et bestemt stykke tid, siden kunden sidst interagerede med virksomheden. At identificere, om en klient vil churn, samt hurtigt at give relevant information rettet mod kundefastholdelse, er afgørende for at sænke churn.

Vores hjerner er ude af stand til at forudse kundeomsætning for millioner af kunder; her kan maskinlæring hjælpe.

Forudsigelse af kundeafgang

13. Wallmart salgsprognoser

En af de mest fremtrædende anvendelser af maskinlæring er salgsprognoser, som involverer detektering af egenskaber, der påvirker produktsalget, og foregribelse af fremtidig salgsvolumen.

Walmart-datasættet, som indeholder salgsdata fra 45 lokationer, bruges i denne maskinlæringsundersøgelse. Salg pr. butik, efter kategori, på ugentlig basis er inkluderet i datasættet. Formålet med dette maskinlæringsprojekt er at forudse salget for hver afdeling i hver forretning, så de kan træffe bedre datadrevet kanaloptimering og lagerplanlægningsbeslutninger.

Det er svært at arbejde med Walmart-datasættet, da det indeholder udvalgte markdown-begivenheder, der har en indvirkning på salget og bør overvejes.

Walmart Sales Forcasting

14. Uber dataanalyse

Når det kommer til at implementere og integrere machine learning og deep learning i deres apps, er den populære samkørselstjeneste ikke langt bagefter. Hvert år behandler den milliarder af rejser, hvilket gør det muligt for pendlere at rejse når som helst på dagen eller natten.

Fordi den har så stor en kundebase, har den brug for enestående kundeservice for at behandle forbrugerklager så hurtigt som muligt.

Uber har et datasæt med millioner af afhentninger, som det kan bruge til at analysere og vise klientrejser for at afdække indsigt og forbedre kundeoplevelsen.

Uber dataanalyse

15. Covid-19 analyse

COVID-19 har skyllet over kloden i dag, og ikke blot i betydningen af en pandemi. Mens medicinske eksperter koncentrerer sig om at generere effektive vaccinationer og immunisere verden, data forskere er ikke langt bagud.

Nye tilfælde, daglige aktive tællinger, dødsulykker og teststatistikker bliver alle offentliggjort. Prognoser laves på daglig basis baseret på SARS-udbruddet fra det forrige århundrede. Til dette kan du bruge regressionsanalyse og understøtte vektormaskinebaserede forudsigelsesmodeller.

Covid 19 Analyse

Konklusion

For at opsummere har vi diskuteret nogle af de bedste ML-projekter, der vil hjælpe dig med at teste Machine Learning-programmering samt forstå dens ideer og implementering. At vide, hvordan man integrerer Machine Learning, kan hjælpe dig med at komme videre i dit erhverv, efterhånden som teknologien tager over i alle brancher.

Mens du lærer Machine Learning, anbefaler vi, at du øver dine koncepter og skriver alle dine algoritmer. At skrive algoritmer, mens du lærer, er vigtigere end at udføre et projekt, og det giver dig også en fordel i at forstå emnerne ordentligt.

Top 15 maskinlæringsprojekter for begyndere

1. Titanic

2. Klassificering af irske blomster

3. Forudsigelse af Boston huspris

4. Test af vinkvalitet

5. Aktiemarkedsforudsigelse

6. Filmanbefaling

7. Indlæs kvalifikationsforudsigelse

8. Sentimentanalyse ved hjælp af Twitter-data

9. Forudsigelse af fremtidigt salg

10. Detektion af falske nyheder

11. Forudsigelse af kuponkøb

12. Forudsigelse af kundeafgang

13. Wallmart salgsprognoser

14. Uber dataanalyse

15. Covid-19 analyse

Konklusion

Om Jay

Flere artikler om HashDork:

Forstærkningslæring: AI, der lærer af sine fejl

Top 10 MLOps værktøjer til at lære

Introduktion til emnemodellering for begyndere

5 must-have færdigheder for maskinlæringsingeniører

Dette Future Tech-nyhedsbrev suger ikke

Top 15 maskinlæringsprojekter for begyndere

1. Titanic

2. Klassificering af irske blomster

3. Forudsigelse af Boston huspris

4. Test af vinkvalitet

5. Aktiemarkedsforudsigelse

6. Filmanbefaling

7. Indlæs kvalifikationsforudsigelse

8. Sentimentanalyse ved hjælp af Twitter-data

9. Forudsigelse af fremtidigt salg

10. Detektion af falske nyheder

11. Forudsigelse af kuponkøb

12. Forudsigelse af kundeafgang

13. Wallmart salgsprognoser

14. Uber dataanalyse

15. Covid-19 analyse

Konklusion

Om Jay

Flere artikler om HashDork:

Forstærkningslæring: AI, der lærer af sine fejl

Top 10 MLOps værktøjer til at lære

Introduktion til emnemodellering for begyndere

5 must-have færdigheder for maskinlæringsingeniører

Læser Interaktioner

Giv en kommentar Annuller svar

Dette Future Tech-nyhedsbrev suger ikke