Innehållsförteckning[Dölj][Visa]
- 1. Titanic
- 2. Klassificering av irländska blommor
- 3. Boston House Prisprediktion
- 4. Test av vinkvalitet
- 5. Aktiemarknadsprognos
- 6. Filmrekommendation
- 7. Ladda berättigande förutsägelse
- 8. Sentimentanalys med hjälp av Twitter-data
- 9. Prognos för framtida försäljning
- 10. Upptäckt av falska nyheter
- 11. Förutsägelse av köp av kuponger
- 12. Förutsägelse av kundavgång
- 13. Wallmart-försäljningsprognoser
- 14. Uber Data Analysis
- 15. Covid-19 analys
- Slutsats
Maskininlärning är en enkel studie av hur man utbildar ett datorprogram eller en algoritm för att gradvis förbättra ett specifikt jobb som presenteras på hög nivå. Bildidentifiering, bedrägeriupptäckt, rekommendationssystem och andra maskininlärningsapplikationer har redan visat sig vara populära.
ML-jobb gör mänskligt arbete enkelt och effektivt, sparar tid och säkerställer ett högkvalitativt resultat. Även Google, världens mest populära sökmotor, använder maskininlärning.
Från att analysera användarens fråga och ändra resultatet baserat på resultaten till att visa trendiga ämnen och annonser i relation till frågan, det finns en mängd olika alternativ tillgängliga.
Teknik som är både uppfattande och självkorrigerande ligger inte långt borta i framtiden.
Ett av de bästa sätten att komma igång är att komma igång och designa ett projekt. Därför har vi sammanställt en lista med 15 bästa maskininlärningsprojekt för nybörjare för att komma igång.
1. titanic
Detta anses ofta vara en av de största och roligaste uppgifterna för alla som är intresserade av att lära sig mer om maskininlärning. Titanic-utmaningen är ett populärt maskininlärningsprojekt som också fungerar som ett bra sätt att bekanta sig med Kaggles datavetenskapsplattform. Titanics datauppsättning består av äkta data från förlisningen av det ödesdigra skeppet.
Den innehåller detaljer som personens ålder, socioekonomiska status, kön, hyttnummer, avgångshamn och, viktigast av allt, om de överlevde!
K-Nearest Neighbor-tekniken och beslutsträdsklassificeraren var fast beslutna att ge de bästa resultaten för detta projekt. Om du letar efter en snabb helgutmaning för att förbättra din Maskininlärningsförmåga, den här på Kaggle är för dig.
2. Klassificering av irländska blommor
Nybörjare älskar kategoriseringsprojektet för irisblomma, och det är ett bra ställe att börja om du är ny på maskininlärning. Längden på foderblad och kronblad skiljer irisblomningar från andra arter. Detta projekts syfte är att dela upp blommorna i tre arter: Virginia, setosa och Versicolor.
För klassificeringsövningar använder projektet Iris flower dataset, som hjälper eleverna att lära sig grunderna för att hantera numeriska värden och data. Irisblommadataset är en liten sådan som kan lagras i minnet utan att behöva skalas.
3. Boston House Prisprediktion
En annan välkänd dataset för nybörjare inom maskininlärning är Boston Housing-data. Dess mål är att prognostisera husvärden i olika stadsdelar i Boston. Den innehåller viktig statistik som ålder, fastighetsskattesats, kriminalitet och till och med närhet till arbetsförmedlingar, vilket allt kan påverka bostadsprissättningen.
Datauppsättningen är enkel och liten, vilket gör den enkel att experimentera med för nybörjare. För att ta reda på vilka faktorer som påverkar fastighetspriset i Boston, används regressionstekniker kraftigt på olika parametrar. Det är ett bra ställe att öva på regressionstekniker och bedöma hur väl de fungerar.
4. Test av vinkvalitet
Vin är en ovanlig alkoholhaltig dryck som kräver år av jäsning. Som ett resultat är den antika flaskan vin ett dyrt och högkvalitativt vin. Att välja den perfekta flaskan vin kräver många års kunskap om vinprovning, och det kan vara en hit-eller-miss-process.
Vinkvalitetstestprojektet utvärderar viner med hjälp av fysikalisk-kemiska tester som alkoholhalt, fast surhet, densitet, pH och andra faktorer. Projektet bestämmer även vinets kvalitetskriterier och kvantiteter. Som ett resultat blir vininköp en bris.
5. Aktiemarknadsprognos
Detta initiativ är spännande oavsett om du arbetar inom finanssektorn eller inte. Aktiemarknadsdata studeras omfattande av akademiker, företag och till och med som en sekundär inkomstkälla. En datavetares förmåga att studera och utforska tidsseriedata är också avgörande. Data från aktiemarknaden är ett bra ställe att börja.
Kärnan i strävan är att förutsäga det framtida värdet av en aktie. Detta är baserat på aktuell marknadsutveckling samt statistik från tidigare år. Kaggle har samlat in data om NIFTY-50-indexet sedan 2000, och det uppdateras för närvarande varje vecka. Sedan 1 januari 2000 har den innehållit aktiekurser för över 50 organisationer.
6. Filmrekommendation
Jag är säker på att du har haft den känslan efter att ha sett en bra film. Har du någonsin känt impulsen att pirra dina sinnen genom att titta på liknande filmer?
Vi vet att OTT-tjänster som Netflix har förbättrat sina rekommendationssystem avsevärt. Som maskininlärningsstudent måste du förstå hur sådana algoritmer riktar sig mot kunder baserat på deras preferenser och recensioner.
IMDB-datauppsättningen på Kaggle är sannolikt en av de mest kompletta, vilket gör att rekommendationsmodeller kan härledas utifrån filmtitel, kundbetyg, genre och andra faktorer. Det är också ett utmärkt sätt att lära sig om innehållsbaserad filtrering och funktionsteknik.
7. Ladda berättigande förutsägelse
Världen kretsar kring lån. Bankernas största vinstkälla kommer från räntor på lån. Därför är de deras grundläggande verksamhet.
Individer eller grupper av individer kan bara expandera ekonomier genom att investera pengar i ett företag i hopp om att se det stiga i värde i framtiden. Det är ibland viktigt att söka lån för att kunna ta sådana risker och till och med ta del av vissa världsliga nöjen.
Innan ett lån kan accepteras har bankerna normalt sett en ganska strikt process att följa. Eftersom lån är en så avgörande aspekt av många människors liv, skulle det vara extremt fördelaktigt att förutsäga rätt till ett lån som någon ansöker om, vilket möjliggör bättre planering utöver att lånet accepteras eller avslås.
8. Sentimentanalys med hjälp av Twitter-data
Tack vare sociala medier nätverk som Twitter, Facebook och Reddit har det blivit mycket enkelt att extrapolera åsikter och trender. Denna information används för att eliminera åsikter om evenemang, människor, sport och andra ämnen. Opinionsmining-relaterade maskininlärningsinitiativ tillämpas i en mängd olika miljöer, inklusive politiska kampanjer och Amazon-produktutvärderingar.
Detta projekt kommer att se fantastiskt ut i din portfölj! För känslodetektering och aspektbaserad analys kan tekniker som stödvektormaskiner, regression och klassificeringsalgoritmer användas i stor utsträckning (att hitta fakta och åsikter).
9. Prognos för framtida försäljning
Stora B2C-företag och handlare vill veta hur mycket varje produkt i deras lager kommer att sälja. Försäljningsprognoser hjälper företagare att avgöra vilka varor som är i hög efterfrågan. Noggranna försäljningsprognoser kommer att minska svinnet avsevärt samtidigt som det avgör den inkrementella effekten på framtida budgetar.
Återförsäljare som Walmart, IKEA, Big Basket och Big Bazaar använder försäljningsprognoser för att uppskatta produktefterfrågan. Du måste vara bekant med olika tekniker för att rensa rådata för att kunna konstruera sådana ML-projekt. Dessutom krävs ett bra grepp om regressionsanalys, särskilt enkel linjär regression.
För den här typen av uppgifter måste du använda bibliotek som Dora, Scrubadub, Pandas, NumPy och andra.
10. Upptäckt av falska nyheter
Det är ytterligare ett banbrytande maskininlärningsarbete riktat till skolbarn. Falska nyheter sprider sig som en löpeld, som vi alla vet. Allt finns tillgängligt på sociala medier, från att koppla samman individer till att läsa de dagliga nyheterna.
Som ett resultat har det blivit allt svårare att upptäcka falska nyheter i dessa dagar. Många stora sociala medienätverk, som Facebook och Twitter, har redan algoritmer på plats för att upptäcka falska nyheter i inlägg och flöden.
För att identifiera falska nyheter behöver den här typen av ML-projekt en grundlig förståelse för flera NLP-metoder och klassificeringsalgoritmer (PassiveAggressiveClassifier eller Naive Bayes classifier).
11. Förutsägelse av köp av kuponger
Kunder överväger allt mer att handla online när coronaviruset attackerade planeten 2020. Som ett resultat av detta har shoppingställena tvingats flytta sin verksamhet online.
Kunder, å andra sidan, letar fortfarande efter bra erbjudanden, precis som de var i butikerna, och jagar allt mer efter supersparande kuponger. Det finns till och med webbplatser dedikerade till att skapa kuponger för sådana kunder. Du kan lära dig om datautvinning i maskininlärning, producera stapeldiagram, cirkeldiagram och histogram för att visualisera data och funktionsteknik med detta projekt.
För att generera förutsägelser kan du också undersöka metoder för dataimputering för att hantera NA-värden och cosinuslikhet hos variabler.
12. Förutsägelse av kundavgång
Konsumenter är ett företags viktigaste tillgång, och att behålla dem är avgörande för alla företag som strävar efter att öka intäkterna och bygga långsiktiga meningsfulla kontakter med dem.
Dessutom är kostnaden för att skaffa en ny kund fem gånger högre än kostnaden för att underhålla en befintlig. Customer Churn/Atrition är ett välkänt affärsproblem där kunder eller abonnenter slutar göra affärer med en tjänst eller ett företag.
De kommer helst inte längre att vara en betalande kund. En kund anses churnad om det har gått en viss tid sedan kunden senast interagerade med företaget. Att identifiera om en kund kommer att churna, samt att snabbt ge relevant information som syftar till att behålla kunder, är avgörande för att minska churn.
Vår hjärna är oförmögen att förutse kundomsättning för miljontals kunder; det är här maskininlärning kan hjälpa.
13. Wallmart försäljningsprognos
En av de mest framträdande tillämpningarna av maskininlärning är försäljningsprognoser, vilket innebär att upptäcka egenskaper som påverkar produktförsäljningen och att förutse framtida försäljningsvolym.
Walmart-datasetet, som innehåller försäljningsdata från 45 platser, används i denna maskininlärningsstudie. Försäljning per butik, per kategori, på veckobasis ingår i datasetet. Syftet med detta maskininlärningsprojekt är att förutse försäljningen för varje avdelning i varje butik så att de kan fatta bättre datadriven kanaloptimering och beslut om lagerplanering.
Det är svårt att arbeta med Walmart-datauppsättningen eftersom den innehåller utvalda markdown-händelser som har en inverkan på försäljningen och bör övervägas.
14. Uber dataanalys
När det kommer till att implementera och integrera maskininlärning och djupinlärning i sina appar ligger den populära samåkningstjänsten inte långt efter. Varje år bearbetar den miljarder resor, vilket gör att pendlare kan resa när som helst på dygnet.
Eftersom den har en så stor kundbas behöver den exceptionell kundservice för att ta itu med konsumentklagomål så snabbt som möjligt.
Uber har en datauppsättning med miljontals hämtningar som den kan använda för att analysera och visa klientresor för att avslöja insikter och förbättra kundupplevelsen.
15. Covid-19 analys
COVID-19 har svept över världen idag, och inte bara i betydelsen av en pandemi. Medan medicinska experter koncentrerar sig på att generera effektiva vaccinationer och immunisera världen, datavetare är inte långt efter.
Nya fall, dagligt antal aktiva, dödsfall och teststatistik offentliggörs. Prognoser görs dagligen baserat på SARS-utbrottet under förra seklet. För detta kan du använda regressionsanalys och stödja vektormaskinbaserade prediktionsmodeller.
Slutsats
För att sammanfatta har vi diskuterat några av de bästa ML-projekten som hjälper dig att testa maskininlärningsprogrammering samt förstå dess idéer och implementering. Att veta hur man integrerar maskininlärning kan hjälpa dig att avancera i ditt yrke när tekniken tar över i alla branscher.
När du lär dig maskininlärning rekommenderar vi att du övar på dina koncept och skriver alla dina algoritmer. Att skriva algoritmer medan du lär dig är viktigare än att utföra ett projekt, och det ger dig också en fördel i att förstå ämnena ordentligt.
Kommentera uppropet