INHOUDSOPGAWE[Versteek][Wys]
- 1. Titanic
- 2. Ierse Blom Klassifikasie
- 3. Boston-huisprysvoorspelling
- 4. Wyngehaltetoetsing
- 5. Aandelemarkvoorspelling
- 6. Fliekaanbeveling
- 7. Laai Geskiktheid Voorspelling
- 8. Sentimentanalise deur Twitter-data te gebruik
- 9. Toekomstige verkope voorspelling
- 10. Opsporing van vals nuus
- 11. Koepons Aankoopvoorspelling
- 12. Kliënt Churn Prediction
- 13. Wallmart-verkopevoorspelling
- 14. Uber-data-analise
- 15. Covid-19-ontleding
- Gevolgtrekking
Masjienleer is 'n eenvoudige studie van hoe om 'n rekenaarprogram of algoritme op te voed om geleidelik te verbeter op 'n spesifieke werk wat op 'n hoë vlak aangebied word. Beeld-identifikasie, bedrogopsporing, aanbevelingstelsels en ander masjienleertoepassings het reeds bewys dat dit gewild is.
ML-take maak menslike werk eenvoudig en doeltreffend, wat tyd bespaar en 'n hoë-gehalte resultaat verseker. Selfs Google, die wêreld se gewildste soekenjin, gebruik machine learning.
Van die ontleding van die gebruiker se navraag en die verandering van die resultaat op grond van die resultate tot die wys van neigingsonderwerpe en advertensies met betrekking tot die navraag, daar is 'n verskeidenheid opsies beskikbaar.
Tegnologie wat beide perseptief en selfkorrektief is, is nie ver in die toekoms nie.
Een van die beste maniere om te begin, is om 'n projek te ontwerp. Daarom het ons 'n lys van 15 top masjienleerprojekte vir beginners saamgestel om jou aan die gang te kry.
1. Titanic
Dit word dikwels beskou as een van die grootste en aangenaamste take vir almal wat belangstel om meer oor masjienleer te leer. Die Titanic-uitdaging is 'n gewilde masjienleerprojek wat ook dien as 'n goeie manier om met die Kaggle-datawetenskapplatform kennis te maak. Die Titanic-datastel bestaan uit ware data van die sink van die noodlottige skip.
Dit sluit besonderhede in soos die persoon se ouderdom, sosio-ekonomiese status, geslag, kajuitnommer, vertrekhawe, en, die belangrikste, of hulle oorleef het!
Die K-Naaste Buur-tegniek en die besluitboomklassifiseerder was vasbeslote om die beste resultate vir hierdie projek te lewer. As jy op soek is na 'n vinnige naweekuitdaging om jou te verbeter Masjienleer vermoëns, hierdie een op Kaggle is vir jou.
2. Ierse blomklassifikasie
Beginners is mal oor die kategoriseringsprojek vir irisblomme, en dit is 'n goeie plek om te begin as jy nuut is met masjienleer. Die lengte van kelkblare en blomblare onderskei irisblomme van ander spesies. Hierdie projek se doel is om die blomme in drie spesies te skei: Virginia, setosa en Versicolor.
Vir klassifikasie-oefeninge gebruik die projek die Iris-blomdatastel, wat leerders help om die grondbeginsels van die hantering van numeriese waardes en data te leer. Die irisblom-datastel is 'n klein een wat in die geheue gestoor kan word sonder dat dit nodig is om te skaal.
3. Boston-huisprysvoorspelling
Nog 'n bekende datastel vir beginners in masjienleer is die Boston Housing data. Die doel daarvan is om huiswaardes in verskeie Boston-buurte te voorspel. Dit sluit noodsaaklike statistieke in soos ouderdom, eiendomsbelastingkoers, misdaadkoers en selfs nabyheid aan werksentrums, wat alles behuisingspryse kan beïnvloed.
Die datastel is eenvoudig en klein, wat dit maklik maak om mee te eksperimenteer vir beginners. Om uit te vind watter faktore die eiendomsprys in Boston beïnvloed, word regressietegnieke baie op verskeie parameters gebruik. Dit is 'n wonderlike plek om regressietegnieke te oefen en te bepaal hoe goed dit werk.
4. Wynkwaliteit toets
Wyn is 'n ongewone alkoholiese drank wat jare se gisting verg. Gevolglik is die antieke bottel wyn 'n duur wyn van hoë gehalte. Om die ideale bottel wyn te kies verg jare se wynproe-kennis, en dit kan 'n tref-of-mis-proses wees.
Die wyngehaltetoetsprojek evalueer wyne deur fisies-chemiese toetse soos alkoholvlak, vaste suurheid, digtheid, pH en ander faktore te gebruik. Die projek bepaal ook die wyn se kwaliteitskriteria en -hoeveelhede. As gevolg hiervan word wynaankope 'n briesie.
5. Aandelemarkvoorspelling
Hierdie inisiatief is interessant of jy in die finansiële sektor werk of nie. Aandelemarkdata word omvattend bestudeer deur akademici, besighede, en selfs as 'n bron van sekondêre inkomste. 'n Datawetenskaplike se vermoë om tydreeksdata te bestudeer en te verken, is ook noodsaaklik. Data van die aandelemark is 'n goeie plek om te begin.
Die kern van die poging is om die toekomstige waarde van 'n aandeel te voorspel. Dit is gebaseer op huidige markprestasie sowel as statistieke van vorige jare. Kaggle het sedert 50 data oor die NIFTY-2000-indeks versamel, en dit word tans weekliks bygewerk. Sedert 1 Januarie 2000 bevat dit aandeelpryse vir meer as 50 organisasies.
6. Fliek aanbeveling
Ek is seker jy het daardie gevoel gehad nadat jy 'n goeie fliek gesien het. Het jy al ooit die impuls gevoel om jou sintuie te prikkel deur na soortgelyke films te kyk?
Ons weet dat OTT-dienste soos Netflix hul aanbevelingstelsels aansienlik verbeter het. As 'n masjienleerstudent sal jy moet verstaan hoe sulke algoritmes kliënte teiken op grond van hul voorkeure en resensies.
Die IMDB-datastel op Kaggle is waarskynlik een van die volledigste, wat toelaat dat aanbevelingsmodelle afgelei kan word op grond van die filmtitel, klantgradering, genre en ander faktore. Dit is ook 'n uitstekende metode om meer oor inhoudgebaseerde filtering en kenmerkingenieurswese te leer.
7. Laai geskiktheidsvoorspelling
Die wêreld draai om lenings. Banke se groot bron van wins kom uit rente op lenings. Daarom is hulle hul fundamentele besigheid.
Individue of groepe individue kan slegs ekonomieë uitbrei deur geld in 'n firma te belê in die hoop om dit in die toekoms in waarde te sien styg. Dit is soms belangrik om 'n lening te soek om risiko's van hierdie aard te kan neem en selfs aan sekere wêreldse plesier deel te neem.
Voordat 'n lening aanvaar mag word, het banke gewoonlik 'n redelik streng proses om te volg. Aangesien lenings so 'n deurslaggewende aspek van baie mense se lewe is, sal die voorspelling van kwalifikasie vir 'n lening waarvoor iemand aansoek doen uiters voordelig wees, wat beter beplanning moontlik maak as die lening wat aanvaar of geweier word.
8. Sentimentanalise met behulp van Twitter-data
Danksy sosiale media netwerke soos Twitter, Facebook en Reddit, het ekstrapolering van menings en neigings aansienlik maklik geword. Hierdie inligting word gebruik om menings oor gebeurtenisse, mense, sport en ander onderwerpe uit te skakel. Opinie-ontginning-verwante masjienleer-inisiatiewe word toegepas in 'n verskeidenheid van omgewings, insluitend politieke veldtogte en Amazon produk evaluerings.
Hierdie projek sal fantasties in jou portefeulje lyk! Vir emosiebespeuring en aspek-gebaseerde analise kan tegnieke soos ondersteuningsvektormasjiene, regressie en klassifikasiealgoritmes op groot skaal gebruik word (vind feite en menings).
9. Toekomstige verkope voorspelling
Groot B2C-ondernemings en handelaars wil weet hoeveel elke produk in hul voorraad sal verkoop. Verkope vooruitskatting help sake-eienaars om te bepaal watter items hoog in aanvraag is. Akkurate verkoopsvoorspelling sal vermorsing aansienlik verminder terwyl dit ook die inkrementele impak op toekomstige begrotings bepaal.
Kleinhandelaars soos Walmart, IKEA, Big Basket en Big Bazaar gebruik verkoopsvoorspelling om produkaanvraag te skat. Jy moet vertroud wees met verskeie tegnieke om rou data skoon te maak om sulke ML-projekte te konstrueer. 'n Goeie begrip van regressie-analise, veral eenvoudige lineêre regressie, word ook vereis.
Vir hierdie soort take moet jy biblioteke soos Dora, Scrubadub, Pandas, NumPy en ander in diens neem.
10. Opsporing van vals nuus
Dit is nog 'n voorpunt-masjienleerpoging wat op skoolkinders gemik is. Fopnuus versprei soos 'n veldbrand, soos ons almal weet. Alles is op sosiale media beskikbaar, van om individue te verbind tot die lees van die daaglikse nuus.
Gevolglik word dit deesdae al hoe moeiliker om vals nuus op te spoor. Baie groot sosiale media-netwerke, soos Facebook en Twitter, het reeds algoritmes in plek om vals nuus in plasings en feeds op te spoor.
Om vals nuus te identifiseer, benodig hierdie tipe ML-projek 'n deeglike begrip van verskeie NLP-benaderings en klassifikasiealgoritmes (PassiveAggressiveClassifier of Naive Bayes-klassifiseerder).
11. Koepons Aankoop Voorspelling
Kliënte oorweeg al hoe meer om aanlyn te koop toe die koronavirus die planeet in 2020 aangeval het. Gevolglik is inkopieondernemings verplig om hul besigheid aanlyn te verskuif.
Kliënte, aan die ander kant, soek steeds wonderlike aanbiedinge, net soos hulle in winkels was, en soek toenemend na superbesparende koepons. Daar is selfs webwerwe wat toegewy is aan die skep van koepons vir sulke kliënte. Jy kan leer oor data-ontginning in masjienleer, die vervaardiging van staafgrafieke, sirkeldiagramme en histogramme om data te visualiseer, en kenmerk ingenieurswese met hierdie projek.
Om voorspellings te genereer, kan jy ook kyk na data-toerekeningsbenaderings vir die bestuur van NA-waardes en cosinus-ooreenkoms van veranderlikes.
12. Kliënt Churn Prediction
Verbruikers is 'n maatskappy se belangrikste bate, en om dit te behou is noodsaaklik vir enige besigheid wat daarop gemik is om inkomste te verhoog en langtermyn betekenisvolle verbintenisse met hulle te bou.
Verder is die koste om 'n nuwe kliënt te bekom vyf keer hoër as die koste om 'n bestaande een te onderhou. Customer Churn/Attrition is 'n bekende besigheidsprobleem waarin kliënte of intekenare ophou om sake te doen met 'n diens of 'n maatskappy.
Hulle sal ideaal gesproke nie meer 'n betalende kliënt wees nie. 'n Kliënt word geag om te wees as dit 'n bepaalde tyd was sedert die kliënt laas met die maatskappy in aanraking gekom het. Om te identifiseer of 'n kliënt sal kanselleer, sowel as om vinnig relevante inligting te verskaf wat gemik is op klantbehoud, is van kardinale belang om kans te verminder.
Ons brein is nie in staat om kliënte-omset vir miljoene kliënte te verwag nie; hier is waar masjienleer kan help.
13. Wallmart-verkopevoorspelling
Een van die mees prominente toepassings van masjienleer is verkoopsvoorspelling, wat die opsporing van kenmerke behels wat produkverkope beïnvloed en die vooruitskatting van toekomstige verkoopsvolumes.
Die Walmart-datastel, wat verkoopsdata van 45 liggings bevat, word in hierdie masjienleerstudie gebruik. Verkope per winkel, volgens kategorie, op 'n weeklikse basis word by die datastel ingesluit. Die doel van hierdie masjienleerprojek is om verkope vir elke afdeling in elke afsetpunt te verwag sodat hulle beter datagedrewe kanaaloptimalisering en voorraadbeplanningsbesluite kan neem.
Dit is moeilik om met die Walmart-datastel te werk, aangesien dit gekose afmerkgebeurtenisse bevat wat 'n impak op verkope het en oorweeg moet word.
14. Uber-data-analise
Wanneer dit kom by die implementering en integrasie van masjienleer en diep leer in hul toepassings, is die gewilde saamrydiens nie ver agter nie. Elke jaar verwerk dit miljarde reise, wat pendelaars toelaat om enige tyd van die dag of nag te reis.
Omdat dit so 'n groot kliëntebasis het, benodig dit uitsonderlike kliëntediens om verbruikersklagtes so vinnig moontlik aan te spreek.
Uber het 'n datastel van miljoene bakkies wat dit kan gebruik om kliëntereise te ontleed en te vertoon om insigte te ontbloot en die kliëntervaring te verbeter.
15. Covid-19 ontleding
COVID-19 het vandag die wêreld gevee, en nie bloot in die sin van 'n pandemie nie. Terwyl mediese kundiges daarop konsentreer om doeltreffende inentings te genereer en die wêreld te immuniseer, data wetenskaplikes is nie ver agter nie.
Nuwe gevalle, daaglikse aktiewe telling, sterftes en toetsstatistieke word almal bekend gemaak. Voorspellings word op 'n daaglikse basis gemaak op grond van die SAID-uitbreking van die vorige eeu. Hiervoor kan u regressie-analise gebruik en vektormasjien-gebaseerde voorspellingsmodelle ondersteun.
Gevolgtrekking
Om op te som, ons het 'n paar van die top ML-projekte bespreek wat jou sal help om Masjienleer-programmering te toets, asook om die idees en implementering daarvan te begryp. Om te weet hoe om Masjienleer te integreer, kan jou help om in jou beroep te vorder, aangesien die tegnologie in elke industrie oorneem.
Terwyl jy Masjienleer leer, beveel ons aan dat jy jou konsepte oefen en al jou algoritmes skryf. Om algoritmes te skryf terwyl jy leer, is belangriker as om 'n projek uit te voer, en dit bied jou ook 'n voordeel om die vakke behoorlik te verstaan.
Lewer Kommentaar