Table of Contents[Ferstopje][Toanje]
- 1 Titanic
- 2. Iersk Flower Classification
- 3. Boston House Priis Prediction
- 4. Wine Quality Testing
- 5. Stock Market Prediction
- 6. Movie Oanrikkemedaasje
- 7. Load Eligibility Prediction
- 8. Sentiment Analysis brûkend Twitter Data
- 9. Future Sales Prediction
- 10. Fake News Detection
- 11. Coupons Purchase Prediction
- 12. Customer Churn Prediction
- 13. Wallmart Sales Forecasting
- 14. Uber Data Analysis
- 15. Covid-19 Analyse
- Konklúzje
Masine learen is in ienfâldige stúdzje fan hoe't jo in kompjûterprogramma as algoritme opliede kinne om stadichoan te ferbetterjen op in spesifike baan presintearre op in heech nivo. Ofbyldingsidentifikaasje, fraudedeteksje, oanbefellingssystemen en oare applikaasjes foar masine-learen hawwe al bewiisd populêr te wêzen.
ML-banen meitsje minsklik wurk ienfâldich en effisjint, besparje tiid en soargje foar in resultaat fan hege kwaliteit. Sels Google, de populêrste sykmasjine fan 'e wrâld, brûkt masine learen.
Fan it analysearjen fan de fraach fan de brûker en it feroarjen fan it resultaat op basis fan de resultaten oant it toanen fan trendende ûnderwerpen en advertinsjes yn relaasje ta de fraach, binne d'r in ferskaat oan opsjes beskikber.
Technology dy't sawol perceptyf as selskorrigearjend is, is net fier fuort yn 'e takomst.
Ien fan 'e bêste manieren om te begjinnen is om hands-on te krijen en in projekt te ûntwerpen. Dêrom hawwe wy in list gearstald mei 15 topprojekten foar masine-learen foar begjinners om jo te begjinnen.
1. Titanic
Dit wurdt faak beskôge as ien fan 'e grutste en noflikste taken foar elkenien dy't ynteressearre is om mear te learen oer masine learen. De Titanic-útdaging is in populêr masine-learenprojekt dat ek tsjinnet as in goede manier om yn 'e kunde te kommen mei it Kaggle-datawittenskipplatfoarm. De Titanic-dataset is opboud út echte gegevens fan it sinken fan it ûngelokkige skip.
It omfettet details lykas de leeftyd fan 'e persoan, sosjaal-ekonomyske status, geslacht, kabinenûmer, fertrekhaven, en, it wichtichste, oft se oerlibbe!
De K-Nearest Neighbour-technyk en de klassifikaasje fan 'e beslútbeam waarden bepaald om de bêste resultaten foar dit projekt te produsearjen. As jo op syk binne nei in rappe wykeinútdaging om jo te ferbetterjen Machine Learning kapasiteiten, dizze op Kaggle is foar jo.
2. Ierske Flower Klassifikaasje
Begjinners hâlde fan it projekt foar kategorisearring fan irisblom, en it is in geweldich plak om te begjinnen as jo nij binne foar masine learen. De lingte fan kelkblêden en petalen ûnderskiedt iris bloeien fan oare soarten. It doel fan dit projekt is om de bloei te skieden yn trije soarten: Virginia, setosa en Versicolor.
Foar klassifikaasje-oefeningen brûkt it projekt de Iris-blom-dataset, dy't learlingen helpt by it learen fan de fûneminten fan it omgean mei numerike wearden en gegevens. De dataset foar irisblom is in lyts ien dy't yn it ûnthâld kin wurde opslein sûnder de needsaak foar skaalfergrutting.
3. Boston House Priis Prediction
In oar bekend dataset foar begjinners yn masine learen is de Boston Housing gegevens. It doel is om hûswearden te foarsizzen yn ferskate Boston-wiken. It omfettet fitale statistiken lykas leeftyd, taryf foar eigendomsbelesting, kriminaliteitssifers, en sels tichtby wurksintra, dy't allegear de prizen fan húsfesting kinne beynfloedzje.
De dataset is ienfâldich en lyts, wêrtroch it ienfâldich is om mei te eksperimintearjen foar begjinners. Om út te finen hokker faktoaren de eigendomspriis yn Boston beynfloedzje, wurde regressiontechniken swier brûkt op ferskate parameters. It is in geweldich plak om regressiontechniken te oefenjen en te beoardieljen hoe goed se wurkje.
4. Wine Quality Testing
Wyn is in ûngewoane alkoholyske drank dy't jierren fan fermentaasje fereasket. As resultaat is de antike flesse wyn in djoere en heechweardige wyn. Kieze foar de ideale flesse wyn fereasket jierren fan kennis fan wynproeven, en it kin in hit-of-miss proses wêze.
It wynkwaliteitstestprojekt evaluearret winen mei fysysk-gemyske tests lykas alkoholnivo, fêste aciditeit, tichtens, pH, en oare faktoaren. It projekt bepaalt ek de kwaliteitskritearia en hoemannichten fan 'e wyn. Dêrtroch wurdt de oankeap fan wyn in wyntsje.
5. Stock Market Prediction
Dit inisjatyf is yntrigearjend oft jo yn 'e finansjele sektor wurkje of net. Beursgegevens wurde wiidweidich bestudearre troch akademisy, bedriuwen, en sels as boarne fan sekundêr ynkommen. It fermogen fan in gegevenswittenskipper om tiidreeksgegevens te studearjen en te ferkennen is ek essinsjeel. Gegevens fan 'e oandielmerk is in geweldich plak om te begjinnen.
De essinsje fan it besykjen is om de takomstige wearde fan in oandiel te foarsizzen. Dit is basearre op hjoeddeistige merkprestaasjes lykas statistiken fan foargeande jierren. Kaggle hat sûnt 50 gegevens sammele oer de NIFTY-2000-yndeks, en it wurdt op it stuit wykliks bywurke. Sûnt 1 jannewaris 2000 hat it oandielprizen foar mear as 50 organisaasjes befette.
6. Movie Oanbefelling
Ik bin der wis fan dat jo hawwe hie dat gefoel nei it sjen fan in goede film. Hawwe jo oait de ympuls field om jo sinnen te prikkeljen troch ferlykbere films te besjen?
Wy witte dat OTT-tsjinsten lykas Netflix har oanbefellingssystemen signifikant hawwe ferbettere. As studint foar masine-learen moatte jo begripe hoe't sokke algoritmen kliïnten rjochtsje op basis fan har foarkarren en beoardielingen.
De IMDB-gegevensset op Kaggle is wierskynlik ien fan 'e meast folsleine, wêrtroch oanbefellingsmodellen kinne wurde ôflaat op basis fan' e filmtitel, klantbeoardieling, sjenre en oare faktoaren. It is ek in poerbêste metoade om te learen oer ynhâld-basearre filtering en Feature Engineering.
7. Laden Eligibility Prediction
De wrâld draait om lieningen. De wichtichste boarne fan winst fan banken komt út rinte op lieningen. Dêrom binne se har fûnemintele bedriuw.
Yndividuen as groepen fan yndividuen kinne ekonomyen allinich útwreidzje troch jild te ynvestearjen yn in bedriuw yn 'e hope om it yn' e takomst yn wearde te sjen. It is soms wichtich om in liening te sykjen om risiko's fan dizze aard te nimmen en sels diel te nimmen oan bepaalde wrâldske wille.
Foardat in liening kin wurde aksepteare, moatte banken normaal in frij strang proses folgje. Om't lieningen sa'n krúsjaal aspekt fan it libben fan in protte minsken binne, soe it foarsizzen fan yn oanmerking komme foar in liening wêrfoar immen oanfreget, ekstreem foardielich wêze soe, wêrtroch bettere planning mooglik is foarby de liening dy't wurdt akseptearre of wegere.
8. Sentimintanalyse mei Twitter-gegevens
Mei tank oan sosjale media netwurken lykas Twitter, Facebook, en Reddit, ekstrapolearjen fan mieningen en trends binne oanmerklik maklik wurden. Dizze ynformaasje wurdt brûkt om mieningen oer eveneminten, minsken, sporten en oare ûnderwerpen te eliminearjen. Opiny mining-relatearre masine learinisjativen wurde tapast yn in ferskaat oan ynstellings, ynklusyf politike kampanjes en Amazon produkt evaluaasjes.
Dit projekt sil der fantastysk útsjen yn jo portfolio! Foar emoasjedeteksje en aspekt-basearre analyze kinne techniken lykas stipe-vektormasines, regression, en klassifikaasjealgoritmen wiidweidich brûkt wurde (feiten en mieningen fine).
9. Future Sales Prediction
Grutte B2C-bedriuwen en keaplju wolle witte hoefolle elk produkt yn har ynventaris sil ferkeapje. Ferkeapprognose helpt bedriuwseigners by it bepalen fan hokker items yn hege fraach binne. Akkurate ferkeapprognosen sille fergriemerij signifikant ferminderje, wylst ek de ynkrementele ynfloed op takomstige budzjetten bepale.
Winkeliers lykas Walmart, IKEA, Big Basket, en Big Bazaar brûke ferkeapprognosen om produktfraach te skatten. Jo moatte bekend wêze mei ferskate techniken foar it skjinmeitsjen fan rauwe gegevens om sokke ML-projekten te konstruearjen. Ek is in goed begryp fan regression-analyse, benammen ienfâldige lineêre regression, fereaske.
Foar dit soarte taken moatte jo bibleteken brûke lykas Dora, Scrubadub, Pandas, NumPy, en oaren.
10. Fake News Detection
It is in oare baanbrekende ynspanning foar masine-learen rjochte op skoalbern. Fake nijs ferspriedt as in wyldfjoer, lykas wy allegear witte. Alles is beskikber op sosjale media, fan it ferbinen fan yndividuen oant it lêzen fan it deistige nijs.
As gefolch is it opspoaren fan falsk nijs dizze dagen hieltyd dreger wurden. In protte grutte sosjale media netwurken, lykas Facebook en Twitter, hawwe al algoritmen yn plak om falsk nijs te ûntdekken yn berjochten en feeds.
Om falsk nijs te identifisearjen, hat dit soarte ML-projekt in yngeand begryp nedich fan meardere NLP-oanpakken en klassifikaasjealgoritmen (PassiveAggressiveClassifier of Naive Bayes-klassifikaasje).
11. Coupons Purchase Prediction
Klanten oerwage hieltyd mear online keapjen doe't it coronavirus de planeet oanfallen yn 2020. As gefolch binne winkelynstellingen twongen om har bedriuw online te ferskowen.
Klanten, oan 'e oare kant, sykje noch altyd geweldige oanbiedingen, krekt sa't se yn winkels wiene, en sykje hieltyd mear op superbesparjende coupons. D'r binne sels websiden wijd oan it meitsjen fan coupons foar sokke kliïnten. Jo kinne leare oer data mining yn masine learen, it produsearjen fan staafgrafiken, taartdiagrammen en histogrammen om gegevens te visualisearjen, en funksje engineering mei dit projekt.
Om foarsizzingen te generearjen, kinne jo ek sjen nei oanpak fan gegevensimputaasje foar it behearen fan NA-wearden en cosinus-oerienkomst fan fariabelen.
12. Klant Churn Prediction
Konsuminten binne de wichtichste besitting fan in bedriuw, en it hâlden fan se is essensjeel foar elk bedriuw dat fan doel is om ynkomsten te ferheegjen en betsjuttingsfolle ferbiningen mei har op te bouwen.
Fierder binne de kosten foar it oanskaffen fan in nije klant fiif kear heger as de kosten foar it ûnderhâlden fan in besteande. Customer Churn / Attrition is in bekend saaklik probleem wêrby't klanten of abonnees ophâlde te dwaan saken mei in tsjinst of in bedriuw.
Se sille by útstek net langer in beteljende klant wêze. In klant wurdt beskôge as churned as it in bepaalde tiid west hat sûnt de klant foar it lêst mei it bedriuw ynteraksje. Identifisearje oft in klant sil churn, likegoed as fluch it jaan fan relevante ynformaasje rjochte op klant retinsje, binne krúsjaal foar it ferleegjen fan churn.
Us harsens binne net yn steat om klantomset foar miljoenen kliïnten te antisipearjen; hjir is wêr't masine learen kin helpe.
13. Wallmart Sales Forecasting
Ien fan 'e meast foaroansteande tapassingen fan masine learen is ferkeapprognosen, wêrby't it ûntdekken fan skaaimerken omfettet dy't de produktferkeap beynfloedzje en it antisipearjen fan takomstich ferkeapvolumint.
De Walmart-dataset, dy't ferkeapgegevens fan 45-lokaasjes befettet, wurdt brûkt yn dizze masine-learenstúdzje. Ferkeap per winkel, per kategory, op wyklikse basis binne opnommen yn 'e dataset. It doel fan dit masine-learprojekt is om ferkeap foar elke ôfdieling yn elke outlet te antisipearjen, sadat se bettere data-oandreaune kanaaloptimalisaasje en besluten foar ynventarisaasjeplanning kinne nimme.
Wurkje mei de Walmart-dataset is lestich, om't it selektearre markdown-eveneminten befettet dy't ynfloed hawwe op ferkeap en moatte wurde beskôge.
14. Uber Data Analysis
As it giet om it ymplementearjen en yntegrearjen fan masine learen en djip learen yn har apps, is de populêre ride-sharing tsjinst net fier efter. Elk jier ferwurket it miljarden reizen, wêrtroch pendelaars op elk momint fan 'e dei of nacht kinne reizgje.
Om't it sa'n grutte klantbasis hat, hat it útsûnderlike klanttsjinst nedich om klachten fan konsuminten sa gau mooglik oan te pakken.
Uber hat in dataset fan miljoenen pick-ups dy't it kin brûke om klantreizen te analysearjen en werjaan om ynsjoch te ûntdekken en de klantûnderfining te ferbetterjen.
15. Covid-19 Analyse
COVID-19 hat hjoed de wrâld ferovere, en net gewoan yn 'e sin fan in pandemy. Wylst medyske saakkundigen har konsintrearje op it generearjen fan effektive faksinaasjes en it immunisearjen fan 'e wrâld, data wittenskippers binne net fier efter.
Nije gefallen, deistige aktive tellen, deaden, en teststatistiken wurde allegear iepenbier makke. Prognoses wurde makke op deistige basis basearre op de SARS-útbraak fan 'e foarige ieu. Hjirfoar kinne jo regression-analyze brûke en vectormasjine-basearre foarsizzingsmodellen stypje.
Konklúzje
Om gearfetsje, hawwe wy guon fan 'e top ML-projekten besprutsen dy't jo sille helpe by it testen fan Machine Learning-programmearring en ek it begripen fan de ideeën en ymplemintaasje. Wisten hoe't jo Machine Learning yntegrearje kinne jo helpe foarút te gean yn jo berop, om't de technology oernimt yn elke sektor.
Wylst jo Machine Learning leare, riede wy oan dat jo jo konsepten oefenje en al jo algoritmen skriuwe. Algorithmen skriuwe by it learen is wichtiger dan it útfieren fan in projekt, en it jout jo ek in foardiel yn it goed begripen fan de ûnderwerpen.
Leave a Reply