Tartalomjegyzék[Elrejt][Előadás]
- 1. óriási
- 2. Ír virágok osztályozása
- 3. Boston House Price Prediction
- 4. Borminőség-vizsgálat
- 5. Tőzsdei előrejelzés
- 6. Filmajánló
- 7. Betöltési alkalmasság előrejelzése
- 8. Hangulatelemzés Twitter-adatok segítségével
- 9. Jövőbeli értékesítés előrejelzése
- 10. Álhírek észlelése
- 11. Kuponvásárlás előrejelzése
- 12. Ügyféllemorzsolódás előrejelzése
- 13. Wallmart értékesítési előrejelzés
- 14. Uber adatelemzés
- 15. Covid-19 elemzés
- Következtetés
A gépi tanulás egy egyszerű tanulmány arról, hogyan oktassunk egy számítógépes programot vagy algoritmust, hogy fokozatosan javítsunk egy adott munkakörön, magas szinten. A képazonosítás, a csalásészlelés, az ajánlórendszerek és más gépi tanulási alkalmazások már népszerűnek bizonyultak.
Az ML munkák egyszerűvé és hatékonnyá teszik az emberi munkát, időt takarítanak meg és jó minőségű eredményt biztosítanak. Még a Google, a világ legnépszerűbb keresője is használja gépi tanulás.
A felhasználó lekérdezésének elemzésétől és az eredmény módosításától az eredmények alapján a felkapott témák és hirdetések megjelenítéséig a lekérdezéssel kapcsolatban számos lehetőség áll rendelkezésre.
Az egyszerre érzékelhető és önkorrekciós technológia nincs messze a jövőben.
Az indulás egyik legjobb módja a gyakorlati gyakorlatok megismerése és egy projekt megtervezése. Ezért összeállítottunk egy listát a 15 legjobb gépi tanulási projektről kezdőknek, hogy el tudja kezdeni.
1. Óriási
Ezt gyakran az egyik legnagyobb és legélvezetesebb feladatnak tartják mindenki számára, aki többet szeretne megtudni a gépi tanulásról. A Titanic kihívás egy népszerű gépi tanulási projekt, amely egyben jó módja annak, hogy megismerkedjünk a Kaggle adattudományi platformmal. A Titanic adatkészlet a szerencsétlenül járt hajó elsüllyedésének valódi adataiból áll.
Olyan részleteket tartalmaz, mint a személy életkora, társadalmi-gazdasági státusza, neme, kabinszáma, indulási kikötője, és ami a legfontosabb, életben maradt-e!
A K-Legközelebbi szomszéd technika és a döntési fa osztályozója úgy döntött, hogy a legjobb eredményeket produkálja ebben a projektben. Ha egy gyors hétvégi kihívást keresel, hogy javítsd Gépi tanulási képességek, ez a Kaggle az Ön számára.
2. Ír virágok osztályozása
A kezdők szeretik az íriszvirág kategorizálási projektet, és ez remek kiindulópont, ha még nem ismeri a gépi tanulást. A csészelevelek és szirmok hossza különbözteti meg az írisz virágzatát más fajoktól. Ennek a projektnek az a célja, hogy a virágokat három fajra különítse el: Virginia, setosa és Versicolor.
Az osztályozási gyakorlatokhoz a projekt az íriszvirág adatkészletet használja, amely segíti a tanulókat a numerikus értékekkel és adatokkal való kezelés alapjainak elsajátításában. Az íriszvirág adatkészlet egy apró adatkészlet, amely méretezés nélkül tárolható a memóriában.
3. Boston házárak előrejelzése
Egy másik jól ismert adatkészlet kezdőknek a gépi tanulásban a Boston Housing adatai. Célja az otthoni értékek előrejelzése Boston különböző negyedeiben. Olyan létfontosságú statisztikákat tartalmaz, mint az életkor, az ingatlanadó kulcsa, a bűnözési ráta, és még a munkaügyi központok közelsége is, amelyek mindegyike hatással lehet a lakásárak alakulására.
Az adatkészlet egyszerű és apró, így a kezdők számára egyszerű a kísérletezés. Annak kiderítésére, hogy milyen tényezők befolyásolják az ingatlan árát Bostonban, a regressziós technikákat erősen alkalmazzák különböző paramétereken. Ez egy nagyszerű hely a regressziós technikák gyakorlására és annak értékelésére, hogy mennyire jól működnek.
4. Borminőség-vizsgálat
A bor szokatlan alkoholos ital, amely évekig tartó erjesztést igényel. Ennek eredményeként az antik üveg bor drága és jó minőségű bor. Az ideális palack bor kiválasztásához több éves borkóstolói tudásra van szükség, és lehet, hogy sikerrel jár.
A borminőség-vizsgálati projekt fizikai-kémiai tesztekkel értékeli a borokat, például alkoholszintet, rögzített savasságot, sűrűséget, pH-t és egyéb tényezőket. A projekt meghatározza a bor minőségi kritériumait és mennyiségét is. Ennek eredményeként a borvásárlás gyerekjáték lesz.
5. Tőzsdei előrejelzés
Ez a kezdeményezés érdekes, hogy Ön a pénzügyi szektorban dolgozik-e vagy sem. A tőzsdei adatokat alaposan tanulmányozzák az akadémikusok, a vállalkozások, sőt másodlagos jövedelemforrásként is. Szintén létfontosságú az adatkutató képessége az idősorok adatainak tanulmányozására és feltárására. A tőzsdéről származó adatok remek kiindulópontot jelentenek.
A törekvés lényege egy részvény jövőbeli értékének előrejelzése. Ez a jelenlegi piaci teljesítményen, valamint a korábbi évek statisztikáin alapul. A Kaggle 50 óta gyűjt adatokat a NIFTY-2000 indexről, és jelenleg hetente frissítik. 1. január 2000. óta több mint 50 szervezet részvényárfolyamát tartalmazza.
6. Filmajánló
Biztos vagyok benne, hogy egy jó film megtekintése után átélte már ezt az érzést. Érezted már valaha azt a késztetést, hogy megmozgasd az érzékeidet a hasonló filmek zaklatása miatt?
Tudjuk, hogy az olyan OTT szolgáltatások, mint a Netflix, jelentősen javították ajánlási rendszereiket. Gépi tanulást végző hallgatóként meg kell értenie, hogyan célozzák meg az ilyen algoritmusok az ügyfeleket preferenciáik és véleményeik alapján.
A Kaggle-n található IMDB adatkészlet valószínűleg az egyik legteljesebb, amely lehetővé teszi az ajánlási modellek kikövetkeztetését a film címe, a vásárlói értékelés, a műfaj és egyéb tényezők alapján. Kiváló módszer a tartalomalapú szűrés és a szolgáltatástervezés megismerésére is.
7. Betöltési alkalmasság előrejelzése
A világ a hitelek körül forog. A bankok fő profitforrása a hitelek kamatai. Ezért ők az alapvető üzletük.
Az egyének vagy egyének csoportjai csak úgy bővíthetik gazdaságukat, ha pénzt fektetnek be egy cégbe, abban a reményben, hogy a jövőben felértékelődik. Néha fontos kölcsönt kérni, hogy vállalhassunk ilyen jellegű kockázatokat, és akár bizonyos világi örömökben is részesedjünk.
A kölcsön elfogadása előtt a bankoknak általában meglehetősen szigorú eljárást kell követniük. Mivel a kölcsönök sok ember életének döntő részét képezik, rendkívül előnyös lenne előre jelezni, hogy valaki milyen hitelre jogosult, és lehetővé tenné a jobb tervezést a kölcsön elfogadásán vagy elutasításán túl.
8. Hangulatelemzés Twitter-adatok segítségével
A közösségi média hálózatok A Twitterhez, a Facebookhoz és a Reddithez hasonlóan a vélemények és trendek extrapolálása meglehetősen egyszerűvé vált. Ezt az információt arra használjuk, hogy kiküszöböljük az eseményekről, emberekről, sportokról és egyéb témákról alkotott véleményeket. A véleménybányászattal kapcsolatos gépi tanulási kezdeményezéseket számos területen alkalmazzák, beleértve a politikai kampányokat és az Amazon termékértékeléseit.
Ez a projekt fantasztikusan fog kinézni a portfóliójában! Az érzelmek észlelésére és szempont alapú elemzésére széles körben használhatók olyan technikák, mint a támogató vektorgépek, regressziós és osztályozási algoritmusok (tények és vélemények felkutatása).
9. Jövő értékesítési előrejelzése
A nagy B2C-vállalkozások és kereskedők tudni akarják, hogy a készletükben lévő egyes termékek mennyit fognak eladni. Az értékesítési előrejelzés segít a vállalkozások tulajdonosainak annak meghatározásában, hogy mely termékekre van nagy a kereslet. A pontos értékesítési előrejelzés jelentősen csökkenti a pazarlást, miközben meghatározza a jövőbeli költségvetésekre gyakorolt növekvő hatást is.
Az olyan kiskereskedők, mint a Walmart, az IKEA, a Big Basket és a Big Bazaar értékesítési előrejelzést használnak a termékkereslet becsléséhez. Az ilyen ML projektek létrehozásához ismernie kell a nyers adatok tisztításának különféle technikáit. Ezenkívül a regresszióanalízis, különösen az egyszerű lineáris regresszió jó ismerete szükséges.
Az ilyen jellegű feladatokhoz olyan könyvtárakat kell alkalmaznia, mint a Dora, Scrubadub, Pandas, NumPy és mások.
10. Álhírek észlelése
Ez egy újabb élvonalbeli gépi tanulási erőfeszítés, amely iskolásokat céloz meg. Az álhírek futótűzként terjednek, mint azt mindannyian tudjuk. A közösségi médiában minden elérhető, az egyének összekapcsolásától a napi hírek olvasásáig.
Ennek eredményeként a hamis hírek észlelése manapság egyre nehezebbé válik. Sok nagy közösségi média hálózat, mint például a Facebook és a Twitter, már rendelkezik algoritmusokkal a posztokban és hírfolyamokban található hamis hírek észlelésére.
A hamis hírek azonosításához az ilyen típusú ML-projekteknek több NLP-megközelítés és osztályozási algoritmus (PassiveAggressiveClassifier vagy Naive Bayes osztályozó) alapos ismerete szükséges.
11. Kuponvásárlás előrejelzése
A vevők egyre gyakrabban fontolgatják az online vásárlást, amikor a koronavírus 2020-ban megtámadta a bolygót. Ennek eredményeként a bevásárlóhelyek arra kényszerültek, hogy üzletüket az internetre helyezzék át.
A vásárlók viszont továbbra is keresik a nagyszerű ajánlatokat, akárcsak az üzletekben, és egyre inkább vadásznak szupertakarékos kuponokra. Még olyan webhelyek is léteznek, amelyek kuponok létrehozására szolgálnak az ilyen ügyfelek számára. Ezzel a projekttel megismerkedhet az adatbányászattal a gépi tanulásban, oszlopdiagramok, kördiagramok és hisztogramok készítésével az adatok megjelenítéséhez, valamint a funkciók tervezésével.
Előrejelzések generálásához megvizsgálhatja az adatimputációs megközelítéseket is az NA-értékek és a változók koszinuszhasonlóságának kezelésére.
12. Ügyfél lemorzsolódás előrejelzése
A fogyasztók a vállalat legfontosabb eszközei, és megtartásuk létfontosságú minden olyan vállalkozás számára, amelynek célja a bevétel növelése és a velük való hosszú távú, értelmes kapcsolatok kialakítása.
Ezenkívül egy új ügyfél megszerzésének költsége ötször magasabb, mint egy meglévő fenntartásának költsége. Az ügyfelek lemorzsolódása/lemorzsolódása egy jól ismert üzleti probléma, amelyben az ügyfelek vagy az előfizetők felhagynak egy szolgáltatással vagy egy vállalattal.
Ideális esetben már nem lesznek fizető vásárlók. Az ügyfél akkor minősül lemorzsolódottnak, ha meghatározott idő telt el azóta, hogy az ügyfél utoljára kapcsolatba lépett a vállalattal. A lemorzsolódás csökkentése szempontjából kulcsfontosságú annak azonosítása, hogy az ügyfél lemorzsolódik-e, valamint az ügyfelek megtartását célzó releváns információk gyors megadása.
Agyunk nem képes előre látni az ügyfelek millióinak forgalmát; itt segíthet a gépi tanulás.
13. Wallmart értékesítési előrejelzés
A gépi tanulás egyik legjelentősebb alkalmazása az értékesítési előrejelzés, amely magában foglalja a termékeladásokat befolyásoló jellemzők felderítését és a jövőbeli értékesítési volumen előrejelzését.
Ebben a gépi tanulási tanulmányban a Walmart adatkészletet használjuk, amely 45 hely értékesítési adatait tartalmazza. Az adatkészlet tartalmazza az üzletenkénti, kategóriánkénti értékesítéseket heti rendszerességgel. Ennek a gépi tanulási projektnek az a célja, hogy előre jelezze az egyes részlegek értékesítését az egyes üzletekben, hogy jobb adatközpontú csatornaoptimalizálási és készlettervezési döntéseket tudjanak hozni.
A Walmart adatkészlettel való munka nehézkes, mivel olyan kiválasztott leértékelési eseményeket tartalmaz, amelyek hatással vannak az eladásokra, és ezeket figyelembe kell venni.
14. Uber adatelemzés
Ami a gépi tanulás és a mély tanulás megvalósítását és integrálását illeti alkalmazásaikban, a népszerű telekocsi szolgáltatás sem marad el mögötte. Évente több milliárd utazást dolgoz fel, lehetővé téve az ingázók számára, hogy a nap és az éjszaka bármely szakában utazhassanak.
Mivel ilyen nagy ügyfélkörrel rendelkezik, kivételes ügyfélszolgálatra van szüksége, hogy a fogyasztói panaszokat a lehető leggyorsabban kezelje.
Az Uber több millió adatgyűjtésből álló adatkészlettel rendelkezik, amelyeket felhasználhat az ügyfelek utazásainak elemzésére és megjelenítésére, hogy betekintést nyerjen és javítsa az ügyfélélményt.
15. Covid-19 elemzés
A COVID-19 mára végigsöpört a Földön, és nem egyszerűen világjárvány formájában. Miközben az orvosi szakértők a hatékony védőoltások létrehozására és a világ immunizálására koncentrálnak, adatkutatók nincsenek messze lemaradva.
Az új esetek, a napi aktívak száma, a halálesetek és a tesztelési statisztikák mind nyilvánosak. Az előző évszázad SARS-járványa alapján napi rendszerességgel készülnek előrejelzések. Ehhez használhat regressziós elemzést és támogatja a vektorgép alapú előrejelzési modelleket.
Következtetés
Összefoglalva, megvitattunk néhány legnépszerűbb ML-projektet, amelyek segítséget nyújtanak a Machine Learning programozás tesztelésében, valamint ötleteinek és megvalósításának megértésében. A gépi tanulás integrálásának ismerete segíthet előrehaladni a szakmájában, mivel a technológia minden iparágban átveszi az uralmat.
A gépi tanulás tanulása közben azt javasoljuk, hogy gyakorolja a fogalmait, és írja le az összes algoritmust. Az algoritmusok írása tanulás közben fontosabb, mint egy projekt végrehajtása, és előnyt jelent a tantárgyak megfelelő megértésében is.
Hagy egy Válaszol