Sisällysluettelo[Piilottaa][Näytä]
- 1. titaanimainen
- 2. Irlannin kukkaluokitus
- 3. Bostonin asunnon hintaennuste
- 4. Viinin laadun testaus
- 5. Osakemarkkinoiden ennuste
- 6. Elokuvasuositus
- 7. Lataamiskelpoisuusennuste
- 8. Tunneanalyysi Twitter-tietojen avulla
- 9. Tulevaisuuden myynnin ennuste
- 10. Fake News Detection
- 11. Kupongin ostoennuste
- 12. Asiakkaan vaihtuvuuden ennuste
- 13. Wallmartin myyntiennuste
- 14. Uber-dataanalyysi
- 15. Covid-19-analyysi
- Yhteenveto
Koneoppiminen on yksinkertainen tutkimus siitä, kuinka tietokoneohjelmaa tai algoritmia voidaan kouluttaa parantamaan vähitellen tiettyä korkeatasoista työtä. Kuvien tunnistaminen, petosten havaitseminen, suositusjärjestelmät ja muut koneoppimissovellukset ovat jo osoittautuneet suosituiksi.
ML työt tekee ihmisten työn yksinkertaisia ja tehokkaita, mikä säästää aikaa ja varmistaa laadukkaan tuloksen. Jopa Google, maailman suosituin hakukone, käyttötarkoitukset koneoppiminen.
Käytettävissä on useita vaihtoehtoja käyttäjän kyselyn analysoinnista ja tulosten muuttamisesta tulosten perusteella trendaavien aiheiden ja mainosten näyttämiseen suhteessa kyselyyn.
Teknologia, joka on sekä havaitsevaa että itseään korjaavaa, ei ole kaukana tulevaisuudessa.
Yksi parhaista tavoista päästä alkuun on perehtyä käytäntöön ja suunnitella projekti. Siksi olemme koonneet aloittelijoille luettelon 15 parhaasta koneoppimisprojektista, jotta pääset alkuun.
1. Titaanimainen
Tätä pidetään usein yhtenä suurimmista ja nautinnollisimmista tehtävistä kaikille, jotka ovat kiinnostuneita oppimaan lisää koneoppimisesta. Titanic-haaste on suosittu koneoppimisprojekti, joka toimii myös hyvänä tapana tutustua Kaggle-datatieteen alustaan. Titanic-tietojoukko koostuu aidosta tiedosta huono-onnisen aluksen uppoamisesta.
Se sisältää tietoja, kuten henkilön iän, sosioekonomisen aseman, sukupuolen, hytin numeron, lähtösataman ja mikä tärkeintä, selviytyivätkö he hengissä!
K-lähin naapuri -tekniikka ja päätöspuuluokitin määritettiin tuottamaan parhaat tulokset tähän projektiin. Jos etsit nopeaa viikonloppuhaastetta parantaaksesi Koneoppimisen kykyjä, tämä Kaggle on sinua varten.
2. Irlannin kukkaluokitus
Aloittelijat pitävät iiriskukkien luokitteluprojektista, ja se on loistava paikka aloittaa, jos olet uusi koneoppimisen parissa. Verholehtien ja terälehtien pituus erottaa iiriksen kukinnan muista lajeista. Tämän projektin tarkoituksena on jakaa kukinnot kolmeen lajiin: Virginia, setosa ja Versicolor.
Luokitteluharjoituksissa hankkeessa käytetään Iris-kukkatietoaineistoa, joka auttaa oppilaita numeeristen arvojen ja datan käsittelyn perusteiden oppimisessa. Iriskukkatietojoukko on pienikokoinen, joka voidaan tallentaa muistiin ilman skaalausta.
3. Bostonin asunnon hintaennuste
Toinen tuttu tietojoukko koneoppimisen aloittelijoille on Boston Housingin tiedot. Sen tavoitteena on ennustaa asuntojen arvoja Bostonin eri kaupunginosissa. Se sisältää tärkeitä tilastoja, kuten iän, kiinteistöverokannan, rikollisuuden ja jopa työvoimakeskusten läheisyyden, jotka kaikki saattavat vaikuttaa asuntojen hinnoitteluun.
Tietojoukko on yksinkertainen ja pieni, joten sitä on helppo kokeilla aloittelijoille. Jotta voidaan selvittää, mitkä tekijät vaikuttavat kiinteistön hintaan Bostonissa, regressiotekniikoita käytetään voimakkaasti useissa parametreissä. Se on loistava paikka harjoitella regressiotekniikoita ja arvioida, kuinka hyvin ne toimivat.
4. Viinin laadun testaus
Viini on epätavallinen alkoholijuoma, joka vaatii vuosien käymisen. Tämän seurauksena antiikkinen viinipullo on tyyris ja laadukas viini. Ihanteellisen viinipullon valitseminen vaatii vuosien kokemusta viininmaistelusta, ja se voi olla osuma-or-miss-prosessi.
Viinin laatutestiprojektissa viinejä arvioidaan fysikaalis-kemiallisilla testeillä, kuten alkoholipitoisuus, kiinteä happamuus, tiheys, pH ja muut tekijät. Hankkeessa määritellään myös viinin laatukriteerit ja määrät. Tämän seurauksena viinin ostamisesta tulee helppoa.
5. Osakemarkkinoiden ennuste
Tämä aloite on kiehtova vai et toimi rahoitusalalla. Osakemarkkinatietoja tutkivat laajasti tiedemiehet, yritykset ja jopa toissijaisen tulon lähteenä. Tietojen tiedemies kykyä opiskella ja tutkia aikasarjatiedot on myös tärkeää. Osakemarkkinoiden data on hyvä paikka aloittaa.
Ydin pyrkimys on ennustaa tulevan arvon varastossa. Tämä perustuu nykyiseen markkinoiden toimivuuteen sekä tilastoja ennen vuotta. Kaggle on kerännyt tietoja Näppärä-50-indeksi vuodesta 2000, ja se on tällä hetkellä päivitetään viikoittain. Tammikuun 1. päivästä lähtien, 2000 se on sisältänyt pörssikursseja yli 50 organisaatioille.
6. Elokuvasuositus
Olen varma, että olet ollut sitä tunnetta nähtyään hyvä elokuva. Oletko koskaan tuntenut impulssi kutkuttaa aistisi humalahakuinen katsomassa samanlaisia elokuvia?
Tiedämme, että OTT-palvelut, kuten Netflix, ovat parantaneet suositusjärjestelmiään merkittävästi. Koneoppimisen opiskelijana sinun on ymmärrettävä, kuinka tällaiset algoritmit kohdistavat asiakkaita heidän mieltymyksiensä ja arvostelujensa perusteella.
Kagglen IMDB-tietojoukko on todennäköisesti yksi täydellisimmistä, minkä ansiosta suositusmalleista voidaan päätellä elokuvan nimen, asiakasarvion, genren ja muiden tekijöiden perusteella. Se on myös erinomainen tapa oppia sisältöpohjaisesta suodatuksesta ja ominaisuussuunnittelusta.
7. Lataamiskelpoisuusennuste
Maailma pyörii lainojen ympärillä. Pankkien suurin tulonlähde tulee lainojen koroista. Siksi ne ovat heidän perusliiketoimintaansa.
Yksilöt tai yksilöryhmät voivat laajentaa talouksiaan vain sijoittamalla rahaa yritykseen siinä toivossa, että sen arvo nousee tulevaisuudessa. Joskus on tärkeää hakea lainaa voidakseen ottaa tällaisia riskejä ja jopa nauttia tietyistä maallisista nautinnoista.
Ennen laina voidaan hyväksyä, pankit yleensä melko tiukka prosessi noudattaa. Koska lainat ovat erittäin tärkeä osa monien ihmisten elämää, jonkun hakeman lainakelpoisuuden ennustaminen olisi erittäin hyödyllistä, mikä mahdollistaisi paremman suunnittelun lainan hyväksymisen tai hylkäämisen jälkeen.
8. Tunneanalyysi Twitter-tietojen avulla
Kiitokset sosiaalisen median verkot Kuten Twitter, Facebook ja Reddit, mielipiteiden ja trendien ekstrapoloiminen on helpottunut huomattavasti. Näitä tietoja käytetään poistamaan mielipiteitä tapahtumista, ihmisistä, urheilusta ja muista aiheista. Mielipidelouhintaan liittyviä koneoppimisaloitteita sovelletaan useissa eri ympäristöissä, kuten poliittisissa kampanjoissa ja Amazon-tuotteiden arvioinnissa.
Tämä projekti näyttää upealta portfoliossasi! Tunteiden havaitsemiseen ja aspektipohjaiseen analyysiin voidaan käyttää laajasti tekniikoita, kuten tukivektorikoneita, regressio- ja luokittelualgoritmeja (faktien ja mielipiteiden löytäminen).
9. Tulevaisuuden myynnin ennuste
Suuret B2C-yritykset ja -kauppiaat haluavat tietää, kuinka paljon kukin heidän varastonsa tuote myy. Myynnin ennustaminen auttaa yritysten omistajia määrittämään, mitkä tuotteet ovat erittäin kysyttyjä. Tarkka myynnin ennustaminen vähentää merkittävästi hukkaa ja määrittää samalla lisävaikutuksen tuleviin budjetteihin.
Jälleenmyyjät, kuten Walmart, IKEA, Big Basket ja Big Bazaar, käyttävät myyntiennusteita arvioidakseen tuotteiden kysyntää. Sinun on tunnettava erilaiset raakadatan puhdistustekniikat voidaksesi rakentaa tällaisia ML-projekteja. Lisäksi vaaditaan hyvä käsitys regressioanalyysistä, erityisesti yksinkertaisesta lineaarisesta regressiosta.
Tällaisia tehtäviä varten sinun on käytettävä kirjastoja, kuten Dora, Scrubadub, Pandas, NumPy ja muita.
10. Valeuutisten tunnistus
Se on toinen huippuluokan koneoppimisyritys, joka on suunnattu koululaisille. Valeuutiset leviävät kulovalkean tavoin, kuten me kaikki tiedämme. Kaikki on saatavilla sosiaalisessa mediassa yksilöiden yhdistämisestä päivittäisten uutisten lukemiseen.
Tämän seurauksena väärien uutisten havaitseminen on muuttunut nykyään yhä vaikeammaksi. Monilla suurilla sosiaalisen median verkostoilla, kuten Facebookilla ja Twitterillä, on jo käytössä algoritmeja, jotka havaitsevat vääriä uutisia viesteissä ja syötteissä.
Väärien uutisten tunnistamiseksi tämän tyyppinen ML-projekti tarvitsee perusteellisen ymmärryksen useista NLP-lähestymistapoista ja luokitusalgoritmeista (PassiveAggressiveClassifier tai Naive Bayes-luokitin).
11. Kupongin ostoennuste
Asiakkaat harkitsevat yhä enemmän verkko-ostoksia, kun koronavirus hyökkäsi planeetalle vuonna 2020. Tämän seurauksena kauppaliikkeet ovat joutuneet siirtämään liiketoimintansa verkkoon.
Asiakkaat, toisaalta, hakevat edelleen suuria tarjouksia, aivan kuin ne olivat kaupoissa, ja yhä metsästys super säästäviä kuponkeja. On jopa verkkosivuja luomalla kuponkeja näihin asiakkaisiin. Voit oppia tiedon louhinta koneoppimisen, tuottavat pylväskaaviot, piirakkakuvioita ja histogrammit tietojen visualisointiin ja ominaisuus engineering tähän projektiin.
Voit luoda ennusteita myös tutkimalla datan imputointimenetelmiä NA-arvojen ja muuttujien kosinin samankaltaisuuden hallitsemiseksi.
12. Asiakkaan Churn -ennuste
Kuluttajat ovat yrityksen tärkein voimavara, ja niiden säilyttäminen on elintärkeää kaikille yrityksille, jotka pyrkivät kasvattamaan liikevaihtoa ja rakentamaan heidän kanssaan pitkäaikaisia mielekkäitä yhteyksiä.
Lisäksi uuden asiakkaan hankintakustannukset ovat viisi kertaa korkeammat kuin olemassa olevan asiakkaan ylläpitämisen kustannukset. Asiakkaiden vaihtuvuus/poistuminen on hyvin tunnettu yritysongelma, jossa asiakkaat tai tilaajat lopettavat liiketoimintansa palvelun tai yrityksen kanssa.
Ihannetapauksessa he eivät enää ole maksavia asiakkaita. Asiakas katsotaan hylätyksi, jos on kulunut tietty aika siitä, kun asiakas on viimeksi ollut vuorovaikutuksessa yrityksen kanssa. Asiakkaan vaihtuvuuden tunnistaminen sekä asianmukaisten tietojen nopea antaminen asiakkaiden säilyttämiseksi ovat ratkaisevan tärkeitä vaihtuvuuden vähentämisessä.
Aivomme eivät kykene ennakoimaan asiakkaan liikevaihdon miljoonille asiakkaille; tässä on, jos kone oppiminen voi auttaa.
13. Wallmartin myyntiennuste
Yksi koneoppimisen näkyvimmistä sovelluksista on myynnin ennustaminen, jossa havaitaan tuotemyyntiin vaikuttavia ominaisuuksia ja ennakoidaan tulevaa myyntivolyymiä.
Tässä koneoppimistutkimuksessa käytetään Walmart-tietojoukkoa, joka sisältää myyntitietoja 45 sijainnista. Myynti myymälän, luokittain, viikoittain sisältyvät aineisto. Tämän koneoppimisprojektin tarkoituksena on ennakoida myyntiä jokaiselle osastolle kussakin toimipisteessä, jotta he voivat tehdä parempia datapohjaisia kanavaoptimointi- ja varastosuunnittelupäätöksiä.
Walmart-tietojoukon kanssa työskentely on vaikeaa, koska se sisältää valittuja alennuksia, jotka vaikuttavat myyntiin ja jotka on otettava huomioon.
14. Uberin data-analyysi
Mitä tulee koneoppimisen ja syväoppimisen toteuttamiseen ja integroimiseen heidän sovelluksiinsa, suosittu kyytipalvelu ei ole kaukana perässä. Joka vuosi se käsittelee miljardeja matkoja, jolloin työmatkalaiset voivat matkustaa mihin aikaan tahansa päivästä tai yöstä.
Koska sillä on niin laaja asiakaskunta, se tarvitsee poikkeuksellista asiakaspalvelua käsitelläkseen kuluttajien valitukset mahdollisimman nopeasti.
Uberilla on miljoonia poimintoja sisältävä tietojoukko, jonka avulla se voi analysoida ja näyttää asiakkaiden matkoja saadakseen oivalluksia ja parantaakseen asiakaskokemusta.
15. Covid-19-analyysi
COVID-19 on pyyhkäissyt maapallon tänään, eikä vain pandemian merkityksessä. Samalla kun lääketieteen asiantuntijat keskittyvät luomaan tehokkaita rokotteita ja rokottamaan maailmaa, tietojen tutkijat eivät ole kaukana jäljessä.
Uudet tapaukset, päivittäinen aktiivisten määrä, kuolemantapaukset ja testitilastot julkistetaan. Ennusteita tehdään päivittäin edellisen vuosisadan SARS-epidemian perusteella. Tätä varten voit käyttää regressioanalyysiä ja tukea vektorikonepohjaisia ennustemalleja.
Yhteenveto
Yhteenvetona totean, että olemme keskustelleet joistakin parhaista ML-projekteista, jotka auttavat sinua koneoppimisohjelmoinnin testaamisessa sekä sen ideoiden ja toteutuksen ymmärtämisessä. Koneoppimisen integroinnin tunteminen voi auttaa sinua edistymään ammatissasi, kun teknologia ottaa vallan kaikilla toimialoilla.
Kun opit koneoppimista, suosittelemme, että harjoittelet käsitteitäsi ja kirjoitat kaikki algoritmisi. Algoritmien kirjoittaminen oppimisen aikana on tärkeämpää kuin projektin suorittaminen, ja se tarjoaa myös edun oppiaineiden ymmärtämisessä.
Jätä vastaus