Kazalo[Skrij][Pokaži]
- 1. Titanik
- 2. Irska razvrstitev cvetov
- 3. Napoved cene hiše v Bostonu
- 4. Preizkušanje kakovosti vina
- 5. Napoved borze
- 6. Priporočilo filma
- 7. Napoved primernosti obremenitve
- 8. Analiza razpoloženja z uporabo podatkov Twitterja
- 9. Napoved prihodnje prodaje
- 10. Zaznavanje lažnih novic
- 11. Napoved nakupa kuponov
- 12. Napoved odliva strank
- 13. Wallmart prodajno napovedovanje
- 14. Analiza podatkov Uber
- 15. Analiza Covid-19
- zaključek
Strojno učenje je preprosta študija o tem, kako izobraziti računalniški program ali algoritem za postopno izboljšanje določenega dela, predstavljenega na visoki ravni. Identifikacija slik, odkrivanje goljufij, sistemi priporočil in druge aplikacije za strojno učenje so se že izkazale za priljubljene.
Dela ML omogočajo preprosto in učinkovito človeško delo, prihranijo čas in zagotavljajo visokokakovosten rezultat. Uporablja celo Google, najbolj priljubljen iskalnik na svetu strojno učenje.
Od analize uporabnikove poizvedbe in spreminjanja rezultata na podlagi rezultatov do prikaza trendovskih tem in oglasov v zvezi s poizvedbo, so na voljo različne možnosti.
Tehnologija, ki je hkrati zaznavna in samopopravljajoča, v prihodnosti ni daleč.
Eden najboljših načinov za začetek je, da se oprimete in oblikujete projekt. Zato smo sestavili seznam 15 najboljših projektov strojnega učenja za začetnike, da boste lahko začeli.
1. Titanic
To se pogosto šteje za eno največjih in najbolj prijetnih nalog za vse, ki jih zanima več o strojnem učenju. Izziv Titanic je priljubljen projekt strojnega učenja, ki služi tudi kot dober način za seznanitev s platformo za podatkovno znanost Kaggle. Podatkovni niz Titanic je sestavljen iz pristnih podatkov o potopitvi nesrečne ladje.
Vključuje podrobnosti, kot so starost osebe, socialno-ekonomski status, spol, številka kabine, pristanišče odhoda in, kar je najpomembneje, ali je preživela!
Tehnika K-najbližjega soseda in klasifikator drevesa odločitev sta bila odločena, da zagotovita najboljše rezultate za ta projekt. Če iščete hiter vikend izziv, da bi izboljšali svoj Sposobnosti strojnega učenja, ta na Kaggle je za vas.
2. Razvrstitev irskih cvetov
Začetnikom je všeč projekt kategorizacije cvetov perunike in je odličen kraj za začetek, če ste novi v strojnem učenju. Dolžina listov in cvetnih listov razlikuje cvetenje irisa od drugih vrst. Namen tega projekta je ločiti cvetove na tri vrste: Virginia, Setosa in Versicolor.
Za vaje za razvrščanje uporablja projekt nabor podatkov o cvetu perunike, ki učencem pomaga pri učenju osnov ravnanja s številskimi vrednostmi in podatki. Podatkovni nabor cvetov irisa je majhen, ki ga je mogoče shraniti v pomnilnik brez potrebe po spreminjanju velikosti.
3. Napoved cene hiše v Bostonu
Še ena dobro znana nabor podatkov za začetnike v strojnem učenju so podatki Boston Housing. Njegov cilj je napovedati vrednosti stanovanj v različnih soseskah Bostona. Vključuje vitalne statistične podatke, kot so starost, stopnja davka na nepremičnine, stopnja kriminala in celo bližina zaposlitvenih centrov, kar bi lahko vplivalo na cene stanovanj.
Podatkovni niz je preprost in majhen, zaradi česar je novincem preprosto eksperimentirati. Da bi ugotovili, kateri dejavniki vplivajo na ceno nepremičnine v Bostonu, se pri različnih parametrih močno uporabljajo regresijske tehnike. To je odličen kraj za vadbo regresijskih tehnik in oceno, kako dobro delujejo.
4. Testiranje kakovosti vina
Vino je nenavadna alkoholna pijača, ki zahteva leta fermentacije. Posledično je starinska steklenica vina drago in kakovostno vino. Izbira idealne steklenice vina zahteva leta znanja o degustaciji vin in je lahko postopek zadeti ali zamuditi.
Projekt testiranja kakovosti vina ocenjuje vina s fizikalno-kemijskimi testi, kot so alkohol, fiksna kislost, gostota, pH in drugi dejavniki. Projekt določa tudi merila kakovosti in količine vina. Posledično postane nakup vina preprost.
5. Napoved borze
Ta pobuda je zanimiva, ali delate v finančnem sektorju ali ne. Podatke o borzi obsežno preučujejo akademiki, podjetja in celo kot vir sekundarnega dohodka. Bistvena je tudi sposobnost podatkovnega znanstvenika, da preučuje in raziskuje podatke časovnih vrst. Podatki z borze so odličen začetek.
Bistvo prizadevanja je napovedati prihodnjo vrednost delnice. To temelji na trenutni uspešnosti trga in statističnih podatkih iz preteklih let. Kaggle podatke o indeksu NIFTY-50 zbira že od leta 2000, trenutno pa se posodablja tedensko. Od 1. januarja 2000 vsebuje cene delnic za več kot 50 organizacij.
6. Priporočilo za film
Prepričan sem, da ste imeli ta občutek po ogledu dobrega filma. Ste že kdaj začutili impulz, da bi vznemirili svoje čute s požirnim gledanjem podobnih filmov?
Vemo, da so storitve OTT, kot je Netflix, bistveno izboljšale svoje sisteme priporočil. Kot študent strojnega učenja boste morali razumeti, kako takšni algoritmi ciljajo na stranke glede na njihove želje in ocene.
Nabor podatkov IMDB na Kaggleu je verjetno eden najbolj popolnih, saj omogoča sklepanje o modelih priporočil na podlagi naslova filma, ocene strank, žanra in drugih dejavnikov. Prav tako je odlična metoda za učenje o filtriranju na podlagi vsebine in inženiringu funkcij.
7. Napoved primernosti nalaganja
Svet se vrti okoli posojil. Glavni vir dobička bank so obresti na posojila. Zato so njihov temeljni posel.
Posamezniki ali skupine posameznikov lahko širijo gospodarstva le tako, da vlagajo denar v podjetje v upanju, da se bo njegova vrednost v prihodnosti povečala. Včasih je pomembno poiskati posojilo, da bi lahko prevzeli tovrstna tveganja in se celo udeležili določenih posvetnih užitkov.
Preden se posojilo lahko sprejme, morajo banke običajno slediti dokaj strogemu postopku. Ker so posojila tako ključen vidik življenja mnogih ljudi, bi bilo napovedovanje upravičenosti do posojila, za katerega nekdo zaprosi, izjemno koristno, saj bi omogočilo boljše načrtovanje poleg sprejetja ali zavrnitve posojila.
8. Analiza razpoloženja z uporabo podatkov Twitterja
Zahvaljujoč socialna omrežja kot so Twitter, Facebook in Reddit, je ekstrapolacija mnenj in trendov postala precej enostavna. Te informacije se uporabljajo za odpravo mnenj o dogodkih, ljudeh, športu in drugih temah. Pobude za strojno učenje, povezane z rudarjenjem mnenja, se uporabljajo v različnih okoljih, vključno s političnimi kampanjami in ocenami izdelkov Amazon.
Ta projekt bo videti fantastično v vašem portfelju! Za odkrivanje čustev in analizo, ki temelji na vidiku, se lahko obsežno uporabljajo tehnike, kot so stroji podpornih vektorjev, regresija in klasifikacijski algoritmi (iskanje dejstev in mnenj).
9. Napoved prihodnje prodaje
Velika B2C podjetja in trgovci želijo vedeti, koliko se bo vsak izdelek v njihovem zalogi prodal. Napovedovanje prodaje pomaga lastnikom podjetij pri določanju, po katerih artiklih je veliko povpraševanje. Natančno napovedovanje prodaje bo znatno zmanjšalo izgubo, hkrati pa bo določilo inkrementalni vpliv na prihodnje proračune.
Trgovci na drobno, kot so Walmart, IKEA, Big Basket in Big Bazaar, uporabljajo napovedovanje prodaje za oceno povpraševanja po izdelkih. Če želite zgraditi takšne projekte ML, morate poznati različne tehnike čiščenja neobdelanih podatkov. Prav tako je potrebno dobro razumevanje regresijske analize, zlasti enostavne linearne regresije.
Za tovrstne naloge boste morali uporabiti knjižnice, kot so Dora, Scrubadub, Pandas, NumPy in druge.
10. Zaznavanje lažnih novic
To je še ena najsodobnejša prizadevanja za strojno učenje, namenjena šolarjem. Lažne novice se širijo kot požar, kot vsi vemo. Na družbenih omrežjih je na voljo vse, od povezovanja posameznikov do branja dnevnih novic.
Posledično je odkrivanje lažnih novic v teh dneh vse težje. Številna velika omrežja družbenih medijev, kot sta Facebook in Twitter, že imajo vzpostavljene algoritme za odkrivanje lažnih novic v objavah in virih.
Za odkrivanje lažnih novic ta vrsta projekta ML potrebuje temeljito razumevanje več pristopov NLP in klasifikacijskih algoritmov (PassiveAggressiveClassifier ali Naive Bayesov klasifikator).
11. Napoved nakupa kuponov
Kupci vse pogosteje razmišljajo o spletnem nakupovanju, ko je koronavirus napadel planet leta 2020. Zaradi tega so bile nakupovalne ustanove prisiljene svoje poslovanje preusmeriti na splet.
Kupci po drugi strani še vedno iščejo odlične ponudbe, tako kot so bile v trgovinah, in vse bolj iščejo super varčne kupone. Obstajajo celo spletna mesta, namenjena ustvarjanju kuponov za takšne stranke. S tem projektom se lahko naučite o rudarjenju podatkov v strojnem učenju, izdelavi paličnih grafov, tortnih grafikonov in histogramov za vizualizacijo podatkov ter inženiring funkcij.
Če želite ustvariti napovedi, si lahko ogledate tudi pristope imputacije podatkov za upravljanje vrednosti NA in kosinusne podobnosti spremenljivk.
12. Napoved odliva strank
Potrošniki so najpomembnejše premoženje podjetja in njihovo ohranjanje je ključnega pomena za vsako podjetje, ki si prizadeva povečati prihodke in zgraditi dolgoročne pomembne povezave z njimi.
Poleg tega so stroški pridobitve nove stranke petkrat višji od stroškov vzdrževanja obstoječe. Izguba/izguba strank je dobro znan poslovni problem, pri katerem stranke ali naročniki prenehajo poslovati s storitvijo ali podjetjem.
V idealnem primeru ne bodo več plačljiva stranka. Šteje se, da je stranka zavrnjena, če je od zadnje interakcije stranke s podjetjem minilo določen čas. Ugotavljanje, ali bo stranka odtekala, in hitro posredovanje ustreznih informacij, katerih cilj je obdržati stranko, sta ključnega pomena za zmanjšanje odliva.
Naši možgani niso sposobni predvideti prometa strank za milijone strank; tukaj vam lahko pomaga strojno učenje.
13. Wallmart prodajno napovedovanje
Ena najvidnejših aplikacij strojnega učenja je napovedovanje prodaje, ki vključuje odkrivanje značilnosti, ki vplivajo na prodajo izdelkov, in predvidevanje prihodnjega obsega prodaje.
V tej študiji strojnega učenja je uporabljen nabor podatkov Walmart, ki vsebuje podatke o prodaji s 45 lokacij. Prodaja na trgovino, po kategorijah, na tedenski ravni je vključena v nabor podatkov. Namen tega projekta strojnega učenja je predvideti prodajo za vsak oddelek v vsaki poslovalnici, tako da lahko sprejmejo boljšo optimizacijo kanalov na podlagi podatkov in odločitve o načrtovanju zalog.
Delo z naborom podatkov Walmart je težko, saj vsebuje izbrane dogodke znižanja vrednosti, ki vplivajo na prodajo in jih je treba upoštevati.
14. Analiza podatkov Uber
Ko gre za implementacijo in integracijo strojnega učenja in globokega učenja v njihove aplikacije, priljubljena storitev deljenja vožnje ne zaostaja veliko. Vsako leto obdela na milijarde potovanj, kar potnikom omogoča, da potujejo kadar koli podnevi ali ponoči.
Ker ima tako veliko bazo strank, potrebuje izjemno storitev za stranke, da čim hitreje obravnava pritožbe potrošnikov.
Uber ima nabor podatkov o milijonih prevzemov, ki jih lahko uporabi za analizo in prikaz potovanj strank, da odkrije vpoglede in izboljša uporabniško izkušnjo.
15. Analiza Covid-19
COVID-19 je danes zajel svet in ne le v smislu pandemije. Medtem ko se medicinski strokovnjaki osredotočajo na ustvarjanje učinkovitih cepiv in imunizacijo sveta, podatkovni znanstveniki ne zaostajajo daleč.
Novi primeri, dnevno aktivno število, smrtni primeri in statistika testiranja so objavljeni. Napovedi so narejene vsak dan na podlagi izbruha SARS v prejšnjem stoletju. Za to lahko uporabite regresijsko analizo in podprete vektorske strojno zasnovane modele napovedi.
zaključek
Če povzamemo, smo razpravljali o nekaterih najboljših projektih ML, ki vam bodo pomagali pri testiranju programiranja strojnega učenja ter razumeti njegove ideje in implementacijo. Znanje, kako integrirati strojno učenje, vam lahko pomaga napredovati v vašem poklicu, saj tehnologija prevzema vse prednosti v vsaki panogi.
Med učenjem strojnega učenja vam priporočamo, da vadite svoje koncepte in napišete vse svoje algoritme. Pisanje algoritmov med učenjem je pomembnejše od izvajanja projekta, poleg tega pa vam daje prednost pri pravilnem razumevanju predmetov.
Pustite Odgovori