Cuprins[Ascunde][Spectacol]
- 1. Titanic
- 2. Clasificarea florilor irlandeze
- 3. Predicția prețului casei din Boston
- 4. Testarea calității vinului
- 5. Predicția pieței de valori
- 6. Recomandare de film
- 7. Încărcați predicția de eligibilitate
- 8. Analiza sentimentelor folosind datele Twitter
- 9. Predicția viitoare a vânzărilor
- 10. Detectarea știrilor false
- 11. Predicția de cumpărare a cupoanelor
- 12. Predicția abandonului clienților
- 13. Prognoza vânzărilor Wallmart
- 14. Analiza datelor Uber
- 15. Analiza Covid-19
- Concluzie
Învățarea automată este un studiu simplu despre cum să educeți un program de calculator sau un algoritm pentru a îmbunătăți treptat un anumit loc de muncă prezentat la un nivel înalt. Identificarea imaginilor, detectarea fraudelor, sistemele de recomandare și alte aplicații de învățare automată s-au dovedit deja populare.
Joburile ML fac munca umană simplă și eficientă, economisind timp și asigurând un rezultat de înaltă calitate. Chiar și Google, cel mai popular motor de căutare din lume, folosește masina de învățare.
De la analiza interogării utilizatorului și modificarea rezultatului pe baza rezultatelor până la afișarea subiectelor de tendințe și a reclamelor în legătură cu interogarea, există o varietate de opțiuni disponibile.
Tehnologia care este atât perceptivă, cât și auto-corectivă nu este departe în viitor.
Una dintre cele mai bune modalități de a începe este să puneți la punct și să proiectați un proiect. Prin urmare, am compilat o listă cu 15 proiecte de top de învățare automată pentru începători, pentru a vă ajuta să începeți.
1. Titanic
Aceasta este adesea considerată una dintre cele mai mari și mai plăcute sarcini pentru oricine este interesat să învețe mai multe despre învățarea automată. Provocarea Titanic este un proiect popular de învățare automată care servește și ca o modalitate bună de a face cunoștință cu platforma Kaggle de știință a datelor. Setul de date Titanic este alcătuit din date autentice de la scufundarea nefastei nave.
Include detalii precum vârsta persoanei, statutul socioeconomic, sexul, numărul cabinei, portul de plecare și, cel mai important, dacă a supraviețuit!
Tehnica K-Nearest Neighbor și clasificatorul arborelui de decizie au fost determinate să producă cele mai bune rezultate pentru acest proiect. Dacă sunteți în căutarea unei provocări rapide de weekend pentru a vă îmbunătăți Abilități de învățare automată, acesta de pe Kaggle este pentru tine.
2. Clasificarea florilor irlandeze
Începătorilor le place proiectul de clasificare a florilor de iris și este un loc minunat de a începe dacă sunteți nou în învățarea automată. Lungimea sepalelor și petalelor distinge florile de iris de alte specii. Scopul acestui proiect este de a separa florile în trei specii: Virginia, setosa și Versicolor.
Pentru exercițiile de clasificare, proiectul folosește setul de date Iris flower, care îi ajută pe cursanți să învețe elementele fundamentale pentru gestionarea valorilor numerice și a datelor. Setul de date pentru flori de iris este unul minuscul care poate fi stocat în memorie fără a fi nevoie de scalare.
3. Predicția prețului casei din Boston
Un alt cunoscut set de date pentru începători în învățarea automată sunt datele Boston Housing. Scopul său este de a prognoza valorile caselor în diferite cartiere din Boston. Include statistici vitale, cum ar fi vârsta, rata impozitului pe proprietate, rata criminalității și chiar apropierea de centrele de locuri de muncă, toate acestea putând afecta prețul locuințelor.
Setul de date este simplu și mic, făcându-l simplu de experimentat pentru începători. Pentru a ne da seama ce factori influențează prețul proprietății în Boston, tehnicile de regresie sunt foarte utilizate pe diverși parametri. Este un loc grozav pentru a practica tehnicile de regresie și pentru a evalua cât de bine funcționează.
4. Testarea calității vinului
Vinul este o băutură alcoolică neobișnuită care necesită ani de fermentare. Drept urmare, sticla antică de vin este un vin scump și de înaltă calitate. Alegerea sticlei de vin ideală necesită ani de cunoștințe în degustarea vinurilor și poate fi un proces greșit.
Proiectul de testare a calității vinului evaluează vinurile folosind teste fizico-chimice, cum ar fi nivelul de alcool, aciditatea fixă, densitatea, pH-ul și alți factori. Proiectul determină și criteriile de calitate și cantitățile vinului. Ca urmare, cumpărarea vinului devine o briză.
5. Predicția pieței de valori
Această inițiativă este intrigantă dacă lucrezi sau nu în sectorul financiar. Datele bursiere sunt studiate pe larg de către cadre universitare, companii și chiar ca sursă de venit secundar. Capacitatea unui om de știință de date de a studia și explora datele din seria temporală este, de asemenea, vitală. Datele de pe piața de valori sunt un loc excelent pentru a începe.
Esența demersului este de a prognoza valoarea viitoare a unui stoc. Aceasta se bazează pe performanța actuală a pieței, precum și pe statisticile din anii precedenți. Kaggle colectează date despre indicele NIFTY-50 din 2000, iar în prezent este actualizat săptămânal. De la 1 ianuarie 2000, acesta conține prețurile acțiunilor pentru peste 50 de organizații.
6. Recomandare de film
Sunt sigur că ai avut acel sentiment după ce ai văzut un film bun. Ați simțit vreodată impulsul de a vă emoționa simțurile vizionand în mod excesiv filme similare?
Știm că serviciile OTT precum Netflix și-au îmbunătățit semnificativ sistemele de recomandare. În calitate de student în învățarea automată, va trebui să înțelegeți modul în care astfel de algoritmi vizează clienții în funcție de preferințele și recenziile acestora.
Setul de date IMDB de pe Kaggle este probabil unul dintre cele mai complete, permițând modele de recomandare să fie deduse în funcție de titlul filmului, evaluarea clienților, gen și alți factori. Este, de asemenea, o metodă excelentă de a afla despre filtrarea bazată pe conținut și ingineria caracteristicilor.
7. Încărcați predicția de eligibilitate
Lumea se învârte în jurul împrumuturilor. Principala sursă de profit a băncilor provine din dobânda la împrumuturi. Prin urmare, ei sunt afacerea lor fundamentală.
Indivizii sau grupurile de indivizi pot extinde economiile doar prin investirea banilor într-o firmă, în speranța de a o vedea în creștere în valoare în viitor. Uneori este important să cauti un împrumut pentru a putea să-ți asumi riscuri de acest fel și chiar să participi la anumite plăceri lumești.
Înainte ca un împrumut să poată fi acceptat, băncile au în mod normal un proces destul de strict de urmat. Întrucât împrumuturile sunt un aspect atât de crucial al vieții multor oameni, prezicerea eligibilității pentru un împrumut pentru care cineva solicită ar fi extrem de benefică, permițând o planificare mai bună dincolo de acceptarea sau refuzarea împrumutului.
8. Analiza sentimentelor folosind datele Twitter
Datorită rețelele de socializare precum Twitter, Facebook și Reddit, extrapolarea opiniilor și tendințelor a devenit considerabil de ușoară. Aceste informații sunt folosite pentru a elimina opiniile despre evenimente, oameni, sport și alte subiecte. Inițiativele de învățare automată legate de minarea de opinii sunt aplicate într-o varietate de setări, inclusiv campanii politice și evaluări ale produselor Amazon.
Acest proiect va arăta fantastic în portofoliul tău! Pentru detectarea emoțiilor și analiza bazată pe aspecte, tehnici precum mașinile de suport vector, regresia și algoritmii de clasificare pot fi utilizate pe scară largă (găsirea faptelor și a opiniilor).
9. Predicție de vânzări viitoare
Marile companii B2C și comercianții doresc să știe cât de mult se va vinde fiecare produs din inventarul lor. Prognoza vânzărilor îi ajută pe proprietarii de afaceri să determine ce articole sunt la mare căutare. Previziunile exacte ale vânzărilor vor reduce semnificativ risipa, determinând totodată impactul incremental asupra bugetelor viitoare.
Comercianții cu amănuntul precum Walmart, IKEA, Big Basket și Big Bazaar folosesc prognoza vânzărilor pentru a estima cererea de produse. Trebuie să fii familiarizat cu diferite tehnici de curățare a datelor brute pentru a construi astfel de proiecte ML. De asemenea, este necesară o bună înțelegere a analizei de regresie, în special a regresiei liniare simple.
Pentru aceste tipuri de sarcini, va trebui să folosiți biblioteci precum Dora, Scrubadub, Pandas, NumPy și altele.
10. Detectarea știrilor false
Este un alt efort de ultimă oră de învățare automată care vizează școlari. Știrile false se răspândesc ca un incendiu, așa cum știm cu toții. Totul este disponibil pe rețelele sociale, de la conectarea persoanelor la citirea știrilor zilnice.
Ca urmare, detectarea știrilor false a devenit din ce în ce mai dificilă în aceste zile. Multe rețele de socializare mari, cum ar fi Facebook și Twitter, au deja algoritmi pentru a detecta știri false în postări și fluxuri.
Pentru a identifica știrile false, acest tip de proiect ML necesită o înțelegere aprofundată a mai multor abordări NLP și a algoritmilor de clasificare (PassiveAggressiveClassifier sau Naive Bayes classifier).
11. Predicția de cumpărare a cupoanelor
Clienții se gândesc din ce în ce mai mult la cumpărarea online, atunci când coronavirusul a atacat planeta în 2020. Drept urmare, unitățile de cumpărături au fost obligate să-și schimbe afacerea online.
Clienții, pe de altă parte, caută în continuare oferte grozave, așa cum erau în magazine, și caută din ce în ce mai mult cupoane super-economisitoare. Există chiar și site-uri web dedicate creării de cupoane pentru astfel de clienți. Puteți afla despre extragerea datelor în învățarea automată, producând grafice cu bare, diagrame circulare și histograme pentru a vizualiza datele și ingineria caracteristicilor cu acest proiect.
Pentru a genera predicții, puteți analiza, de asemenea, abordările de imputare a datelor pentru gestionarea valorilor NA și similitudinea cosinus a variabilelor.
12. Predicția abandonului clienților
Consumatorii sunt cel mai important activ al unei companii, iar păstrarea acestora este vitală pentru orice afacere care urmărește să crească veniturile și să construiască conexiuni semnificative pe termen lung cu aceștia.
În plus, costul achiziției unui nou client este de cinci ori mai mare decât costul întreținerii unuia existent. Retragerea/uzura clienților este o problemă de afaceri bine-cunoscută în care clienții sau abonații încetează să facă afaceri cu un serviciu sau o companie.
În mod ideal, aceștia nu vor mai fi un client plătitor. Un client este considerat renuntat dacă a trecut o anumită perioadă de timp de la ultima interacțiune a clientului cu compania. Identificarea dacă un client va renunța, precum și furnizarea rapidă a informațiilor relevante care vizează reținerea clienților, sunt esențiale pentru reducerea ratei.
Creierul nostru este incapabil să anticipeze cifra de afaceri pentru milioane de clienți; aici este locul în care învățarea automată poate ajuta.
13. Prognoza vânzărilor Wallmart
Una dintre cele mai proeminente aplicații ale învățării automate este prognoza vânzărilor, care implică detectarea caracteristicilor care influențează vânzările de produse și anticiparea volumului vânzărilor viitoare.
Setul de date Walmart, care conține date despre vânzări din 45 de locații, este utilizat în acest studiu de învățare automată. Vânzările per magazin, pe categorii, săptămânal sunt incluse în setul de date. Scopul acestui proiect de învățare automată este de a anticipa vânzările pentru fiecare departament din fiecare punct de vânzare, astfel încât aceștia să poată lua decizii mai bune de optimizare a canalelor bazate pe date și de planificare a inventarului.
Lucrul cu setul de date Walmart este dificil, deoarece conține evenimente de reducere alese care au un impact asupra vânzărilor și ar trebui luate în considerare.
14. Analiza datelor Uber
Când vine vorba de implementarea și integrarea învățării automate și a învățării profunde în aplicațiile lor, popularul serviciu de partajare a călătoriei nu este departe. În fiecare an, procesează miliarde de călătorii, permițând navetiștilor să călătorească la orice oră din zi sau din noapte.
Deoarece are o bază de clienți atât de mare, are nevoie de servicii excepționale pentru clienți pentru a aborda reclamațiile consumatorilor cât mai repede posibil.
Uber are un set de date de milioane de ridicări pe care le poate folosi pentru a analiza și afișa călătoriile clienților pentru a descoperi informații și a îmbunătăți experiența clienților.
15. Analiza Covid-19
COVID-19 a măturat globul astăzi, și nu pur și simplu în sensul unei pandemii. În timp ce experții medicali se concentrează pe generarea de vaccinări eficiente și imunizarea lumii, oamenii de știință de date nu sunt departe în urmă.
Noile cazuri, numărul activ zilnic, decesele și statisticile de testare sunt toate făcute publice. Prognozele se fac zilnic pe baza focarului de SARS din secolul precedent. Pentru aceasta, puteți utiliza analiza de regresie și puteți sprijini modele de predicție bazate pe mașini vectoriale.
Concluzie
Pentru a rezuma, am discutat câteva dintre cele mai importante proiecte ML care vă vor ajuta să testați programarea Machine Learning, precum și să înțelegeți ideile și implementarea acesteia. A ști cum să integrezi Machine Learning te poate ajuta să avansezi în profesia ta, pe măsură ce tehnologia preia controlul în fiecare industrie.
În timp ce învățați Machine Learning, vă recomandăm să vă exersați conceptele și să vă scrieți toți algoritmii. Scrierea algoritmilor în timp ce învățați este mai importantă decât realizarea unui proiect și vă oferă, de asemenea, un avantaj în înțelegerea corectă a subiectelor.
Lasă un comentariu