Taula de continguts[Amaga][Espectacle]
- 1. Titànic
- 2. Classificació de les flors irlandeses
- 3. Predicció del preu de la casa de Boston
- 4. Assajos de qualitat del vi
- 5. Predicció de borsa
- 6. Recomanació de pel·lícules
- 7. Predicció d'elegibilitat de càrrega
- 8. Anàlisi de sentiments mitjançant dades de Twitter
- 9. Predicció de vendes futures
- 10. Detecció de notícies falses
- 11. Predicció de compra de cupons
- 12. Predicció de la deserció del client
- 13. Previsió de vendes de Wallmart
- 14. Anàlisi de dades d'Uber
- 15. Anàlisi Covid-19
- Conclusió
L'aprenentatge automàtic és un estudi senzill sobre com educar un programa informàtic o algorisme per millorar gradualment un treball específic presentat a un alt nivell. La identificació d'imatges, la detecció de fraus, els sistemes de recomanació i altres aplicacions d'aprenentatge automàtic ja han demostrat ser populars.
Els treballs de ML fan que el treball humà sigui senzill i eficient, estalviant temps i garantint un resultat d'alta qualitat. Fins i tot Google, el motor de cerca més popular del món, utilitza màquina d'aprenentatge.
Des de l'anàlisi de la consulta de l'usuari i l'alteració del resultat en funció dels resultats fins a mostrar temes de tendència i anuncis relacionats amb la consulta, hi ha una varietat d'opcions disponibles.
La tecnologia que és alhora perceptiva i autocorregidora no està lluny en el futur.
Una de les millors maneres de començar és posar-se en pràctica i dissenyar un projecte. Per tant, hem compilat una llista dels 15 millors projectes d'aprenentatge automàtic per a principiants per començar.
1. Titanic
Sovint es considera que aquesta és una de les tasques més grans i agradables per a qualsevol persona interessada a aprendre més sobre l'aprenentatge automàtic. El repte del Titanic és un projecte d'aprenentatge automàtic popular que també serveix com una bona manera de familiaritzar-se amb la plataforma de ciència de dades de Kaggle. El conjunt de dades del Titanic està format per dades genuïnes de l'enfonsament del desafortunat vaixell.
Inclou detalls com l'edat de la persona, l'estat socioeconòmic, el gènere, el número de cabina, el port de sortida i, el més important, si van sobreviure!
La tècnica K-Nearest Neighbor i el classificador de l'arbre de decisió es van determinar per produir els millors resultats per a aquest projecte. Si estàs buscant un repte de cap de setmana ràpid per millorar el teu Habilitats d'aprenentatge automàtic, aquest de Kaggle és per a tu.
2. Classificació de flors irlandeses
Als principiants els encanta el projecte de categorització de flors de l'iris, i és un bon lloc per començar si sou nou en l'aprenentatge automàtic. La longitud dels sèpals i pètals distingeix les flors de l'iris d'altres espècies. L'objectiu d'aquest projecte és separar les flors en tres espècies: Virginia, setosa i Versicolor.
Per als exercicis de classificació, el projecte utilitza el conjunt de dades de flors d'iris, que ajuda els estudiants a aprendre els fonaments del tractament amb valors i dades numèriques. El conjunt de dades de la flor de l'iris és petit que es pot emmagatzemar a la memòria sense necessitat d'escalar.
3. Predicció del preu de la casa de Boston
Un altre conegut conjunt de dades per a principiants en aprenentatge automàtic són les dades de Boston Housing. El seu objectiu és preveure els valors de les cases a diversos barris de Boston. Inclou estadístiques vitals com ara l'edat, la taxa d'impostos sobre la propietat, la taxa de criminalitat i fins i tot la proximitat als centres de treball, que poden afectar els preus de l'habitatge.
El conjunt de dades és senzill i petit, el que facilita l'experimentació per als novells. Per esbrinar quins factors influeixen en el preu de la propietat a Boston, les tècniques de regressió s'utilitzen molt en diversos paràmetres. És un lloc fantàstic per practicar tècniques de regressió i avaluar com funcionen.
4. Prova de qualitat del vi
El vi és una beguda alcohòlica inusual que requereix anys de fermentació. Com a resultat, l'antiga ampolla de vi és un vi car i d'alta qualitat. Escollir l'ampolla de vi ideal requereix anys de coneixements de tast de vins, i pot ser un procés incòmode.
El projecte d'assaig de qualitat del vi avalua els vins mitjançant proves fisicoquímiques com ara el nivell d'alcohol, l'acidesa fixa, la densitat, el pH i altres factors. El projecte també determina els criteris de qualitat i quantitats del vi. Com a resultat, la compra de vi es converteix en una brisa.
5. Predicció de borsa
Aquesta iniciativa és intrigant si treballes o no en el sector financer. Acadèmics, empreses i fins i tot com a font d'ingressos secundaris estudien àmpliament les dades del mercat de valors. La capacitat d'un científic de dades per estudiar i explorar dades de sèries temporals també és vital. Les dades de la borsa són un bon lloc per començar.
L'essència de l'esforç és pronosticar el valor futur d'una acció. Això es basa en el rendiment actual del mercat, així com en les estadístiques d'anys anteriors. Kaggle ha estat recopilant dades sobre l'índex NIFTY-50 des de l'any 2000 i actualment s'actualitza setmanalment. Des de l'1 de gener de 2000, ha inclòs els preus de les accions de més de 50 organitzacions.
6. Recomanació de pel·lícules
Estic segur que has tingut aquesta sensació després de veure una bona pel·lícula. Alguna vegada has sentit l'impuls de excitar els teus sentits mirant pel·lícules similars?
Sabem que serveis OTT com Netflix han millorat significativament els seus sistemes de recomanació. Com a estudiant d'aprenentatge automàtic, haureu d'entendre com aquests algorismes s'orienten als clients en funció de les seves preferències i ressenyes.
El conjunt de dades d'IMDB a Kaggle és probablement un dels més complets, ja que permet inferir models de recomanació en funció del títol de la pel·lícula, la valoració dels clients, el gènere i altres factors. També és un mètode excel·lent per aprendre sobre el filtratge basat en contingut i l'enginyeria de funcions.
7. Carrega la predicció d'elegibilitat
El món gira al voltant dels préstecs. La principal font de beneficis dels bancs prové dels interessos dels préstecs. Per tant, són el seu negoci fonamental.
Els individus o grups d'individus només poden expandir les economies invertint diners en una empresa amb l'esperança de veure'l augmentar de valor en el futur. De vegades és important demanar un préstec per poder assumir riscos d'aquesta naturalesa i fins i tot participar en determinats plaers mundans.
Abans d'acceptar un préstec, els bancs normalment tenen un procés força estricte a seguir. Com que els préstecs són un aspecte tan crucial de la vida de moltes persones, predir l'elegibilitat per a un préstec que algú sol·licita seria extremadament beneficiós, permetent una millor planificació més enllà d'acceptar o rebutjar el préstec.
8. Anàlisi de sentiments amb dades de Twitter
Gràcies a xarxes de xarxes socials com Twitter, Facebook i Reddit, extrapolar opinions i tendències s'ha tornat molt fàcil. Aquesta informació s'utilitza per eliminar opinions sobre esdeveniments, persones, esports i altres temes. Les iniciatives d'aprenentatge automàtic relacionades amb la mineria d'opinió s'estan aplicant en diversos entorns, com ara campanyes polítiques i avaluacions de productes d'Amazon.
Aquest projecte es veurà fantàstic a la vostra cartera! Per a la detecció d'emocions i l'anàlisi basada en aspectes, es poden utilitzar àmpliament tècniques com ara màquines vectorials de suport, regressió i algorismes de classificació (trobar fets i opinions).
9. Predicció de vendes futures
Les grans empreses i comerciants B2C volen saber quant vendrà cada producte del seu inventari. La previsió de vendes ajuda els propietaris de negocis a determinar quins articles tenen una gran demanda. La previsió de vendes precisa reduirà significativament el malbaratament alhora que determinarà l'impacte incremental en els pressupostos futurs.
Botigues com Walmart, IKEA, Big Basket i Big Bazaar utilitzen la previsió de vendes per estimar la demanda de productes. Heu d'estar familiaritzat amb diverses tècniques de neteja de dades en brut per construir aquests projectes ML. A més, es requereix una bona comprensió de l'anàlisi de regressió, especialment la regressió lineal simple.
Per a aquest tipus de tasques, haureu d'utilitzar biblioteques com Dora, Scrubadub, Pandas, NumPy i altres.
10. Detecció de notícies falses
És un altre esforç d'aprenentatge automàtic d'avantguarda dirigit als escolars. Les notícies falses s'estan estenent com la pólvora, com tots sabem. Tot està disponible a les xarxes socials, des de connectar persones fins a llegir les notícies diàries.
Com a resultat, detectar notícies falses s'ha tornat cada vegada més difícil en aquests dies. Moltes grans xarxes socials, com Facebook i Twitter, ja tenen algorismes per detectar notícies falses en publicacions i canals.
Per identificar notícies falses, aquest tipus de projecte ML necessita una comprensió exhaustiva de múltiples enfocaments de PNL i algorismes de classificació (PassiveAggressiveClassifier o classificador Naive Bayes).
11. Predicció de compra de cupons
Els clients es plantegen cada cop més comprar en línia quan el coronavirus va atacar el planeta l'any 2020. Com a resultat, els establiments comercials s'han vist obligats a canviar el seu negoci en línia.
Els clients, en canvi, segueixen buscant grans ofertes, tal com ho feien a les botigues, i cada cop busquen més cupons de superestalvi. Fins i tot hi ha llocs web dedicats a crear cupons per a aquests clients. Podeu aprendre sobre la mineria de dades en l'aprenentatge automàtic, la producció de gràfics de barres, gràfics circulars i histogrames per visualitzar dades i l'enginyeria de funcions amb aquest projecte.
Per generar prediccions, també podeu analitzar els enfocaments d'imputació de dades per gestionar els valors de NA i la similitud del cosinus de les variables.
12. Predicció de la deserció del client
Els consumidors són l'actiu més important d'una empresa, i mantenir-los és vital per a qualsevol negoci que tingui com a objectiu augmentar els ingressos i establir connexions significatives a llarg termini amb ells.
A més, el cost d'adquirir un nou client és cinc vegades més gran que el cost de mantenir-ne un existent. L'abandonament/desgast del client és un problema empresarial conegut en què els clients o subscriptors deixen de fer negocis amb un servei o una empresa.
Idealment, deixaran de ser un client que pagui. Es considera que un client es desactiva si ha passat un temps determinat des que el client va interactuar per última vegada amb l'empresa. Identificar si un client abandonarà, així com proporcionar ràpidament informació rellevant destinada a la retenció del client, són crucials per reduir la rotació.
El nostre cervell és incapaç d'anticipar la facturació de milions de clients; aquí és on l'aprenentatge automàtic pot ajudar.
13. Previsió de vendes de Wallmart
Una de les aplicacions més destacades de l'aprenentatge automàtic és la previsió de vendes, que consisteix a detectar característiques que influeixen en les vendes de productes i anticipar el volum de vendes futur.
El conjunt de dades de Walmart, que conté dades de vendes de 45 ubicacions, s'utilitza en aquest estudi d'aprenentatge automàtic. Les vendes per botiga, per categoria, setmanalment s'inclouen al conjunt de dades. L'objectiu d'aquest projecte d'aprenentatge automàtic és anticipar les vendes de cada departament de cada punt de venda perquè puguin prendre millors decisions d'optimització de canals basades en dades i planificació d'inventaris.
Treballar amb el conjunt de dades de Walmart és difícil, ja que conté esdeveniments de reducció escollits que tenen un impacte en les vendes i s'han de tenir en compte.
14. Anàlisi de dades d'Uber
Quan es tracta d'implementar i integrar l'aprenentatge automàtic i l'aprenentatge profund a les seves aplicacions, el popular servei de viatges compartits no es queda enrere. Cada any, processa milers de milions de viatges, cosa que permet als viatgers viatjar a qualsevol hora del dia o de la nit.
Com que té una base de clients tan gran, necessita un servei d'atenció al client excepcional per atendre les queixes dels consumidors el més ràpidament possible.
Uber té un conjunt de dades de milions de recollides que pot utilitzar per analitzar i mostrar els viatges dels clients per descobrir informació i millorar l'experiència del client.
15. Anàlisi Covid-19
La COVID-19 ha arrasat el món avui, i no només en el sentit d'una pandèmia. Mentre els experts mèdics es concentren a generar vacunes efectives i immunitzar el món, científics de dades no estan enrere.
Es fan públics nous casos, recompte actiu diari, víctimes mortals i estadístiques de proves. Les previsions es fan diàriament a partir del brot de SARS del segle anterior. Per a això, podeu utilitzar l'anàlisi de regressió i donar suport a models de predicció basats en màquines vectorials.
Conclusió
Per resumir, hem parlat d'alguns dels principals projectes ML que us ajudaran a provar la programació d'aprenentatge automàtic i a comprendre les seves idees i implementació. Saber com integrar l'aprenentatge automàtic us pot ajudar a avançar en la vostra professió a mesura que la tecnologia s'apodera de totes les indústries.
Mentre apreneu aprenentatge automàtic, us recomanem que practiqueu els vostres conceptes i escriviu tots els vostres algorismes. Escriure algorismes mentre s'aprèn és més important que realitzar un projecte, i també t'aporta un avantatge per entendre correctament els temes.
Deixa un comentari