Edukien aurkibidea[Ezkutatu][Erakutsi]
- 1. Titanic
- 2. Irlandako Loreen Sailkapena
- 3. Boston Etxearen Prezioaren Iragarpena
- 4. Ardoaren Kalitate Proba
- 5. Burtsaren Iragarpena
- 6. Filmaren gomendioa
- 7. Karga hautagarritasunaren aurreikuspena
- 8. Sentimenduen analisia Twitter Datuak erabiliz
- 9. Etorkizuneko Salmenten Iragarpena
- 10. Albiste faltsuen detekzioa
- 11. Kupoiak erosteko aurreikuspena
- 12. Bezeroen iragarpena
- 13. Wallmart Salmenten Aurreikuspena
- 14. Uber datuen analisia
- 15. Covid-19aren Analisia
- Ondorioa
Ikaskuntza automatikoa programa informatiko edo algoritmo bat nola hezi ikasketa sinplea da, maila altuan aurkeztutako lan zehatz bat pixkanaka hobetzeko. Irudien identifikazioa, iruzurra hautematea, gomendio sistemak eta ikaskuntza automatikoko beste aplikazio batzuk ezagunak direla frogatu dute dagoeneko.
ML lanek gizakien lana erraz eta eraginkorra egiten dute, denbora aurreztuz eta kalitate handiko emaitza bermatuz. Nahiz eta Googlek, munduko bilatzailerik ezagunenak, erabiltzen du makina ikaskuntza.
Erabiltzailearen kontsulta aztertu eta emaitzetan oinarritutako emaitza aldatzetik hasi eta kontsultaren inguruko joera-gaiak eta iragarkiak erakustera, hainbat aukera daude eskuragarri.
Pertzeptiboa eta autozuzentzailea den teknologia ez dago urrun etorkizunean.
Hasteko modurik handienetako bat proiektu bat diseinatzea eta eskuak hartzea da. Hori dela eta, hasiberrientzako ikaskuntza automatikoko 15 proiektu nagusien zerrenda osatu dugu zu hasteko.
1. Titanic
Ikaskuntza automatikoari buruz gehiago jakiteko interesa duen edonorentzat zeregin handienetakoa eta atseginenetakoa dela uste da. Titanic erronka ikaskuntza automatikoko proiektu ezagun bat da, Kaggle datu zientziaren plataforma ezagutzeko modu ona ere balio duena. Titanic datu-multzoa zoritxarreko ontziaren hondoratzearen benetako datuez osatuta dago.
Pertsonaren adina, egoera sozioekonomikoa, generoa, kabina-zenbakia, irteera-portua eta, batez ere, bizirik atera ote den bezalako xehetasunak biltzen ditu!
K-Nearest Neighbor teknika eta erabaki-zuhaitzaren sailkatzailea zehaztu ziren proiektu honetarako emaitzarik onenak lortzeko. Asteburuko erronka azkar baten bila bazabiltza zure hobetzeko Makina ikasteko gaitasunak, Kaggle-ko hau zuretzat da.
2. Irlandako Loreen Sailkapena
Hasiberriek iristen loreak sailkatzeko proiektua maite dute, eta hasteko leku paregabea da ikaskuntza automatikoan berria bazara. Sepalo eta petaloen luzerak irisen loreak beste espezieetatik bereizten ditu. Proiektu honen helburua loreak hiru espezietan bereiztea da: Virginia, setosa eta Versicolor.
Sailkapen ariketetarako, proiektuak Iris lorearen datu-multzoa erabiltzen du, eta ikasleei balio eta datuei aurre egiteko oinarriak ikasten laguntzen die. Iris loreen datu-multzoa txiki-txikia da, eta memorian gorde daiteke eskalatu beharrik gabe.
3. Boston Etxearen prezioen iragarpena
Beste ezagun bat Ikaskuntza automatikoan hasiberrientzako datu multzoa Boston Housing datuak da. Bere helburua Bostongo hainbat auzotan etxeen balioak aurreikustea da. Ezinbesteko estatistikak barne hartzen ditu, hala nola adina, ondasun higiezinen tasa, krimen-tasa eta baita lan-zentroekiko hurbiltasuna ere, eta horrek guztiak etxebizitzaren prezioan eragina izan dezake.
Datu-multzoa sinplea eta txikia da, hasiberrientzat esperimentatzeko erraza da. Bostongo etxebizitzaren prezioan zer faktorek eragiten duten jakiteko, erregresio teknikak asko erabiltzen dira hainbat parametrotan. Leku paregabea da erregresio teknikak lantzeko eta nola funtzionatzen duten ebaluatzeko.
4. Ardoaren Kalitate Proba
Ardoa ezohiko edari alkoholdun bat da, urteetako hartzidura behar duena. Ondorioz, antzinako ardo botila garesti eta kalitate handiko ardoa da. Ardo botila aproposa aukeratzeak urteetako ardoa dastatzeko ezagutza eskatzen du, eta ezinbesteko prozesua izan daiteke.
Ardoaren kalitatearen proba proiektuak ardoak ebaluatzen ditu proba fisikokimikoak erabiliz, hala nola alkohol maila, azidotasun finkoa, dentsitatea, pH eta beste faktore batzuk. Proiektuak ardoaren kalitate irizpideak eta kantitateak ere zehazten ditu. Ondorioz, ardoa erostea brisa bihurtzen da.
5. Burtsako iragarpena
Ekimen hau interesgarria da finantza sektorean lan egiten duzun ala ez. Burtsaren datuak sakon aztertzen dituzte akademikoek, enpresek eta baita bigarren mailako diru-sarrera gisa ere. Datu-zientzialari batek denbora serieko datuak aztertzeko eta arakatzeko duen gaitasuna ere ezinbestekoa da. Burtsaren datuak hasteko leku bikaina da.
Ahaleginaren funtsa akzio baten etorkizuneko balioa aurreikustea da. Hau egungo merkatuaren errendimenduan eta aurreko urteetako estatistiketan oinarritzen da. Kaggle-k NIFTY-50 indizeari buruzko datuak biltzen ditu 2000. urtetik, eta une honetan astero eguneratzen da. 1ko urtarrilaren 2000az geroztik, 50 erakunde baino gehiagoren akzioen prezioak ditu.
6. Filmaren gomendioa
Ziur pelikula on bat ikusi ondoren sentsazio hori izan duzula. Sentitu al duzu inoiz antzeko filmak ikusita zentzumenak kitzikatzeko bulkada?
Badakigu Netflix bezalako OTT zerbitzuek gomendio sistemak nabarmen hobetu dituztela. Ikaskuntza automatikoko ikasle gisa, algoritmo horiek bezeroak nola bideratzen dituzten ulertu beharko duzu haien hobespenetan eta berrikuspenetan oinarrituta.
Kaggle-n IMDB datu-multzoa osoenetakoa da ziurrenik, filmaren izenburuan, bezeroen balorazioan, generoan eta beste faktore batzuen arabera gomendio ereduak ondorioztatzeko aukera ematen baitu. Edukietan oinarritutako iragazketa eta ezaugarrien ingeniaritzari buruz ikasteko metodo bikaina ere bada.
7. Kargatu Hautagarritasunaren Iragarpena
Mundua maileguen inguruan dabil. Bankuen irabazi-iturri nagusia maileguen interesetatik dator. Beraz, euren oinarrizko negozioa dira.
Norbanakoek edo gizabanako taldeek ekonomia handitu dezakete soilik enpresa batean dirua inbertituz etorkizunean balioa igotzeko asmoz. Batzuetan garrantzitsua da mailegu bat bilatzea izaera horretako arriskuak hartu ahal izateko eta baita munduko zenbait plazertan parte hartu ahal izateko.
Mailegu bat onartu aurretik, bankuek normalean prozesu nahiko zorrotza izaten dute. Maileguak jende askoren bizitzako alderdi erabakigarriak direnez, norbaitek eskatzen duen mailegu bat izateko eskubidea aurreikustea oso onuragarria izango litzateke, mailegua onartu edo ukatzen denetik haratago plangintza hobea izateko.
8. Sentimenduen analisia Twitter datuak erabiliz
Esker sare sozialen sareak Twitter, Facebook eta Reddit bezala, iritziak eta joerak estrapolatzea dezente erraz bihurtu da. Informazio hori gertakariei, jendeari, kirolei eta bestelako gaiei buruzko iritziak ezabatzeko erabiltzen da. Iritzi meatzaritzari lotutako ikaskuntza automatikoko ekimenak hainbat ezarpenetan aplikatzen ari dira, besteak beste, kanpaina politikoetan eta Amazon produktuen ebaluazioetan.
Proiektu hau zoragarria izango da zure zorroan! Emozioak detektatzeko eta alderdietan oinarritutako analisirako, laguntza-makina bektorialak, erregresioa eta sailkapen-algoritmoak bezalako teknikak asko erabil daitezke (gertaerak eta iritziak aurkitzea).
9. Etorkizuneko Salmenten Iragarpena
B2C negozio eta merkatari handiek beren inbentarioko produktu bakoitzak zenbat salduko duen jakin nahi dute. Salmenten aurreikuspenak negozioen jabeei laguntzen die eskari handia duten elementuak zehazten. Salmenten aurreikuspen zehatzak alferrik galtzea nabarmen murriztuko du, eta, aldi berean, etorkizuneko aurrekontuetan izango duen eragina zehaztuko du.
Walmart, IKEA, Big Basket eta Big Bazaar bezalako merkatariek salmenten aurreikuspenak erabiltzen dituzte produktuen eskaria kalkulatzeko. Datu gordinak garbitzeko hainbat teknika ezagutu behar dituzu ML proiektuak eraikitzeko. Gainera, erregresioaren analisia ondo ulertu behar da, bereziki erregresio lineal sinplea.
Mota honetako zereginetarako, Dora, Scrubadub, Pandas, NumPy eta beste bezalako liburutegiak erabili beharko dituzu.
10. Albiste faltsuen detekzioa
Eskola-umeei zuzendutako ikaskuntza automatikoko puntako beste ahalegin bat da. Albiste faltsuak sutan bezala zabaltzen ari dira, denok dakigunez. Sare sozialetan dena dago eskuragarri, norbanakoak konektatu eta eguneroko albisteak irakurtzera.
Ondorioz, albiste faltsuak detektatzea gero eta zailagoa da egun. Sare sozialen sare handi askok, Facebook eta Twitter esaterako, dagoeneko algoritmoak dituzte bidalketetan eta jarioetan albiste faltsuak detektatzeko.
Albiste faltsuak identifikatzeko, ML proiektu mota honek NLP ikuspegi eta sailkapen-algoritmo anitzak (PassiveAggressiveClassifier edo Naive Bayes sailkatzailea) sakon ulertzea behar du.
11. Kupoiak erosteko aurreikuspena
2020an koronavirusak planetari eraso egin zionean bezeroak gero eta gehiago pentsatzen ari dira sarean erostea. Ondorioz, erosketa-establezimenduak negozioa sarean aldatzera behartu dituzte.
Bezeroak, berriz, eskaintza bikainak bilatzen jarraitzen dute, dendetan bezala, eta gero eta gehiago aurrezteko kupoien bila dabiltza. Bezeroentzako kupoiak sortzeari eskainitako webguneak ere badaude. Datu-meatzaritza ikaskuntza automatikoan ikas dezakezu, barra-grafikoak, tarte-diagramak eta histogramak ekoizten datuak ikusteko eta ezaugarrien ingeniaritza proiektu honekin.
Iragarpenak sortzeko, NA balioak eta aldagaien kosinuaren antzekotasuna kudeatzeko datuen egozpen planteamenduak ere azter ditzakezu.
12. Bezeroen iragarpena
Kontsumitzaileak dira enpresa baten aktibo garrantzitsuena, eta horiek mantentzea ezinbestekoa da diru-sarrerak areagotzea eta haiekin epe luzerako lotura esanguratsuak eraikitzea helburu duen edozein negoziorentzat.
Gainera, bezero berri bat eskuratzeko kostua lehendik dagoen bati eusteko kostua baino bost aldiz handiagoa da. Customer Churn/Atrition negozio arazo ezagun bat da, non bezeroek edo harpidedunek zerbitzu edo enpresa batekin negozioa egiteari uzten dioten.
Egokiena jada ez dira ordainpeko bezeroak izango. Bezero bat birrindutzat joko da bezeroak konpainiarekin azken harremana izan zuenetik denbora jakin bat igaro bada. Bezero batek txandaka egingo duen ala ez identifikatzea, baita bezeroak atxikitzea helburu duen informazio garrantzitsua azkar ematea ere, funtsezkoak dira txandak murrizteko.
Gure garunak ezin du milioika bezeroren bezeroen fakturazioa aurreikusteko; hemen ikaskuntza automatikoa lagun dezake.
13. Wallmart Salmenten Aurreikuspena
Ikaskuntza automatikoaren aplikazio nabarmenenetako bat salmenten aurreikuspena da, produktuen salmenten eragina duten ezaugarriak hautematea eta etorkizuneko salmenten bolumena aurreikustea datza.
Walmart datu-multzoa, 45 kokapenetako salmenta-datuak biltzen dituena, ikasketa automatikoko azterketa honetan erabiltzen da. Denda bakoitzeko salmentak, kategoriaka, astero sartzen dira datu multzoan. Ikaskuntza automatikoko proiektu honen helburua saltoki bakoitzeko sail bakoitzaren salmentak aurreikustea da, datuetan oinarritutako kanalen optimizazioa eta inbentarioa planifikatzeko erabaki hobeak har ditzaten.
Walmart datu-multzoarekin lan egitea zaila da, salmentetan eragina duten eta kontuan hartu beharreko marka-gertaerak baitaude.
14. Uber Datuen Analisia
Ikaskuntza automatikoa eta ikaskuntza sakona beren aplikazioetan ezartzeko eta integratzeko orduan, bidaiak partekatzeko zerbitzu ezaguna ez da atzean geratzen. Urtero, milaka milioi bidaia prozesatzen ditu, bidaiariei eguneko edo gaueko edozein ordutan bidaiatzeko aukera emanez.
Hain bezero-base handia duenez, bezeroarentzako arreta berezia behar du kontsumitzaileen kexak ahalik eta azkarren konpontzeko.
Uber-ek milioika bilketaz osatutako datu-multzo bat du, bezeroen bidaiak aztertzeko eta bistaratzeko erabil dezakeen ikuspegiak ezagutzeko eta bezeroaren esperientzia hobetzeko.
15. Covid-19aren analisia
COVID-19ak mundua hedatu du gaur, eta ez pandemiaren zentzuan soilik. Medikuntza adituak txerto eraginkorrak sortzen eta mundua immunizazioan kontzentratzen ari diren bitartean, datu zientzialariek ez daude atzean.
Kasu berriak, eguneroko zenbaketa aktiboa, heriotzak eta proben estatistikak publiko egiten ari dira. Aurreikuspenak egunero egiten dira aurreko mendeko SARS agerraldian oinarrituta. Horretarako, erregresio-analisia erabil dezakezu eta makina bektorialetan oinarritutako iragarpen-ereduak onar ditzakezu.
Ondorioa
Laburbilduz, Machine Learning programazioa probatzen eta bere ideiak eta inplementazioa ulertzen lagunduko dizuten ML proiektu nagusienetariko batzuk eztabaidatu ditugu. Machine Learning integratzen jakiteak zure lanbidean aurrera egiten lagunduko dizu, teknologiak industria guztietan hartzen duen heinean.
Machine Learning ikasten ari zaren bitartean, zure kontzeptuak lantzea eta algoritmo guztiak idaztea gomendatzen dizugu. Ikasten bitartean algoritmoak idaztea proiektu bat egitea baino garrantzitsuagoa da, eta gainera abantaila bat ematen dizu irakasgaiak behar bezala ulertzeko.
Utzi erantzun bat