Enhavtabelo[Kaŝi][Montri]
- 1 Titanic
- 2. Irlanda Flora Klasifiko
- 3. Boston Domo-Prezo-Prognozo
- 4. Testo pri Kvalito de Vino
- 5. Prognoza Prognozo
- 6. Filma Rekomendo
- 7. Ŝarĝi Kvalifikan Antaŭdiron
- 8. Analizo de sentoj uzante Twitter-datumojn
- 9. Estontaj Vendaj Antaŭdiro
- 10. Detekto de Falsaj Novaĵoj
- 11. Kuponoj Aĉeta Antaŭdiro
- 12. Kliento Churn Antaŭdiro
- 13. Wallmart Venda Prognozo
- 14. Analizo de datumoj de Uber
- 15. Analizo de Covid-19
- konkludo
Maŝina lernado estas simpla studo pri kiel eduki komputilan programon aŭ algoritmon por iom post iom plibonigi specifan laboron prezentitan je alta nivelo. Bilda identigo, fraŭda detekto, rekomendaj sistemoj kaj aliaj maŝinlernadaplikoj jam pruvis esti popularaj.
ML-laboroj faras homan laboron simpla kaj efika, ŝparante tempon kaj certigante altkvalitan rezulton. Eĉ Guglo, la plej populara serĉilo de la mondo, uzas maŝinlernado.
De analizado de la demando de la uzanto kaj ŝanĝado de la rezulto surbaze de la rezultoj ĝis montri tendencajn temojn kaj reklamojn rilate al la demando, ekzistas diversaj opcioj disponeblaj.
Teknologio kiu estas kaj percepta kaj mem-korektanta ne estas malproksima en la estonteco.
Unu el la plej bonaj manieroj komenci estas ekzerci kaj desegni projekton. Tial ni kompilis liston de 15 ĉefaj maŝinlernado-projektoj por komencantoj por komenci vin.
1. titanic
Ĉi tio ofte estas konsiderata kiel unu el la plej grandaj kaj plej ĝuaj taskoj por iu ajn interesata lerni pli pri maŝinlernado. La Titanic-defio estas populara maŝinlernada projekto, kiu ankaŭ funkcias kiel bona maniero konatiĝi kun la Kaggle-datumscienco-platformo. La Titanic-datumaro konsistas el aŭtentaj datumoj de la sinkigo de la fatala ŝipo.
Ĝi inkluzivas detalojn kiel la aĝo de la persono, sociekonomika statuso, sekso, kabana numero, forirhaveno kaj, plej grave, ĉu ili pluvivis!
La K-Nearest Neighbor-tekniko kaj la decidarba klasigilo estis celkonsciaj produkti la plej bonajn rezultojn por ĉi tiu projekto. Se vi serĉas rapidan semajnfinan defion por plibonigi vian Maŝinlernado-kapabloj, ĉi tiu ĉe Kaggle estas por vi.
2. Irlanda Flora Klasifiko
Komencantoj amas la projekton pri kategoriigo de iriso-floro, kaj ĝi estas bonega loko por komenci se vi estas nova pri maŝinlernado. La longo de sepaloj kaj petaloj distingas irisflorojn de aliaj specioj. La celo de ĉi tiu projekto estas apartigi la florojn en tri speciojn: Virginio, setosa kaj Versicolor.
Por klasifikekzercoj, la projekto utiligas la Iris-floran datumaron, kiu helpas lernantojn lerni la bazaĵojn pri traktado de nombraj valoroj kaj datumoj. La datumaro de iriso-floro estas eta kiu povas esti konservita en memoro sen la bezono de skalado.
3. Boston Domo-Prezo-Prognozo
Alia konata datumaro por novuloj en maŝinlernado estas la datumoj de Boston Housing. Ĝia celo estas prognozi hejmajn valorojn en diversaj Boston-najbarecoj. Ĝi inkluzivas esencajn statistikojn kiel aĝo, domimposta imposto, krima indico kaj eĉ proksimeco al laborcentroj, ĉiuj el kiuj povus influi loĝejojn.
La datumaro estas simpla kaj eta, faciligante eksperimenti por novuloj. Por ekscii, kiaj faktoroj influas la posedaĵan prezon en Bostono, regresaj teknikoj estas forte uzataj sur diversaj parametroj. Estas bonega loko por praktiki regresajn teknikojn kaj taksi kiom bone ili funkcias.
4. Testo pri Kvalito de Vino
Vino estas nekutima alkoholaĵo, kiu postulas jarojn da fermentado. Kiel rezulto, la antikva botelo da vino estas multekosta kaj altkvalita vino. Elekti la idealan botelon da vino postulas jarojn da vingusta scio, kaj ĝi povas esti trafa aŭ maltrafa procezo.
La vinkvalittestprojekto taksas vinojn uzante fizikkemiajn testojn kiel ekzemple alkoholnivelo, fiksa acideco, denseco, pH, kaj aliaj faktoroj. La projekto ankaŭ determinas la kvalitajn kriteriojn kaj kvantojn de la vino. Kiel rezulto, vinaĉetado fariĝas brizo.
5. Borso-Prognozo
Ĉi tiu iniciato estas interesa ĉu vi laboras aŭ ne en la financa sektoro. Borso-datumoj estas vaste studitaj de akademiuloj, entreprenoj, kaj eĉ kiel fonto de sekundara enspezo. La kapablo de datumsciencisto studi kaj esplori tempajn datumojn ankaŭ estas esenca. Datumoj de la borso estas bonega loko por komenci.
La esenco de la klopodo estas antaŭvidi la estontan valoron de akcio. Ĉi tio baziĝas sur aktuala merkata agado same kiel statistiko de antaŭaj jaroj. Kaggle kolektas datumojn pri la NIFTY-50-indekso ekde 2000, kaj ĝi estas nuntempe ĝisdatigita ĉiusemajne. Ekde januaro 1, 2000, ĝi enhavis akciajn prezojn por pli ol 50 organizoj.
6. Filma Rekomendo
Mi certas, ke vi havis tiun senton post vidi bonan filmon. Ĉu vi iam sentis la impulson instigi viajn sentojn spektante similajn filmojn?
Ni scias, ke OTT-servoj kiel Netflix signife plibonigis siajn rekomendajn sistemojn. Kiel studento pri maŝinlernado, vi devos kompreni kiel tiaj algoritmoj celas klientojn laŭ siaj preferoj kaj recenzoj.
La IMDB-datumaro pri Kaggle verŝajne estas unu el la plej kompletaj, permesante konkludi rekomendajn modelojn surbaze de la filmtitolo, klienta takso, ĝenro kaj aliaj faktoroj. Ĝi ankaŭ estas bonega metodo por lerni pri Enhavo-Bazita Filtrado kaj Funkcia Inĝenierado.
7. Ŝarĝu Kvalifiko-Prognozo
La mondo rondiras ĉirkaŭ pruntoj. La plej grava profitfonto de bankoj venas de interezoj pri pruntoj. Tial ili estas ilia fundamenta komerco.
Individuoj aŭ grupoj de individuoj povas nur vastigi ekonomiojn investante monon en firmao kun la espero vidi ĝin plialtiĝi en valoro en la estonteco. Kelkfoje gravas serĉi prunton por povi riski ĉi tiun naturon kaj eĉ partopreni iujn sekularajn plezurojn.
Antaŭ ol prunto povas esti akceptita, bankoj kutime havas sufiĉe striktan procezon por sekvi. Ĉar pruntoj estas tiel decida aspekto de la vivo de multaj homoj, antaŭdiri kvalifikon por prunto, kiun iu petas, estus ekstreme utila, ebligante pli bonan planadon preter la prunto akceptita aŭ rifuzita.
8. Analizo de Sentoj uzante Twitter-Datumojn
Danke al sociaj amaskomunikiloj retoj kiel Twitter, Facebook kaj Reddit, ekstrapolado de opinioj kaj tendencoj fariĝis konsiderinde facila. Ĉi tiu informo estas uzata por forigi opiniojn pri eventoj, homoj, sportoj kaj aliaj temoj. Opiniaj minado-rilataj maŝinlernado-iniciatoj estas aplikataj en diversaj agordoj, inkluzive de politikaj kampanjoj kaj Amazon-produktaj taksadoj.
Ĉi tiu projekto aspektos mirinda en via biletujo! Por emocia detekto kaj aspekt-bazita analizo, teknikoj kiel subtenaj vektoraj maŝinoj, regreso kaj klasifik-algoritmoj povas esti uzataj vaste (trovante faktojn kaj opiniojn).
9. Antaŭdiro de Estontaj Vendoj
Grandaj B2C-komercoj kaj komercistoj volas scii kiom ĉiu produkto en sia inventaro vendos. Vendoprognozo helpas komercistojn determini kiuj eroj estas tre postulataj. Preciza venda prognozo signife malpliigos malŝparon dum ankaŭ determinas la pliigan efikon al estontaj buĝetoj.
Podetalistoj kiel Walmart, IKEA, Big Basket, kaj Big Bazaar uzas vendoprognozon por taksi produktopostulon. Vi devas koni diversajn teknikojn de purigado de krudaj datumoj por konstrui tiajn ML-projektojn. Ankaŭ, bona kompreno de regresanalizo, precipe simpla linia regreso, estas postulata.
Por ĉi tiuj taskoj, vi devos uzi bibliotekojn kiel Dora, Scrubadub, Pandas, NumPy kaj aliajn.
10. Detekto de Falsaj Novaĵoj
Ĝi estas alia avangarda peno de maŝinlernado celita al lernejanoj. Falsaj novaĵoj disvastiĝas kiel fajro, kiel ni ĉiuj scias. Ĉio haveblas en sociaj amaskomunikiloj, de konekto de individuoj ĝis legado de la ĉiutagaj novaĵoj.
Kiel rezulto, detekti falsajn novaĵojn fariĝis ĉiam pli malfacila ĉi tiuj tagoj. Multaj grandaj sociaj retoj, kiel Facebook kaj Twitter, jam havas algoritmojn por detekti falsajn novaĵojn en afiŝoj kaj fontoj.
Por identigi falsajn novaĵojn, ĉi tiu tipo de ML-projekto bezonas ĝisfundan komprenon de multoblaj NLP-aliroj kaj klasifik-algoritmoj (PassiveAggressiveClassifier aŭ Naive Bayes-klasigilo).
11. Kuponoj Aĉeta Antaŭdiro
Klientoj ĉiam pli pripensas interretan aĉetadon kiam la koronavirus atakis la planedon en 2020. Kiel rezulto, butikumaj establaĵoj estis devigitaj ŝanĝi sian komercon interrete.
Klientoj, aliflanke, daŭre serĉas bonegajn ofertojn, same kiel ili estis en vendejoj, kaj ĉiam pli ĉasas superŝparajn kuponojn. Estas eĉ retejoj dediĉitaj al kreado de kuponoj por tiaj klientoj. Vi povas lerni pri datumminado en maŝina lernado, produktante strekgrafikojn, kukajn diagramojn kaj histogramojn por bildigi datumojn kaj prezenti inĝenieristikon kun ĉi tiu projekto.
Por generi antaŭdirojn, vi ankaŭ povas rigardi en datum-imputaciajn alirojn por administri NA-valorojn kaj kosinussimilecon de variabloj.
12. Kliento Churn Prognozo
Konsumantoj estas la plej grava valoraĵo de firmao, kaj konservi ilin estas esenca por iu ajn komerco celanta akceli enspezon kaj konstrui longperspektivajn signifajn ligojn kun ili.
Krome, la kosto por akiri novan klienton estas kvinoble pli alta ol la kosto por subteni ekzistantan. Kliento Churn/Atrition estas konata komerca problemo en kiu klientoj aŭ abonantoj ĉesas fari komercon kun servo aŭ firmao.
Ili ideale ne plu estos paganta kliento. Kliento estas konsiderata malakceptita se pasis apartan kvanton da tempo ekde la laste la kliento interagis kun la firmao. Identigi ĉu kliento malakceptos, same kiel rapide doni koncernajn informojn celantajn retenon de kliento, estas decidaj por malpliigi la churn.
Niaj cerboj estas nekapablaj antaŭvidi klientan spezon por milionoj da klientoj; ĉi tie estas kie maŝinlernado povas helpi.
13. Wallmart Venda Prognozo
Unu el la plej elstaraj aplikoj de maŝinlernado estas vendoprognozo, kiu implikas detekti trajtojn kiuj influas produktajn vendojn kaj antaŭvidi estontajn vendokvantojn.
La Walmart-datumaro, kiu enhavas vendajn datumojn de 45 lokoj, estas uzata en ĉi tiu maŝinlernada studo. Vendoj per vendejo, laŭ kategorio, ĉiusemajne estas inkluzivitaj en la datumaro. La celo de ĉi tiu maŝinlernada projekto estas antaŭvidi vendojn por ĉiu fako en ĉiu ellasejo, por ke ili povu fari pli bonajn decidojn pri optimumigo de kanalo pelita de datumoj kaj planado de inventaro.
Labori kun la Walmart-datumaro estas malfacila ĉar ĝi enhavas elektitajn markdown-eventojn, kiuj efikas sur vendoj kaj devus esti konsiderataj.
14. Analizo de datumoj de Uber
Kiam temas pri efektivigi kaj integri maŝinlernadon kaj profundan lernadon en iliaj apoj, la populara servo-kundivido ne estas malantaŭe. Ĉiujare, ĝi prilaboras miliardojn da vojaĝoj, permesante al navedantoj vojaĝi en ajna momento de tago aŭ nokto.
Ĉar ĝi havas tiom grandan klientbazon, ĝi bezonas esceptan klientservon por trakti plendojn de konsumantoj kiel eble plej rapide.
Uber havas datumbazon de milionoj da ŝarĝoj, kiujn ĝi povas uzi por analizi kaj montri klientajn vojaĝojn por malkovri komprenojn kaj plibonigi la klientan sperton.
15. Analizo de Covid-19
COVID-19 balais la terglobon hodiaŭ, kaj ne simple en la senco de pandemio. Dum medicinaj fakuloj koncentriĝas pri generi efikajn vakcinadojn kaj imunigi la mondon, datumaj sciencistoj ne estas malproksime malantaŭe.
Novaj kazoj, ĉiutaga aktiva kalkulo, mortoj kaj testaj statistikoj ĉiuj estas publikigitaj. Prognozoj estas faritaj ĉiutage surbaze de la SARS-eksplodo de la antaŭa jarcento. Por tio, vi povas uzi regresan analizon kaj subteni vektorajn maŝin-bazitajn prognozajn modelojn.
konkludo
Por resumi, ni diskutis kelkajn el la plej bonaj ML-projektoj, kiuj helpos vin testi Maŝinlernado-programadon same kiel ekkompreni ĝiajn ideojn kaj efektivigon. Scii kiel integri Maŝinlernadon povas helpi vin progresi en via profesio dum la teknologio transprenas en ĉiu industrio.
Dum lernado de Maŝinlernado, ni rekomendas ke vi praktiku viajn konceptojn kaj verku ĉiujn viajn algoritmojn. Skribi algoritmojn dum lernado estas pli grava ol plenumi projekton, kaj ĝi ankaŭ donas al vi avantaĝon por kompreni la temojn ĝuste.
Lasi Respondon