Kaundan[Itago][Ipakita]
- 1 Titanic
- 2. Klasipikasyon sa Bulak sa Ireland
- 3. Panagna sa Presyo sa Boston House
- 4. Pagsulay sa Kalidad sa Bino
- 5. Pagtagna sa Stock Market
- 6. Rekomendasyon sa Pelikula
- 7. Pagtagna sa Kwalipikado sa Pagkarga
- 8. Pag-analisar sa Sentimento gamit ang Data sa Twitter
- 9. Panagna sa Pagbaligya sa Umaabot
- 10. Pagsusi sa Pekeng Balita
- 11. Panagna sa Pagpalit sa mga Kupon
- 12. Panag-ana sa Customer Churn
- 13. Pagtagna sa Pagbaligya sa Wallmart
- 14. Uber Data Analysis
- 15. Pagtuki sa Covid-19
- Panapos
Ang pagkat-on sa makina usa ka yano nga pagtuon kung giunsa ang pag-edukar sa usa ka programa sa kompyuter o algorithm aron hinayhinay nga molambo sa usa ka piho nga trabaho nga gipresentar sa taas nga lebel. Ang pag-ila sa imahe, pag-ila sa pagpanglimbong, mga sistema sa rekomendasyon, ug uban pang mga aplikasyon sa pagkat-on sa makina napamatud-an na nga sikat.
Ang mga trabaho sa ML naghimo sa trabaho sa tawo nga yano ug episyente, makadaginot sa oras ug nagsiguro sa usa ka taas nga kalidad nga resulta. Bisan ang Google, ang labing inila nga search engine sa kalibutan, naggamit pagkat-on sa makina.
Gikan sa pag-analisar sa pangutana sa user ug pag-usab sa resulta base sa mga resulta ngadto sa pagpakita sa trending nga mga hilisgutan ug mga ad nga may kalabotan sa pangutana, adunay lain-laing mga opsyon nga anaa.
Ang teknolohiya nga pareho nga masabtan ug nagtul-id sa kaugalingon dili layo sa umaabot.
Usa sa labing kaayo nga mga paagi sa pagsugod mao ang pagkuha sa mga kamot ug pagdesinyo sa usa ka proyekto. Busa, nag-compile kami og lista sa 15 ka nanguna nga mga proyekto sa pagkat-on sa makina para sa mga nagsugod aron makasugod ka.
1. Titanic
Kanunay kini nga giisip nga usa sa labing dako ug labing makalingaw nga buluhaton alang sa bisan kinsa nga interesado sa pagkat-on og dugang bahin sa pagkat-on sa makina. Ang hagit sa Titanic usa ka sikat nga proyekto sa pagkat-on sa makina nga nagsilbi usab nga maayong paagi aron masinati ang Kaggle data science platform. Ang mga datos sa Titanic gilangkoban sa tinuod nga datos gikan sa pagkalunod sa dili maayo nga barko.
Naglakip kini sa mga detalye sama sa edad sa tawo, kahimtang sa socioeconomic, gender, numero sa cabin, departure port, ug, labing hinungdanon, kung naluwas ba sila!
Ang K-Nearest Neighbor nga teknik ug ang decision tree classifier determinado nga makapatunghag labing maayong resulta para niini nga proyekto. Kung nangita ka usa ka paspas nga hagit sa katapusan sa semana aron mapaayo ang imong Mga abilidad sa Machine Learning, kining usa sa Kaggle para nimo.
2. Klasipikasyon sa Bulak sa Ireland
Ganahan ang mga nagsugod sa proyekto sa pagkategorya sa bulak sa iris, ug kini usa ka maayong lugar nga magsugod kung bag-o ka sa pagkat-on sa makina. Ang gitas-on sa mga sepal ug mga petals nagpalahi sa mga bulak sa iris gikan sa ubang mga espisye. Ang katuyoan niini nga proyekto mao ang pagbulag sa mga bulak ngadto sa tulo ka espisye: Virginia, setosa, ug Versicolor.
Para sa mga ehersisyo sa klasipikasyon, ang proyekto naggamit sa Iris flower dataset, nga nagtabang sa mga estudyante sa pagkat-on sa mga sukaranan sa pag-atubang sa numeric values ug data. Ang dataset sa bulak sa iris usa ka gamay nga mahimong tipigan sa panumduman nga wala magkinahanglan og scaling.
3. Pagtagna sa Presyo sa Boston House
Laing ilado dataset alang sa mga bag-o sa pagkat-on sa makina mao ang datos sa Boston Housing. Ang katuyoan niini mao ang pagtagna sa mga kantidad sa balay sa lainlaing mga kasilinganan sa Boston. Naglakip kini sa hinungdanon nga estadistika sama sa edad, rate sa buhis sa kabtangan, rate sa krimen, ug bisan ang pagkaduol sa mga sentro sa trabaho, nga tanan mahimo’g makaapekto sa presyo sa pabalay.
Ang dataset yano ug gamay, nga naghimo niini nga yano nga mag-eksperimento alang sa mga bag-o. Aron mahibal-an kung unsang mga hinungdan ang nag-impluwensya sa presyo sa propyedad sa Boston, ang mga pamaagi sa pagbag-o gigamit sa lainlaing mga parameter. Kini usa ka maayong lugar sa pagpraktis sa mga pamaagi sa pagbag-o ug pagtimbang-timbang kung unsa kini ka maayo.
4. Pagsulay sa Kalidad sa Alak
Ang bino usa ka talagsaon nga alkoholikong ilimnon nga nanginahanglan daghang tuig nga pag-ferment. Ingon usa ka sangputanan, ang antik nga botelya sa bino usa ka mahal ug taas nga kalidad nga bino. Ang pagpili sa sulundon nga botelya sa bino nanginahanglan mga tuig sa kahibalo sa pagtilaw sa bino, ug mahimo kini usa ka proseso nga hit-or-miss.
Ang proyekto sa pagsulay sa kalidad sa bino nagtimbang-timbang sa mga bino gamit ang mga pagsulay sa physicochemical sama sa lebel sa alkohol, naayos nga acidity, density, pH, ug uban pang mga hinungdan. Ang proyekto usab nagtino sa kalidad ug gidaghanon sa kalidad sa bino. Ingon usa ka sangputanan, ang pagpalit sa bino mahimong dali.
5. Pagtagna sa Stock Market
Kini nga inisyatibo makapainteres kung nagtrabaho ka o dili sa sektor sa pinansya. Ang datos sa stock market gitun-an pag-ayo sa mga akademya, negosyo, ug bisan ingon nga tinubdan sa sekondaryang kita. Ang katakus sa usa ka data scientist sa pagtuon ug pagsuhid sa datos sa serye sa oras hinungdanon usab. Ang datos gikan sa stock market usa ka maayong dapit sa pagsugod.
Ang esensya sa paningkamot mao ang pagtagna sa umaabot nga kantidad sa usa ka stock. Kini gibase sa kasamtangan nga performance sa merkado ingon man sa mga estadistika gikan sa nangaging mga tuig. Ang Kaggle nagkolekta sa datos sa NIFTY-50 index sukad sa 2000, ug kini karon gi-update kada semana. Sukad sa Enero 1, 2000, kini adunay mga presyo sa stock alang sa kapin sa 50 ka mga organisasyon.
6. Rekomendasyon sa Pelikula
Sigurado ko nga gibati nimo kana pagkahuman sa pagtan-aw sa usa ka maayo nga salida. Nabatyagan mo na ba ang kadasig sa pagpukaw sa imong mga igbalati pinaagi sa pagpatuyang sa pagtan-aw sa susamang mga salida?
Nahibal-an namon nga ang mga serbisyo sa OTT sama sa Netflix nakapauswag sa ilang mga sistema sa rekomendasyon. Isip usa ka estudyante sa pagkat-on sa makina, kinahanglan nimo nga masabtan kung giunsa nga gipunting sa ingon nga mga algorithm ang mga kliyente base sa ilang mga gusto ug mga pagsusi.
Ang datos sa IMDB sa Kaggle lagmit usa sa labing kompleto, nga gitugotan ang mga modelo sa rekomendasyon nga mahibal-an base sa titulo sa sine, rating sa kostumer, genre, ug uban pang mga hinungdan. Usa usab kini ka maayo nga pamaagi aron mahibal-an ang bahin sa Pagsala nga Gibase sa Kontento ug Engineering sa Feature.
7. Pagtagna sa Kwalipikado sa Pagkarga
Ang kalibutan nagtuyok sa mga pautang. Ang nag-unang tinubdan sa ganansya sa mga bangko naggikan sa interes sa mga pautang. Busa sila ang ilang sukaranan nga negosyo.
Ang mga indibidwal o grupo sa mga indibidwal makapalapad lamang sa mga ekonomiya pinaagi sa pagpamuhunan sa salapi sa usa ka kompanya sa paglaum nga makita kini nga motaas ang bili sa umaabot. Usahay importante ang pagpangita og pautang aron makahimo sa mga risgo niini nga kinaiya ug gani makaambit sa pipila ka kalibutanon nga kalipayan.
Sa dili pa madawat ang usa ka loan, ang mga bangko kasagaran adunay usa ka estrikto nga proseso nga sundon. Tungod kay ang mga pautang usa ka hinungdanon nga aspeto sa kinabuhi sa daghang mga tawo, ang pagtagna sa pagka-kwalipikado alang sa usa ka pautang nga gipangayo sa usa ka tawo labi ka mapuslanon, nga gitugotan ang labi ka maayo nga pagplano lapas sa gidawat o gibalibaran ang utang.
8. Pag-analisar sa Sentimento gamit ang Data sa Twitter
Salamat sa mga network sa social media sama sa Twitter, Facebook, ug Reddit, ang pag-extrapolate sa mga opinyon ug uso dali ra kaayo. Kini nga impormasyon gigamit sa pagwagtang sa mga opinyon sa mga panghitabo, mga tawo, sports, ug uban pang mga hilisgutan. Ang mga inisyatibo sa pagkat-on sa makina nga may kalabotan sa pagmina sa opinyon gipadapat sa lainlaing mga setting, lakip ang mga kampanya sa politika ug mga pagsusi sa produkto sa Amazon.
Kini nga proyekto nindot tan-awon sa imong portfolio! Para sa emotion detection ug aspect-based analysis, ang mga teknik sama sa support vector machines, regression, ug classification algorithms mahimong magamit sa kaylap (pagpangita sa mga kamatuoran ug opinyon).
9. Panagna sa Pagbaligya sa Umaabot
Ang mga dagkong negosyo ug mga negosyante sa B2C gusto nga mahibal-an kung pila ang ibaligya sa matag produkto sa ilang imbentaryo. Ang pagtagna sa pagpamaligya makatabang sa mga tag-iya sa negosyo sa pagtino kung unsang mga butang ang adunay taas nga panginahanglan. Ang tukma nga pagtagna sa pagbaligya makapakunhod pag-ayo sa pag-usik samtang gitino usab ang dugang nga epekto sa umaabot nga mga badyet.
Ang mga tigbaligya sama sa Walmart, IKEA, Big Basket, ug Big Bazaar naggamit sa pagtagna sa pagbaligya aron mabanabana ang panginahanglan sa produkto. Kinahanglan nga pamilyar ka sa lainlaing mga teknik sa paglimpyo sa hilaw nga datos aron matukod ang ingon nga mga proyekto sa ML. Usab, gikinahanglan ang maayong pagsabot sa pagtuki sa regression, ilabina ang yano nga linear regression.
Alang sa kini nga mga klase sa buluhaton, kinahanglan nimo nga mogamit mga librarya sama sa Dora, Scrubadub, Pandas, NumPy, ug uban pa.
10. Pagsusi sa Fake News
Kini usa ka bag-ong paningkamot sa pagkat-on sa makina nga gitumong sa mga bata sa eskuylahan. Ang peke nga balita mikaylap sama sa kalayo, sama sa nahibal-an naton tanan. Magamit ang tanan sa social media, gikan sa pagkonektar sa mga indibidwal hangtod sa pagbasa sa adlaw-adlaw nga balita.
Ingon usa ka sangputanan, ang pag-ila sa bakak nga mga balita labi ka lisud karong mga adlawa. Daghang dagkong mga social media network, sama sa Facebook ug Twitter, aduna nay mga algorithm sa lugar aron makamatikod sa mga bakak nga balita sa mga pag-post ug mga feed.
Aron mahibal-an ang bakak nga balita, kini nga klase sa proyekto sa ML nanginahanglan usa ka bug-os nga pagsabut sa daghang mga pamaagi sa NLP ug mga algorithm sa klasipikasyon (PassiveAggressiveClassifier o Naive Bayes classifier).
11. Prediksyon sa Pagpalit sa mga Kupon
Ang mga kustomer labi nga naghunahuna sa pagpalit sa online sa dihang giatake sa coronavirus ang planeta kaniadtong 2020. Ingon usa ka sangputanan, ang mga establisemento sa pagpamalit napugos sa pagbalhin sa ilang negosyo online.
Ang mga kostumer, sa laing bahin, nangita gihapon daghang mga tanyag, sama sa naa sila sa mga tindahan, ug labi nga nangita alang sa labi ka makatipig nga mga kupon. Adunay bisan mga website nga gipahinungod sa paghimo og mga kupon alang sa ingon nga mga kliyente. Makakat-on ka bahin sa pagmina sa datos sa pagkat-on sa makina, paghimo og mga bar graph, pie chart, ug histograms aron mahanduraw ang datos, ug bahin sa engineering uban niini nga proyekto.
Aron makamugna og mga panagna, mahimo usab nimo tan-awon ang mga pamaagi sa pag-imputation sa datos alang sa pagdumala sa mga kantidad sa NA ug pagkaparehas sa cosine sa mga variable.
12. Panag-ana sa Customer Churn
Ang mga konsumedor usa ka labing hinungdanon nga kabtangan sa usa ka kompanya, ug ang pagtipig kanila hinungdanon alang sa bisan unsang negosyo nga nagtinguha nga madugangan ang kita ug magtukod mga dugay nga makahuluganon nga koneksyon uban kanila.
Dugang pa, ang gasto sa pag-angkon og bag-ong kliyente lima ka pilo nga mas taas kaysa sa gasto sa pagpadayon sa usa nga naa na. Ang Customer Churn/Attrition usa ka ilado nga problema sa negosyo diin ang mga kustomer o mga subscriber mohunong sa pagnegosyo sa usa ka serbisyo o kompanya.
Maayo nga dili na sila usa ka nagbayad nga kustomer. Ang usa ka kostumer giisip nga nabuak kung kini usa ka piho nga oras sukad ang kostumer katapusang nakig-uban sa kompanya. Ang pag-ila kung ang usa ka kliyente mag-churn, ingon man ang paspas nga paghatag og may kalabutan nga kasayuran nga gitumong sa pagpadayon sa kustomer, hinungdanon sa pagpaubos sa churn.
Ang among utok dili makahimo sa pagpaabut sa pagbalhin sa kustomer alang sa milyon-milyon nga mga kliyente; dinhi kung asa makatabang ang pagkat-on sa makina.
13. Pagtagna sa Pagbaligya sa Wallmart
Usa sa labing inila nga aplikasyon sa pagkat-on sa makina mao ang pagtagna sa pagpamaligya, nga naglakip sa pag-ila sa mga kinaiya nga nag-impluwensya sa pagbaligya sa produkto ug pagpaabut sa gidaghanon sa pagbaligya sa umaabot.
Ang Walmart dataset, nga adunay mga datos sa pagbaligya gikan sa 45 nga mga lokasyon, gigamit sa kini nga pagtuon sa pagkat-on sa makina. Ang mga baligya matag tindahan, pinaagi sa kategorya, matag semana gilakip sa dataset. Ang katuyoan niini nga proyekto sa pagkat-on sa makina mao ang pagpaabut sa mga baligya alang sa matag departamento sa matag outlet aron sila makahimo og mas maayo nga data-driven channel optimization ug mga desisyon sa pagplano sa imbentaryo.
Ang pagtrabaho kauban ang Walmart dataset lisud tungod kay kini adunay gipili nga markdown nga mga panghitabo nga adunay epekto sa mga halin ug kinahanglan nga tagdon.
14. Pagtuki sa Data sa Uber
Kung bahin sa pagpatuman ug paghiusa sa pagkat-on sa makina ug lawom nga pagkat-on sa ilang mga app, ang sikat nga serbisyo sa pagpaambit sa pagsakay dili layo. Kada tuig, giproseso niini ang binilyon nga mga biyahe, nga nagtugot sa mga commuter sa pagbiyahe bisan unsang oras sa adlaw o gabii.
Tungod kay kini adunay usa ka dako nga base sa kliyente, nagkinahanglan kini og talagsaon nga serbisyo sa kustomer aron matubag ang mga reklamo sa mga konsumidor sa labing madali nga panahon.
Ang Uber adunay usa ka dataset sa milyon-milyon nga mga pick-up nga magamit niini sa pag-analisar ug pagpakita sa mga pagbiyahe sa kliyente aron mahibal-an ang mga panabut ug mapaayo ang kasinatian sa kustomer.
15. Pagtuki sa Covid-19
Ang COVID-19 mibanlas sa kalibutan karon, ug dili lamang sa diwa sa usa ka pandemya. Samtang ang mga eksperto sa medikal nagkonsentrar sa paghimo og epektibo nga mga pagbakuna ug pagbakuna sa kalibutan, mga siyentista sa datos dili layo sa likod.
Ang mga bag-ong kaso, adlaw-adlaw nga aktibo nga ihap, pagkamatay, ug estadistika sa pagsulay tanan gipahibalo sa publiko. Ang mga panagna gihimo matag adlaw base sa epidemya sa SARS sa miaging siglo. Alang niini, mahimo nimong gamiton ang pagtuki sa regression ug pagsuporta sa mga modelo sa prediksiyon nga nakabase sa vector machine.
Panapos
Sa pag-summarize, among nahisgutan ang pipila sa mga nag-unang proyekto sa ML nga makatabang kanimo sa pagsulay sa Machine Learning programming ingon man usab sa pagsabot sa mga ideya ug pagpatuman niini. Ang pagkahibalo kung unsaon pag-integrate ang Machine Learning makatabang kanimo sa pag-uswag sa imong propesyon samtang ang teknolohiya mopuli sa matag industriya.
Samtang nagkat-on sa Machine Learning, among girekomenda nga imong ipraktis ang imong mga konsepto ug isulat ang tanan nimong mga algorithm. Ang pagsulat sa mga algorithm samtang ang pagkat-on mas hinungdanon kaysa paghimo sa usa ka proyekto, ug naghatag usab kini kanimo usa ka bentaha sa pagsabut sa mga hilisgutan sa husto.
Leave sa usa ka Reply