Përmbajtje[Fshih][Shfaqje]
- 1. Titaniku
- 2. Klasifikimi i luleve irlandeze
- 3. Parashikimi i çmimit të shtëpive në Boston
- 4. Testimi i cilësisë së verës
- 5. Parashikimi i tregut të aksioneve
- 6. Rekomandim filmi
- 7. Parashikimi i përshtatshmërisë së ngarkesës
- 8. Analiza e ndjenjave duke përdorur të dhënat e Twitter
- 9. Parashikimi i Shitjeve në të Ardhmen
- 10. Zbulimi i lajmeve të rreme
- 11. Parashikimi i blerjes së kuponëve
- 12. Parashikimi i rënies së klientit
- 13. Parashikimi i shitjeve në Wallmart
- 14. Analiza e të dhënave Uber
- 15. Analiza e Covid-19
- Përfundim
Mësimi i makinerisë është një studim i thjeshtë se si të edukoni një program kompjuterik ose algoritëm për të përmirësuar gradualisht një punë specifike të paraqitur në një nivel të lartë. Identifikimi i imazhit, zbulimi i mashtrimit, sistemet e rekomandimeve dhe aplikacionet e tjera të mësimit të makinerive janë provuar tashmë të jenë të njohura.
Punët ML e bëjnë punën njerëzore të thjeshtë dhe efikase, duke kursyer kohë dhe duke siguruar një rezultat me cilësi të lartë. Edhe Google, motori më i popullarizuar i kërkimit në botë, përdor Mësimi makinë.
Nga analizimi i pyetjes së përdoruesit dhe ndryshimi i rezultatit bazuar në rezultatet deri tek shfaqja e temave dhe reklamave në trend në lidhje me pyetjen, ekzistojnë një sërë opsionesh të disponueshme.
Teknologjia që është edhe perceptuese dhe vetë-korrigjuese nuk është larg në të ardhmen.
Një nga mënyrat më të mira për të filluar është të filloni dhe të hartoni një projekt. Prandaj, ne kemi përpiluar një listë me 15 projekte kryesore të mësimit të makinerive për fillestarët për t'ju nisur.
1. Kolosal
Kjo shpesh konsiderohet si një nga detyrat më të mëdha dhe më të këndshme për këdo që është i interesuar të mësojë më shumë rreth mësimit të makinerive. Sfida Titanic është një projekt popullor i mësimit të makinerive që shërben gjithashtu si një mënyrë e mirë për t'u njohur me platformën e shkencës së të dhënave Kaggle. Të dhënat e Titanikut përbëhen nga të dhëna të vërteta nga fundosja e anijes fatkeqe.
Ai përfshin detaje të tilla si mosha e personit, statusi socio-ekonomik, gjinia, numri i kabinës, porti i nisjes dhe, më e rëndësishmja, nëse ata mbijetuan!
Teknika K-Nearest Neighbor dhe klasifikuesi i pemës së vendimit u përcaktuan për të prodhuar rezultatet më të mira për këtë projekt. Nëse jeni duke kërkuar për një sfidë të shpejtë të fundjavës për të përmirësuar tuajën Aftësitë e të mësuarit të makinerisë, kjo në Kaggle është për ju.
2. Klasifikimi i luleve irlandeze
Fillestarët e duan projektin e kategorizimit të luleve të irisit dhe është një vend i mrekullueshëm për të filluar nëse jeni i ri në mësimin e makinerive. Gjatësia e sepaleve dhe petaleve dallon lulëzimin e irisit nga speciet e tjera. Qëllimi i këtij projekti është të ndajë lulëzimin në tre lloje: Virginia, setosa dhe Versicolor.
Për ushtrimet e klasifikimit, projekti përdor grupin e të dhënave të luleve Iris, i cili i ndihmon nxënësit të mësojnë bazat e trajtimit të vlerave dhe të dhënave numerike. Të dhënat e luleve të irisit janë të vogla që mund të ruhen në memorie pa pasur nevojë për shkallëzim.
3. Parashikimi i çmimit të shtëpive në Boston
Një tjetër i njohur të dhëna për fillestarët në mësimin e makinerive janë të dhënat e Boston Housing. Qëllimi i tij është të parashikojë vlerat e shtëpive në lagje të ndryshme të Bostonit. Ai përfshin statistika jetike si mosha, shkalla e tatimit në pronë, niveli i krimit, madje edhe afërsia me qendrat e punës, të cilat të gjitha mund të ndikojnë në çmimin e banesave.
Të dhënat janë të thjeshta dhe të vogla, duke e bërë të thjeshtë eksperimentimin për fillestarët. Për të kuptuar se cilët faktorë ndikojnë në çmimin e pronës në Boston, teknikat e regresionit përdoren shumë në parametra të ndryshëm. Është një vend i mrekullueshëm për të praktikuar teknikat e regresionit dhe për të vlerësuar se sa mirë funksionojnë ato.
4. Testimi i cilësisë së verës
Vera është një pije alkoolike e pazakontë që kërkon shumë vite fermentim. Si rezultat, shishja antike e verës është një verë e kushtueshme dhe me cilësi të lartë. Zgjedhja e shishes ideale të verës kërkon vite të tëra njohurish për degusimin e verës dhe mund të jetë një proces i suksesshëm.
Projekti i testit të cilësisë së verës vlerëson verërat duke përdorur teste fiziko-kimike si niveli i alkoolit, aciditeti fiks, dendësia, pH dhe faktorë të tjerë. Projekti përcakton edhe kriteret dhe sasitë e cilësisë së verës. Si rezultat, blerja e verës bëhet e lehtë.
5. Parashikimi i tregut të aksioneve
Kjo nismë është intriguese pavarësisht nëse punoni apo jo në sektorin financiar. Të dhënat e bursës studiohen gjerësisht nga akademikët, bizneset, madje edhe si burim të ardhurash dytësore. Aftësia e një shkencëtari të të dhënave për të studiuar dhe eksploruar të dhënat e serive kohore është gjithashtu jetike. Të dhënat nga tregu i aksioneve janë një vend i mrekullueshëm për të filluar.
Thelbi i përpjekjes është të parashikohet vlera e ardhshme e një stoku. Kjo bazohet në performancën aktuale të tregut si dhe në statistikat e viteve të mëparshme. Kaggle ka mbledhur të dhëna për indeksin NIFTY-50 që nga viti 2000 dhe aktualisht përditësohet çdo javë. Që nga 1 janari 2000, ai përmban çmimet e aksioneve për mbi 50 organizata.
6. Rekomandim filmi
Unë jam i sigurt që ju keni pasur atë ndjenjë pasi keni parë një film të mirë. A e keni ndier ndonjëherë impulsin për të stimuluar shqisat tuaja duke parë filma të ngjashëm?
Ne e dimë se shërbimet OTT si Netflix kanë përmirësuar ndjeshëm sistemet e tyre të rekomandimeve. Si student i mësimit të makinerive, do t'ju duhet të kuptoni se si algoritme të tilla synojnë klientët bazuar në preferencat dhe rishikimet e tyre.
Seti i të dhënave IMDB në Kaggle ka të ngjarë të jetë një nga më të kompletuarit, duke lejuar që modelet e rekomandimeve të konkludohen bazuar në titullin e filmit, vlerësimin e klientit, zhanrin dhe faktorë të tjerë. Është gjithashtu një metodë e shkëlqyer për të mësuar rreth filtrimit të bazuar në përmbajtje dhe inxhinierisë së veçorive.
7. Parashikimi i përshtatshmërisë së ngarkesës
Bota sillet rreth huave. Burimi kryesor i fitimit të bankave vjen nga interesat e huave. Prandaj ata janë biznesi i tyre themelor.
Individët ose grupet e individëve mund të zgjerojnë ekonomitë vetëm duke investuar para në një firmë me shpresën për ta parë atë të rritet në vlerë në të ardhmen. Ndonjëherë është e rëndësishme të kërkosh një hua për të qenë në gjendje të marrësh rreziqe të kësaj natyre dhe madje të marrësh pjesë në kënaqësi të caktuara të kësaj bote.
Përpara se të pranohet një kredi, bankat zakonisht kanë një proces mjaft të rreptë për të ndjekur. Duke qenë se kreditë janë një aspekt kaq i rëndësishëm i jetës së shumë njerëzve, parashikimi i përshtatshmërisë për një kredi për të cilën dikush aplikon do të ishte jashtëzakonisht i dobishëm, duke lejuar një planifikim më të mirë përtej pranimit ose refuzimit të kredisë.
8. Analiza e ndjenjave duke përdorur të dhënat e Twitter
Në sajë të rrjetet e mediave sociale si Twitter, Facebook dhe Reddit, ekstrapolimi i opinioneve dhe tendencave është bërë shumë i lehtë. Ky informacion përdoret për të eliminuar opinionet për ngjarje, njerëz, sporte dhe tema të tjera. Iniciativat e mësimit të makinerive të lidhura me nxjerrjen e opinionit po aplikohen në një sërë mjedisesh, duke përfshirë fushatat politike dhe vlerësimet e produkteve të Amazon.
Ky projekt do të duket fantastik në portofolin tuaj! Për zbulimin e emocioneve dhe analizën e bazuar në aspekt, teknika të tilla si makinat e vektorit mbështetës, regresioni dhe algoritmet e klasifikimit mund të përdoren gjerësisht (gjetja e fakteve dhe opinioneve).
9. Parashikimi i Shitjeve në të Ardhmen
Bizneset dhe tregtarët e mëdhenj B2C duan të dinë se sa do të shesë çdo produkt në inventarin e tyre. Parashikimi i shitjeve ndihmon pronarët e bizneseve në përcaktimin se cilët artikuj janë në kërkesë të lartë. Parashikimi i saktë i shitjeve do të ulë ndjeshëm humbjet, duke përcaktuar gjithashtu ndikimin në rritje në buxhetet e ardhshme.
Shitësit me pakicë si Walmart, IKEA, Big Basket dhe Big Bazaar përdorin parashikimin e shitjeve për të vlerësuar kërkesën e produktit. Ju duhet të jeni të njohur me teknika të ndryshme të pastrimit të të dhënave të papërpunuara në mënyrë që të ndërtoni projekte të tilla ML. Gjithashtu, kërkohet një zotërim i mirë i analizës së regresionit, veçanërisht i regresionit të thjeshtë linear.
Për këto lloj detyrash, do t'ju duhet të përdorni biblioteka si Dora, Scrubadub, Pandas, NumPy dhe të tjera.
10. Zbulimi i lajmeve të rreme
Është një tjetër përpjekje e avancuar e të mësuarit të makinerive që synon nxënësit e shkollave. Lajmet e rreme po përhapen si flakë, siç e dimë të gjithë. Gjithçka është e disponueshme në mediat sociale, nga lidhja e individëve te leximi i lajmeve të përditshme.
Si rezultat, zbulimi i lajmeve të rreme është bërë gjithnjë e më i vështirë këto ditë. Shumë rrjete të mëdha të mediave sociale, si Facebook dhe Twitter, kanë tashmë algoritme për të zbuluar lajmet false në postime dhe burime.
Për të identifikuar lajmet e rreme, ky lloj projekti ML ka nevojë për një kuptim të plotë të qasjeve të shumta NLP dhe algoritmeve të klasifikimit (PassiveAggressiveClassifier ose klasifikues Naive Bayes).
11. Parashikimi i blerjes së kuponëve
Klientët po mendojnë gjithnjë e më shumë blerjen në internet kur koronavirusi sulmoi planetin në vitin 2020. Si rezultat, objektet e blerjeve janë detyruar të zhvendosin biznesin e tyre në internet.
Klientët, nga ana tjetër, janë ende në kërkim të ofertave të shkëlqyera, ashtu siç ishin në dyqane, dhe po kërkojnë gjithnjë e më shumë kuponë super-kursues. Madje ka faqe interneti të dedikuara për krijimin e kuponëve për klientë të tillë. Ju mund të mësoni rreth minierave të të dhënave në mësimin e makinerive, prodhimin e grafikëve me shtylla, grafikët me byrek dhe histogramet për të vizualizuar të dhënat dhe inxhinierinë e veçorive me këtë projekt.
Për të gjeneruar parashikime, mund të shikoni edhe qasjet e imputimit të të dhënave për menaxhimin e vlerave të NA dhe ngjashmërisë së kosinusit të variablave.
12. Parashikimi i rënies së klientit
Konsumatorët janë aseti më i rëndësishëm i një kompanie dhe mbajtja e tyre është jetike për çdo biznes që synon të rrisë të ardhurat dhe të krijojë lidhje afatgjata kuptimplote me ta.
Për më tepër, kostoja e blerjes së një klienti të ri është pesë herë më e lartë se kostoja e mbajtjes së një klienti ekzistues. Shkarkimi/Shterja e klientit është një problem i njohur biznesi në të cilin klientët ose abonentët pushojnë së bëri biznes me një shërbim ose një kompani.
Ata në mënyrë ideale nuk do të jenë më klientë që paguajnë. Një klient konsiderohet i shpërbërë nëse ka kaluar një kohë e caktuar që kur klienti ka ndërvepruar për herë të fundit me kompaninë. Identifikimi nëse një klient do të shpërthejë, si dhe dhënia e shpejtë e informacionit përkatës që synon mbajtjen e klientit, janë vendimtare për uljen e dyndjes.
Truri ynë është i paaftë të parashikojë qarkullimin e klientëve për miliona klientë; këtu mund të ndihmojë mësimi i makinerive.
13. Parashikimi i shitjeve në Wallmart
Një nga aplikimet më të spikatura të mësimit të makinerive është parashikimi i shitjeve, i cili përfshin zbulimin e karakteristikave që ndikojnë në shitjet e produktit dhe parashikimin e vëllimit të shitjeve në të ardhmen.
Të dhënat e Walmart, e cila përmban të dhëna shitjesh nga 45 vendndodhje, përdoret në këtë studim të mësimit të makinerive. Shitjet për dyqan, sipas kategorisë, në baza javore përfshihen në grupin e të dhënave. Qëllimi i këtij projekti të mësimit të makinerive është të parashikojë shitjet për çdo departament në çdo dyqan, në mënyrë që ata të mund të marrin vendime më të mira për optimizimin e kanaleve dhe planifikimin e inventarit të drejtuar nga të dhënat.
Puna me grupin e të dhënave Walmart është e vështirë pasi përmban ngjarje të zgjedhura të shënimit që kanë një ndikim në shitje dhe duhet të merren parasysh.
14. Analiza e të dhënave Uber
Kur bëhet fjalë për zbatimin dhe integrimin e mësimit të makinerive dhe mësimit të thellë në aplikacionet e tyre, shërbimi popullor i ndarjes së udhëtimit nuk është shumë prapa. Çdo vit, ai përpunon miliarda udhëtime, duke i lejuar udhëtarët të udhëtojnë në çdo kohë të ditës apo natës.
Për shkak se ka një bazë kaq të madhe klientësh, ajo ka nevojë për shërbim të jashtëzakonshëm ndaj klientit për të adresuar sa më shpejt ankesat e konsumatorëve.
Uber ka një grup të dhënash prej miliona marrjesh që mund t'i përdorë për të analizuar dhe shfaqur udhëtimet e klientëve për të zbuluar njohuri dhe për të përmirësuar përvojën e klientit.
15. Analiza e Covid-19
COVID-19 ka përfshirë sot globin, dhe jo thjesht në kuptimin e një pandemie. Ndërsa ekspertët mjekësorë po përqendrohen në gjenerimin e vaksinave efektive dhe imunizimin e botës, shkencëtarët e të dhënave nuk janë shumë prapa.
Rastet e reja, numërimi aktiv ditor, vdekjet dhe statistikat e testimit po bëhen publike. Parashikimet bëhen në baza ditore bazuar në shpërthimin e SARS të shekullit të kaluar. Për këtë, ju mund të përdorni analizën e regresionit dhe të mbështesni modelet e parashikimit të bazuara në makinë vektoriale.
Përfundim
Për ta përmbledhur, ne kemi diskutuar disa nga projektet më të mira të ML që do t'ju ndihmojnë në testimin e programimit të Mësimit të Makinerisë, si dhe për të kuptuar idetë dhe zbatimin e tij. Njohja se si të integroni Mësimin e Makinerisë mund t'ju ndihmojë të përparoni në profesionin tuaj pasi teknologjia merr përsipër në çdo industri.
Ndërsa mësoni Mësimin e Makinerisë, ju rekomandojmë që të praktikoni konceptet tuaja dhe të shkruani të gjitha algoritmet tuaja. Shkrimi i algoritmeve gjatë të mësuarit është më i rëndësishëm se kryerja e një projekti, dhe gjithashtu ju ofron një avantazh në kuptimin e duhur të lëndëve.
Lini një Përgjigju