Obsah[Skryť][Šou]
- 1. Titaniky
- 2. Klasifikácia írskych kvetov
- 3. Predpoveď ceny domu v Bostone
- 4. Testovanie kvality vína
- 5. Predikcia akciového trhu
- 6. Odporúčanie filmu
- 7. Predpoveď spôsobilosti zaťaženia
- 8. Analýza sentimentu pomocou údajov Twitteru
- 9. Predikcia budúceho predaja
- 10. Detekcia falošných správ
- 11. Predpovedanie nákupu kupónov
- 12. Predpovedanie odchodu zákazníkov
- 13. Predpovede predaja Wallmart
- 14. Analýza údajov Uber
- 15. Analýza Covid-19
- záver
Strojové učenie je jednoduchá štúdia o tom, ako vzdelávať počítačový program alebo algoritmus, aby sa postupne zlepšoval v konkrétnej práci prezentovanej na vysokej úrovni. Identifikácia obrázkov, detekcia podvodov, systémy odporúčaní a ďalšie aplikácie strojového učenia sa už ukázali ako populárne.
Úlohy ML zjednodušujú a zefektívňujú ľudskú prácu, šetria čas a zabezpečujú vysokokvalitný výsledok. Dokonca aj Google, najpopulárnejší vyhľadávač na svete, používa strojové učenie.
Od analýzy dopytu používateľa a úpravy výsledku na základe výsledkov až po zobrazenie trendových tém a reklám vo vzťahu k dopytu je k dispozícii množstvo možností.
Technológia, ktorá je vnímavá aj samoopravujúca, nie je ďaleko do budúcnosti.
Jedným z najlepších spôsobov, ako začať, je vyskúšať si a navrhnúť projekt. Preto sme pre začiatočníkov zostavili zoznam 15 najlepších projektov strojového učenia, aby ste mohli začať.
1. gigantický
Toto sa často považuje za jednu z najväčších a najpríjemnejších úloh pre každého, kto má záujem dozvedieť sa viac o strojovom učení. Výzva Titanic je populárny projekt strojového učenia, ktorý tiež slúži ako dobrý spôsob, ako sa zoznámiť s platformou pre vedu údajov Kaggle. Súbor údajov Titanicu pozostáva zo skutočných údajov z potopenia nešťastnej lode.
Zahŕňa podrobnosti, ako je vek osoby, sociálno-ekonomický stav, pohlavie, číslo kajuty, prístav odletu a čo je najdôležitejšie, či prežil!
Technika K-Nearest Neighbor a klasifikátor rozhodovacieho stromu boli určené na dosiahnutie najlepších výsledkov pre tento projekt. Ak hľadáte rýchlu víkendovú výzvu na zlepšenie Schopnosti strojového učenia, tento na Kaggle je pre vás.
2. Írska kvetinová klasifikácia
Začiatočníci milujú projekt kategorizácie kvetov kosatca a je to skvelé miesto, kde začať, ak ste novým strojovým učením. Dĺžka sepalov a okvetných lístkov odlišuje kvety dúhovky od iných druhov. Účelom tohto projektu je rozdeliť kvety do troch druhov: Virginia, setosa a Versicolor.
Na klasifikačné cvičenia projekt využíva súbor údajov o kvete dúhovky, ktorý študentom pomáha naučiť sa základy práce s číselnými hodnotami a údajmi. Súbor údajov o kvete dúhovky je malý súbor, ktorý možno uložiť do pamäte bez potreby zmeny mierky.
3. Predpoveď ceny domu v Bostone
Ďalší známy súbor údajov pre nováčikov v oblasti strojového učenia sú údaje o bývaní v Bostone. Jeho cieľom je predpovedať hodnoty domov v rôznych štvrtiach Bostonu. Zahŕňa dôležité štatistiky, ako je vek, sadzba dane z nehnuteľností, miera kriminality a dokonca aj blízkosť úradov práce, čo všetko môže ovplyvniť ceny bývania.
Súbor údajov je jednoduchý a malý, takže s ním môžu nováčikovia jednoducho experimentovať. Aby sme zistili, aké faktory ovplyvňujú cenu nehnuteľnosti v Bostone, používajú sa regresné techniky na rôznych parametroch. Je to skvelé miesto na precvičenie regresných techník a posúdenie, ako dobre fungujú.
4. Testovanie kvality vína
Víno je nezvyčajný alkoholický nápoj, ktorý si vyžaduje roky kvasenia. Výsledkom je, že starožitná fľaša vína je drahé a vysoko kvalitné víno. Výber ideálnej fľaše vína si vyžaduje roky skúseností s degustáciou vína a môže to byť proces, ktorý sa vydarí.
Projekt testu kvality vína hodnotí vína pomocou fyzikálno-chemických testov, ako je hladina alkoholu, stála kyslosť, hustota, pH a ďalšie faktory. Projekt určuje aj kvalitatívne kritériá a množstvá vína. V dôsledku toho sa nákup vína stáva hračkou.
5. Predikcia akciového trhu
Táto iniciatíva je zaujímavá bez ohľadu na to, či pracujete vo finančnom sektore alebo nie. Údaje o akciových trhoch vo veľkej miere študujú akademici, podniky a dokonca aj ako zdroj sekundárnych príjmov. Schopnosť dátových vedcov študovať a skúmať dáta časových radov je tiež dôležitá. Údaje z akciového trhu sú skvelým miestom, kde začať.
Podstatou snahy je predpovedať budúcu hodnotu akcie. Vyplýva to z aktuálnej výkonnosti trhu, ako aj zo štatistík z predchádzajúcich rokov. Kaggle zbiera údaje o indexe NIFTY-50 od roku 2000 a v súčasnosti sa aktualizujú každý týždeň. Od 1. januára 2000 obsahuje akciové ceny pre viac ako 50 organizácií.
6. Odporúčanie filmu
Určite ste mali ten pocit po zhliadnutí dobrého filmu. Pocítili ste niekedy nutkanie rozčúliť svoje zmysly prehnaným sledovaním podobných filmov?
Vieme, že služby OTT, ako je Netflix, výrazne zlepšili svoje systémy odporúčaní. Ako študent strojového učenia budete musieť pochopiť, ako sa takéto algoritmy zameriavajú na klientov na základe ich preferencií a recenzií.
Súbor údajov IMDB na Kaggle je pravdepodobne jedným z najkompletnejších, čo umožňuje odvodiť modely odporúčaní na základe názvu filmu, hodnotenia zákazníkov, žánru a ďalších faktorov. Je to tiež vynikajúca metóda, ako sa dozvedieť o filtrovaní na základe obsahu a inžinierstve funkcií.
7. Predpoveď spôsobilosti zaťaženia
Svet sa točí okolo pôžičiek. Hlavným zdrojom zisku bánk sú úroky z úverov. Preto sú ich základnou činnosťou.
Jednotlivci alebo skupiny jednotlivcov môžu rozširovať svoje ekonomiky iba investovaním peňazí do firmy v nádeji, že v budúcnosti uvidia, že hodnota bude rásť. Niekedy je dôležité hľadať pôžičku, aby ste mohli podstupovať riziká tohto druhu a dokonca sa podieľať na určitých svetských radovánkach.
Pred prijatím úveru musia banky zvyčajne dodržať pomerne prísny proces. Keďže pôžičky sú tak kľúčovým aspektom života mnohých ľudí, predpovedanie oprávnenosti na pôžičku, o ktorú niekto požiada, by bolo mimoriadne prospešné, čo by umožnilo lepšie plánovanie nad rámec prijatia alebo odmietnutia pôžičky.
8. Analýza sentimentu pomocou údajov Twitteru
Vďaka sociálne mediálne siete ako Twitter, Facebook a Reddit, extrapolácia názorov a trendov sa značne zjednodušila. Tieto informácie sa používajú na odstránenie názorov na udalosti, ľudí, šport a iné témy. Iniciatívy strojového učenia súvisiace s ťažbou názorov sa uplatňujú v rôznych prostrediach vrátane politických kampaní a hodnotení produktov Amazonu.
Tento projekt bude vo vašom portfóliu vyzerať fantasticky! Na detekciu emócií a analýzu založenú na aspektoch možno vo veľkej miere použiť techniky, ako sú podporné vektorové stroje, regresia a klasifikačné algoritmy (hľadanie faktov a názorov).
9. Predikcia budúceho predaja
Veľké B2C podniky a obchodníci chcú vedieť, koľko sa bude predávať každý produkt v ich inventári. Predpovedanie predaja pomáha majiteľom podnikov určiť, ktoré položky sú veľmi žiadané. Presné predpovedanie predaja výrazne zníži plytvanie a zároveň určí prírastkový vplyv na budúce rozpočty.
Maloobchodníci ako Walmart, IKEA, Big Basket a Big Bazaar používajú prognózy predaja na odhad dopytu po produktoch. Musíte byť oboznámení s rôznymi technikami čistenia nespracovaných údajov, aby ste mohli zostaviť takéto projekty ML. Vyžaduje sa tiež dobrá znalosť regresnej analýzy, najmä jednoduchej lineárnej regresie.
Pre tieto druhy úloh budete musieť využiť knižnice ako Dora, Scrubadub, Pandas, NumPy a ďalšie.
10. Detekcia falošných správ
Ide o ďalšie špičkové úsilie zamerané na strojové učenie zamerané na školákov. Ako všetci vieme, falošné správy sa šíria ako požiar. Všetko je dostupné na sociálnych sieťach, od spájania jednotlivcov až po čítanie denných správ.
V dôsledku toho je odhaľovanie falošných správ v dnešnej dobe čoraz ťažšie. Mnohé veľké siete sociálnych médií, ako napríklad Facebook a Twitter, už majú zavedené algoritmy na zisťovanie falošných správ v príspevkoch a informačných kanáloch.
Na identifikáciu falošných správ si tento typ projektu ML vyžaduje dôkladné porozumenie viacerým NLP prístupom a klasifikačným algoritmom (PassiveAggressiveClassifier alebo Naive Bayes klasifikátor).
11. Predikcia nákupu kupónov
Zákazníci čoraz viac uvažujú o online nákupe, keď koronavírus zaútočil na planétu v roku 2020. V dôsledku toho boli nákupné zariadenia nútené presunúť svoje podnikanie na internet.
Zákazníci na druhej strane stále vyhľadávajú skvelé ponuky, tak ako to bolo v obchodoch, a čoraz viac poľujú na super šetriace kupóny. Existujú dokonca webové stránky, ktoré sa venujú vytváraniu kupónov pre takýchto klientov. Pomocou tohto projektu sa môžete dozvedieť o dolovaní údajov v rámci strojového učenia, vytváraní stĺpcových grafov, koláčových grafov a histogramov na vizualizáciu údajov a inžinierstve funkcií.
Ak chcete generovať predpovede, môžete sa tiež pozrieť na prístupy imputácie údajov na riadenie hodnôt NA a kosínusovej podobnosti premenných.
12. Predpovedanie odchodu zákazníkov
Spotrebitelia sú najdôležitejším aktívom spoločnosti a ich udržanie je nevyhnutné pre každú firmu, ktorej cieľom je zvýšiť príjmy a vybudovať s nimi dlhodobé zmysluplné spojenia.
Okrem toho náklady na získanie nového klienta sú päťkrát vyššie ako náklady na udržanie existujúceho klienta. Odklon/opotrebenie zákazníkov je dobre známy obchodný problém, pri ktorom zákazníci alebo predplatitelia prestanú obchodovať so službou alebo spoločnosťou.
V ideálnom prípade už nebudú platiacim zákazníkom. Zákazník sa považuje za zrušeného, ak uplynul určitý čas od poslednej interakcie zákazníka so spoločnosťou. Identifikácia toho, či klient zanechá miznutie, ako aj rýchle poskytnutie relevantných informácií zameraných na udržanie zákazníkov sú rozhodujúce pre zníženie miznutia.
Naše mozgy nie sú schopné predvídať obraty zákazníkov pre milióny klientov; tu môže pomôcť strojové učenie.
13. Predpovede predaja Wallmart
Jednou z najvýznamnejších aplikácií strojového učenia je predpovedanie predaja, ktoré zahŕňa zisťovanie charakteristík, ktoré ovplyvňujú predaj produktov, a predvídanie budúceho objemu predaja.
V tejto štúdii strojového učenia sa používa súbor údajov Walmart, ktorý obsahuje údaje o predaji zo 45 miest. V súbore údajov sú zahrnuté predaje na predajňu, podľa kategórie a na týždennej báze. Účelom tohto projektu strojového učenia je predvídať predaj pre každé oddelenie v každej predajni, aby mohli robiť lepšie rozhodnutia o optimalizácii kanálov a plánovaní zásob na základe údajov.
Práca so súborom údajov Walmart je náročná, pretože obsahuje vybrané udalosti zníženia cien, ktoré majú vplyv na predaj a mali by sa zvážiť.
14. Analýza údajov Uber
Pokiaľ ide o implementáciu a integráciu strojového učenia a hlbokého učenia v ich aplikáciách, populárna služba zdieľania jázd nezaostáva. Každý rok spracuje miliardy ciest, čo umožňuje cestujúcim cestovať kedykoľvek počas dňa alebo v noci.
Keďže má takú veľkú klientskú základňu, potrebuje výnimočný zákaznícky servis, aby čo najrýchlejšie riešil sťažnosti spotrebiteľov.
Uber má súbor údajov s miliónmi vyzdvihnutí, ktoré môže použiť na analýzu a zobrazenie ciest klientov, aby odhalil poznatky a zlepšil zákaznícku skúsenosť.
15. Analýza COVID-19
COVID-19 dnes zachvátil svet, a to nielen v zmysle pandémie. Zatiaľ čo sa medicínski odborníci sústreďujú na vytváranie účinných očkovaní a imunizáciu sveta, vedci údajov nie sú pozadu.
Nové prípady, počet aktívnych osôb za deň, úmrtia a štatistiky testovania sa zverejňujú. Predpovede sa robia na dennej báze na základe prepuknutia SARS v minulom storočí. Na tento účel môžete použiť regresnú analýzu a podporu vektorových strojovo založených predikčných modelov.
záver
Aby sme to zhrnuli, diskutovali sme o niektorých z najlepších projektov ML, ktoré vám pomôžu pri testovaní programovania strojového učenia, ako aj pri pochopení jeho nápadov a implementácie. Vedieť, ako integrovať strojové učenie, vám môže pomôcť napredovať vo vašej profesii, pretože táto technológia prevláda v každom odvetví.
Počas výučby strojového učenia vám odporúčame, aby ste si precvičili svoje koncepty a napísali všetky svoje algoritmy. Písanie algoritmov počas učenia je dôležitejšie ako vykonávanie projektu a tiež vám poskytuje výhodu v správnom pochopení predmetov.
Nechaj odpoveď