Obsah[Skrýt][Ukázat]
- 1. Titánský
- 2. Irská květinová klasifikace
- 3. Předpověď ceny domu v Bostonu
- 4. Testování kvality vína
- 5. Predikce akciového trhu
- 6. Doporučení filmu
- 7. Předpověď způsobilosti zatížení
- 8. Analýza sentimentu pomocí dat Twitteru
- 9. Předpověď budoucího prodeje
- 10. Detekce falešných zpráv
- 11. Předpověď nákupu kuponů
- 12. Předpověď odchodu zákazníků
- 13. Prognóza prodeje Wallmart
- 14. Analýza dat Uber
- 15. Analýza Covid-19
- Proč investovat do čističky vzduchu?
Strojové učení je jednoduchá studie o tom, jak vzdělávat počítačový program nebo algoritmus, aby se postupně zlepšoval v konkrétní práci prezentované na vysoké úrovni. Identifikace obrázků, detekce podvodů, systémy doporučení a další aplikace strojového učení se již ukázaly jako oblíbené.
Úlohy ML zjednodušují a zefektivňují lidskou práci, šetří čas a zajišťují vysoce kvalitní výsledek. Dokonce i Google, světově nejpopulárnější vyhledávač, používá strojové učení.
Od analýzy dotazu uživatele a úpravy výsledku na základě výsledků až po zobrazení trendových témat a reklam ve vztahu k dotazu je k dispozici celá řada možností.
Technologie, která je vnímavá i samoopravná, není daleko do budoucnosti.
Jedním z nejlepších způsobů, jak začít, je vyzkoušet si a navrhnout projekt. Proto jsme sestavili seznam 15 nejlepších projektů strojového učení pro začátečníky, abyste mohli začít.
1. Titánský
To je často považováno za jeden z největších a nejpříjemnějších úkolů pro každého, kdo má zájem dozvědět se více o strojovém učení. Výzva Titanic je populární projekt strojového učení, který také slouží jako dobrý způsob, jak se seznámit s platformou pro vědu o datech Kaggle. Datový soubor Titanicu se skládá ze skutečných dat z potopení nešťastné lodi.
Zahrnuje podrobnosti, jako je věk osoby, socioekonomický status, pohlaví, číslo kajuty, odletový přístav a hlavně, zda přežil!
Nejlepší výsledky pro tento projekt byly určeny technikou K-Nearest Neighbor a klasifikátorem rozhodovacího stromu. Pokud hledáte rychlou víkendovou výzvu, abyste se zlepšili Schopnosti strojového učení, tohle na Kaggle je pro vás.
2. Irská květinová klasifikace
Začátečníci milují projekt kategorizace květů kosatce a je to skvělé místo, kde začít, pokud se strojovým učením teprve začínáte. Délka sepalů a okvětních lístků odlišuje květy duhovky od jiných druhů. Účelem tohoto projektu je oddělit květy do tří druhů: Virginia, setosa a Versicolor.
Pro klasifikační cvičení projekt využívá datový soubor Iris flower, který pomáhá studentům naučit se základy práce s číselnými hodnotami a daty. Datový soubor o květu kosatce je malý soubor, který lze uložit do paměti bez nutnosti škálování.
3. Předpověď ceny domu v Bostonu
Další známá datová sada pro nováčky ve strojovém učení jsou data Boston Housing. Jeho cílem je předpovídat hodnoty domů v různých bostonských čtvrtích. Zahrnuje důležité statistiky, jako je věk, sazba daně z nemovitosti, míra kriminality a dokonce i blízkost úřadů práce, což vše může ovlivnit ceny bydlení.
Soubor dat je jednoduchý a malý, takže je pro nováčky snadné experimentovat. Abychom zjistili, jaké faktory ovlivňují cenu nemovitosti v Bostonu, používají se regresní techniky na různých parametrech. Je to skvělé místo k procvičování regresních technik a posouzení, jak dobře fungují.
4. Testování kvality vína
Víno je neobvyklý alkoholický nápoj, který vyžaduje roky kvašení. Výsledkem je, že starožitná láhev vína je drahé a vysoce kvalitní víno. Výběr ideální láhve vína vyžaduje roky zkušeností s degustací vína a může to být proces, který se vydaří.
Projekt testování kvality vína hodnotí vína pomocí fyzikálně-chemických testů, jako je hladina alkoholu, pevná kyselost, hustota, pH a další faktory. Projekt také určuje kritéria kvality a množství vína. V důsledku toho se nákup vína stává hračkou.
5. Předpověď akciového trhu
Tato iniciativa je zajímavá, ať už pracujete nebo nepracujete ve finančním sektoru. Údaje o akciovém trhu jsou široce studovány akademiky, podniky a dokonce i jako zdroj sekundárních příjmů. Schopnost datových vědců studovat a zkoumat data časových řad je také zásadní. Data z akciového trhu jsou skvělým místem, kde začít.
Podstatou snahy je předpovídat budoucí hodnotu akcie. To je založeno na aktuální výkonnosti trhu a také statistikách z předchozích let. Kaggle shromažďuje údaje o indexu NIFTY-50 od roku 2000 a v současné době jsou aktualizovány každý týden. Od 1. ledna 2000 obsahuje ceny akcií pro více než 50 organizací.
6. Doporučení filmu
Určitě jste ten pocit měli po zhlédnutí dobrého filmu. Cítili jste někdy nutkání dráždit své smysly chvatným sledováním podobných filmů?
Víme, že služby OTT, jako je Netflix, výrazně zlepšily své systémy doporučení. Jako student strojového učení budete muset pochopit, jak se takové algoritmy zaměřují na klienty na základě jejich preferencí a recenzí.
Soubor dat IMDB na Kaggle je pravděpodobně jedním z nejúplnějších, což umožňuje odvodit modely doporučení na základě názvu filmu, zákaznického hodnocení, žánru a dalších faktorů. Je to také vynikající metoda, jak se dozvědět o filtrování založeném na obsahu a inženýrství funkcí.
7. Předpověď způsobilosti zatížení
Svět se točí kolem půjček. Hlavním zdrojem zisku bank jsou úroky z úvěrů. Jsou tedy jejich základní činností.
Jednotlivci nebo skupiny jednotlivců mohou rozšiřovat ekonomiky pouze tím, že investují peníze do firmy v naději, že v budoucnu uvidí její hodnotu. Někdy je důležité hledat půjčku, abyste mohli podstupovat rizika tohoto druhu a dokonce se podílet na určitých světských radovánkách.
Než může být půjčka přijata, musí banky obvykle dodržet poměrně přísný proces. Vzhledem k tomu, že půjčky jsou tak zásadním aspektem života mnoha lidí, předpovídání způsobilosti pro půjčku, o kterou někdo požádá, by bylo mimořádně přínosné, což by umožnilo lepší plánování nad rámec přijetí nebo zamítnutí půjčky.
8. Analýza sentimentu pomocí dat Twitteru
Díky sociálních sítí jako Twitter, Facebook a Reddit se extrapolace názorů a trendů značně zjednodušila. Tyto informace se používají k odstranění názorů na události, lidi, sporty a další témata. Iniciativy strojového učení související s těžbou názorů se uplatňují v různých prostředích, včetně politických kampaní a hodnocení produktů Amazon.
Tento projekt bude ve vašem portfoliu vypadat fantasticky! Pro detekci emocí a analýzu založenou na aspektech lze široce využívat techniky, jako jsou podpůrné vektorové stroje, regrese a klasifikační algoritmy (zjišťování faktů a názorů).
9. Předpověď budoucího prodeje
Velké B2C podniky a obchodníci chtějí vědět, kolik se každý produkt z jejich inventáře prodá. Prognózy prodeje pomáhají majitelům podniků určit, které položky jsou velmi žádané. Přesné předpovídání prodeje výrazně sníží plýtvání a zároveň určí přírůstkový dopad na budoucí rozpočty.
Maloobchodníci jako Walmart, IKEA, Big Basket a Big Bazaar používají prognózy prodeje k odhadu poptávky po produktu. Abyste mohli sestavit takové projekty ML, musíte být obeznámeni s různými technikami čištění nezpracovaných dat. Vyžaduje se také dobrá znalost regresní analýzy, zejména jednoduché lineární regrese.
Pro tyto druhy úkolů budete muset využít knihovny jako Dora, Scrubadub, Pandas, NumPy a další.
10. Detekce falešných zpráv
Je to další nejmodernější strojové učení zaměřené na školáky. Fake news se šíří jako lavina, jak všichni víme. Na sociálních sítích je k dispozici vše, od spojování jednotlivců až po čtení denních zpráv.
V důsledku toho je v dnešní době odhalování falešných zpráv stále obtížnější. Mnoho velkých sítí sociálních médií, jako je Facebook a Twitter, již má zavedené algoritmy pro odhalování falešných zpráv v příspěvcích a zdrojích.
Aby bylo možné identifikovat falešné zprávy, tento typ projektu ML vyžaduje důkladné pochopení několika NLP přístupů a klasifikačních algoritmů (PassiveAggressiveClassifier nebo Naive Bayes classifier).
11. Předpověď nákupu kuponů
Když v roce 2020 zaútočil na planetu koronavirus, zákazníci stále častěji uvažují o online nákupu. V důsledku toho byla nákupní zařízení nucena přesunout své podnikání na internet.
Zákazníci na druhou stranu stále hledají skvělé nabídky, stejně jako tomu bylo v obchodech, a stále častěji loví superspořicí kupony. Existují dokonce webové stránky věnované vytváření kuponů pro takové klienty. V tomto projektu se můžete dozvědět o dolování dat ve strojovém učení, vytváření sloupcových grafů, koláčových grafů a histogramů pro vizualizaci dat a inženýrství funkcí.
Chcete-li generovat předpovědi, můžete se také podívat na přístupy imputace dat pro správu hodnot NA a kosinusové podobnosti proměnných.
12. Predikce odchodu zákazníků
Spotřebitelé jsou nejdůležitějším aktivem společnosti a jejich udržení je životně důležité pro jakýkoli podnik, jehož cílem je zvýšit příjmy a vybudovat s nimi dlouhodobé smysluplné spojení.
Navíc náklady na získání nového klienta jsou pětkrát vyšší než náklady na udržení stávajícího. Odliv/opotřebování zákazníků je dobře známý obchodní problém, kdy zákazníci nebo předplatitelé přestanou obchodovat se službou nebo společností.
V ideálním případě již nebudou platícím zákazníkem. Zákazník je považován za zrušeného, pokud uplynul určitý čas od poslední interakce zákazníka se společností. Pro snížení odchodu zákazníků je zásadní určit, zda klient zanechá odchod, stejně jako rychlé poskytnutí relevantních informací zaměřených na udržení zákazníků.
Naše mozky nejsou schopny předvídat obraty zákazníků u milionů klientů; zde může pomoci strojové učení.
13. Prognóza prodeje Wallmart
Jednou z nejvýznamnějších aplikací strojového učení je prognóza prodeje, která zahrnuje zjišťování charakteristik, které ovlivňují prodej produktů, a předvídání budoucího objemu prodeje.
V této studii strojového učení se používá datová sada Walmart, která obsahuje údaje o prodeji ze 45 míst. V datové sadě jsou zahrnuty tržby za prodejnu, podle kategorií, na týdenní bázi. Účelem tohoto projektu strojového učení je předvídat prodeje pro každé oddělení v každé prodejně, aby mohla lépe rozhodovat o optimalizaci kanálu a plánování zásob na základě dat.
Práce s datovým souborem Walmart je obtížná, protože obsahuje vybrané události snížení cen, které mají dopad na prodej a je třeba je vzít v úvahu.
14. Analýza dat Uber
Pokud jde o implementaci a integraci strojového učení a hlubokého učení v jejich aplikacích, populární služba spolujízdy nezůstává pozadu. Každý rok zpracovává miliardy cest, což umožňuje dojíždějícím cestovat v kteroukoli denní i noční dobu.
Protože má tak velkou klientskou základnu, potřebuje výjimečný zákaznický servis, aby mohl co nejrychleji řešit stížnosti spotřebitelů.
Uber má datovou sadu milionů vyzvednutí, které může použít k analýze a zobrazení cest klientů, aby odhalil statistiky a zlepšil zákaznickou zkušenost.
15. Analýza Covid-19
COVID-19 dnes zachvátil svět, a to nejen ve smyslu pandemie. Zatímco se lékařští experti soustředí na vytvoření účinného očkování a imunizaci světa, vědci s údaji nejsou daleko pozadu.
Nové případy, denní počet aktivních osob, smrtelné nehody a statistiky testů jsou zveřejňovány. Předpovědi se dělají denně na základě vypuknutí SARS v minulém století. K tomu můžete použít regresní analýzu a podporovat vektorové modely strojové predikce.
Proč investovat do čističky vzduchu?
Abychom to shrnuli, probrali jsme některé z nejlepších projektů ML, které vám pomohou s testováním programování Machine Learning a také s pochopením jeho nápadů a implementace. Znalost toho, jak integrovat strojové učení, vám může pomoci pokročit ve vaší profesi, protože technologie přebírá vládu v každém odvětví.
Při výuce strojového učení vám doporučujeme, abyste si procvičili své koncepty a napsali všechny své algoritmy. Psaní algoritmů při učení je důležitější než provádění projektu a také vám poskytuje výhodu při správném porozumění předmětům.
Napsat komentář