Spis treści[Ukryć][Pokazać]
- 1. Titanic
- 2. Irlandzka klasyfikacja kwiatów
- 3. Przewidywanie cen domów w Bostonie
- 4. Testowanie jakości wina
- 5. Prognozy giełdowe
- 6. Rekomendacja filmu
- 7. Przewidywanie uprawnień do obciążenia
- 8. Analiza nastrojów z wykorzystaniem danych z Twittera
- 9. Przewidywanie przyszłej sprzedaży
- 10. Wykrywanie fałszywych wiadomości
- 11. Przewidywanie zakupu kuponów
- 12. Przewidywanie rezygnacji klientów
- 13. Prognozy sprzedaży Wallmart
- 14. Analiza danych Uber
- 15. Analiza Covid-19
- Wnioski
Uczenie maszynowe to proste studium tego, jak wykształcić program komputerowy lub algorytm, aby stopniowo doskonalić konkretną pracę prezentowaną na wysokim poziomie. Identyfikacja obrazów, wykrywanie oszustw, systemy rekomendacji i inne aplikacje do uczenia maszynowego już okazały się popularne.
Prace ML sprawiają, że praca człowieka jest prosta i wydajna, oszczędzając czas i zapewniając wysokiej jakości wynik. Nawet Google, najpopularniejsza wyszukiwarka na świecie, korzysta uczenie maszynowe.
Dostępnych jest wiele opcji, od analizy zapytania użytkownika i zmiany wyniku na podstawie wyników po wyświetlanie popularnych tematów i reklam w odniesieniu do zapytania.
Technologia, która jest zarówno percepcyjna, jak i samokorygująca, nie jest odległa w przyszłości.
Jednym z najlepszych sposobów na rozpoczęcie pracy jest praktyczne przygotowanie projektu. Dlatego przygotowaliśmy listę 15 najlepszych projektów uczenia maszynowego dla początkujących, aby zacząć.
1. Tytaniczny
Jest to często uważane za jedno z największych i najprzyjemniejszych zadań dla każdego, kto chce dowiedzieć się więcej o uczeniu maszynowym. Wyzwanie Titanic to popularny projekt uczenia maszynowego, który służy również jako dobry sposób na zapoznanie się z platformą do nauki danych Kaggle. Zbiór danych Titanica składa się z prawdziwych danych z zatonięcia nieszczęsnego statku.
Zawiera szczegóły, takie jak wiek osoby, status społeczno-ekonomiczny, płeć, numer kabiny, port odlotu i, co najważniejsze, czy przeżyła!
Technika K-Nearest Neighbor i klasyfikator drzewa decyzyjnego zostały określone w celu uzyskania najlepszych wyników dla tego projektu. Jeśli szukasz szybkiego weekendowego wyzwania, aby poprawić swoje Umiejętności uczenia maszynowego, ten na Kaggle jest dla Ciebie.
2. Irlandzka klasyfikacja kwiatów
Początkujący uwielbiają projekt kategoryzacji kwiatów tęczówki i jest to świetne miejsce na rozpoczęcie, jeśli nie masz doświadczenia w uczeniu maszynowym. Długość działek i płatków odróżnia zakwity tęczówki od innych gatunków. Celem tego projektu jest podzielenie kwiatów na trzy gatunki: Virginia, setosa i Versicolor.
Do ćwiczeń klasyfikacyjnych projekt wykorzystuje zestaw danych Iris flower, który pomaga uczącym się w nauce podstaw radzenia sobie z wartościami liczbowymi i danymi. Zestaw danych kwiatu tęczówki jest niewielki, który można przechowywać w pamięci bez konieczności skalowania.
3. Przewidywanie cen domów w Bostonie
Kolejny dobrze znany zbiór danych dla nowicjuszy w uczeniu maszynowym to dane Boston Housing. Jego celem jest prognozowanie wartości domów w różnych dzielnicach Bostonu. Zawiera ważne statystyki, takie jak wiek, stawka podatku od nieruchomości, wskaźnik przestępczości, a nawet bliskość urzędów pracy, które mogą mieć wpływ na ceny mieszkań.
Zestaw danych jest prosty i mały, co ułatwia eksperymentowanie dla nowicjuszy. Aby dowiedzieć się, jakie czynniki wpływają na cenę nieruchomości w Bostonie, w przypadku różnych parametrów intensywnie wykorzystuje się techniki regresji. To świetne miejsce do ćwiczenia technik regresji i oceny, jak dobrze działają.
4. Testowanie jakości wina
Wino to niezwykły napój alkoholowy, który wymaga lat fermentacji. W rezultacie zabytkowa butelka wina jest winem drogim i wysokiej jakości. Wybór idealnej butelki wina wymaga wieloletniej wiedzy na temat degustacji wina i może być procesem chybionym lub trafionym.
Projekt testu jakości wina ocenia wina za pomocą testów fizykochemicznych, takich jak poziom alkoholu, ustalona kwasowość, gęstość, pH i inne czynniki. Projekt określa również kryteria jakości i ilości wina. Dzięki temu kupowanie wina staje się dziecinnie proste.
5. Prognozy giełdowe
Ta inicjatywa jest intrygująca, niezależnie od tego, czy pracujesz w sektorze finansowym. Dane giełdowe są szeroko badane przez naukowców, przedsiębiorstwa, a nawet jako źródło wtórnego dochodu. Niezbędna jest również zdolność analityka danych do badania i eksploracji danych szeregów czasowych. Dane z giełdy to świetne miejsce na start.
Istotą przedsięwzięcia jest prognozowanie przyszłej wartości akcji. Jest to oparte na aktualnych wynikach rynku oraz statystykach z lat ubiegłych. Kaggle zbiera dane na temat indeksu NIFTY-50 od 2000 roku i jest on obecnie aktualizowany co tydzień. Od 1 stycznia 2000 r. zawiera ceny akcji ponad 50 organizacji.
6. Rekomendacja filmu
Jestem pewien, że miałeś to uczucie po obejrzeniu dobrego filmu. Czy kiedykolwiek poczułeś impuls, by podniecić swoje zmysły, oglądając podobne filmy?
Wiemy, że serwisy OTT, takie jak Netflix, znacznie poprawiły swoje systemy rekomendacji. Jako student uczenia maszynowego musisz zrozumieć, w jaki sposób takie algorytmy są kierowane do klientów na podstawie ich preferencji i recenzji.
Zestaw danych IMDB w Kaggle jest prawdopodobnie jednym z najbardziej kompletnych, umożliwiając wywnioskowanie modeli rekomendacji na podstawie tytułu filmu, oceny klientów, gatunku i innych czynników. Jest to również doskonała metoda nauki o filtrowaniu opartym na treści i inżynierii funkcji.
7. Przewidywanie uprawnień do obciążenia
Świat kręci się wokół pożyczek. Głównym źródłem zysku banków są odsetki od kredytów. Dlatego są ich podstawowym biznesem.
Jednostki lub grupy jednostek mogą rozwijać gospodarkę jedynie poprzez inwestowanie pieniędzy w firmę w nadziei, że w przyszłości wzrośnie jej wartość. Czasami ważne jest, aby uzyskać pożyczkę, aby móc podejmować tego rodzaju ryzyko, a nawet uczestniczyć w pewnych ziemskich przyjemnościach.
Zanim pożyczka może zostać zaakceptowana, banki zazwyczaj muszą przestrzegać dość rygorystycznego procesu. Ponieważ pożyczki są tak kluczowym aspektem życia wielu ludzi, przewidywanie, czy ktoś się ubiega się o pożyczkę, byłoby niezwykle korzystne, pozwalając na lepsze planowanie poza przyjęciem lub odrzuceniem pożyczki.
8. Analiza nastrojów z wykorzystaniem danych z Twittera
Dzięki sieci społecznościowe podobnie jak Twitter, Facebook i Reddit, ekstrapolacja opinii i trendów stała się znacznie łatwa. Informacje te służą do eliminowania opinii na temat wydarzeń, ludzi, sportu i innych tematów. Inicjatywy uczenia maszynowego związane z badaniem opinii są stosowane w różnych sytuacjach, w tym w kampaniach politycznych i ocenach produktów Amazon.
Ten projekt będzie wyglądał fantastycznie w Twoim portfolio! Do wykrywania emocji i analizy opartej na aspektach można szeroko stosować techniki, takie jak maszyny wektorów nośnych, algorytmy regresji i klasyfikacji (znajdowanie faktów i opinii).
9. Prognoza przyszłej sprzedaży
Duże firmy i handlowcy B2C chcą wiedzieć, ile będzie sprzedawać każdy produkt z ich asortymentu. Prognozowanie sprzedaży pomaga właścicielom firm w określeniu, na które produkty jest duże zapotrzebowanie. Dokładne prognozowanie sprzedaży znacznie zmniejszy marnotrawstwo, jednocześnie określając przyrostowy wpływ na przyszłe budżety.
Sprzedawcy detaliczni, tacy jak Walmart, IKEA, Big Basket i Big Bazaar, wykorzystują prognozowanie sprzedaży do oszacowania popytu na produkty. Aby konstruować takie projekty ML, musisz znać różne techniki czyszczenia surowych danych. Wymagane jest również dobre zrozumienie analizy regresji, zwłaszcza prostej regresji liniowej.
Do tego rodzaju zadań będziesz potrzebować bibliotek takich jak Dora, Scrubadub, Pandas, NumPy i innych.
10. Wykrywanie fałszywych wiadomości
To kolejna nowatorska próba uczenia maszynowego skierowana do dzieci w wieku szkolnym. Jak wszyscy wiemy, fałszywe wiadomości rozprzestrzeniają się lotem błyskawicy. Wszystko jest dostępne w mediach społecznościowych, od łączenia osób po czytanie codziennych wiadomości.
W rezultacie wykrywanie fałszywych wiadomości staje się obecnie coraz trudniejsze. Wiele dużych sieci społecznościowych, takich jak Facebook i Twitter, ma już algorytmy do wykrywania fałszywych wiadomości w postach i kanałach.
Aby zidentyfikować fałszywe wiadomości, ten typ projektu ML wymaga dokładnego zrozumienia wielu podejść NLP i algorytmów klasyfikacji (PassiveAggressiveClassifier lub Naive Bayes klasyfikator).
11. Przewidywanie zakupu kuponów
Klienci coraz częściej zastanawiają się nad zakupami online, gdy koronawirus zaatakował planetę w 2020 roku. W rezultacie sklepy zostały zmuszone do przeniesienia swojej działalności do Internetu.
Klienci natomiast wciąż szukają świetnych ofert, tak jak w sklepach, i coraz częściej polują na superoszczędne kupony. Istnieją nawet strony internetowe poświęcone tworzeniu kuponów dla takich klientów. Możesz dowiedzieć się o eksploracji danych w uczeniu maszynowym, tworzeniu wykresów słupkowych, wykresów kołowych i histogramów w celu wizualizacji danych i inżynierii funkcji za pomocą tego projektu.
Aby wygenerować predykcje, można również przyjrzeć się metodom imputacji danych do zarządzania wartościami NA i cosinusowymi podobieństwami zmiennych.
12. Przewidywanie rezygnacji klientów
Konsumenci są najważniejszym zasobem firmy, a ich utrzymanie ma kluczowe znaczenie dla każdej firmy, której celem jest zwiększanie przychodów i budowanie z nimi długotrwałych, znaczących relacji.
Ponadto koszt pozyskania nowego klienta jest pięciokrotnie wyższy niż koszt utrzymania istniejącego. Customer Churn/Attrition to dobrze znany problem biznesowy, w którym klienci lub abonenci przestają prowadzić interesy z usługą lub firmą.
W idealnym przypadku nie będą już płatnym klientem. Klient jest uważany za odchodzącego, jeśli minął określony czas od ostatniej interakcji klienta z firmą. Ustalenie, czy klient odejdzie, a także szybkie podanie odpowiednich informacji mających na celu utrzymanie klienta, ma kluczowe znaczenie dla obniżenia churnu.
Nasze mózgi nie są w stanie przewidzieć obrotów dla milionów klientów; tutaj może pomóc uczenie maszynowe.
13. Prognozy sprzedaży Wallmart
Jednym z najbardziej znanych zastosowań uczenia maszynowego jest prognozowanie sprzedaży, które polega na wykrywaniu cech wpływających na sprzedaż produktów i przewidywaniu przyszłej wielkości sprzedaży.
Zestaw danych Walmart, który zawiera dane sprzedaży z 45 lokalizacji, jest używany w tym badaniu uczenia maszynowego. W zestawie danych uwzględniana jest sprzedaż na sklep, według kategorii, co tydzień. Celem tego projektu uczenia maszynowego jest przewidywanie sprzedaży dla każdego działu w każdym punkcie sprzedaży, aby mogli oni podejmować lepsze decyzje dotyczące optymalizacji kanałów na podstawie danych i planowania zapasów.
Praca ze zbiorem danych Walmart jest trudna, ponieważ zawiera wybrane zdarzenia przeceny, które mają wpływ na sprzedaż i powinny być brane pod uwagę.
14. Analiza danych Uber
Jeśli chodzi o wdrażanie i integrowanie uczenia maszynowego i uczenia głębokiego w swoich aplikacjach, popularna usługa wspólnego przejazdu nie pozostaje daleko w tyle. Każdego roku przetwarza miliardy podróży, umożliwiając dojeżdżającym do pracy o każdej porze dnia i nocy.
Ponieważ ma tak dużą bazę klientów, potrzebuje wyjątkowej obsługi klienta, aby jak najszybciej zająć się reklamacjami konsumentów.
Uber dysponuje zbiorem danych obejmującym miliony odbiorów, które może wykorzystać do analizowania i wyświetlania podróży klientów w celu odkrycia spostrzeżeń i poprawy obsługi klienta.
15. Analiza Covid-19
COVID-19 ogarnął dziś świat, i to nie tylko w sensie pandemii. Podczas gdy eksperci medyczni koncentrują się na generowaniu skutecznych szczepień i uodparnianiu świata, naukowcy danych nie są daleko w tyle.
Nowe przypadki, dzienna liczba aktywnych osób, ofiary śmiertelne i statystyki testów są upubliczniane. Prognozy tworzone są codziennie na podstawie wybuchu SARS z poprzedniego stulecia. W tym celu można użyć analizy regresji i obsługiwać wektorowe modele predykcyjne oparte na maszynach.
Wnioski
Podsumowując, omówiliśmy niektóre z najlepszych projektów ML, które pomogą Ci w testowaniu programowania uczenia maszynowego, a także uchwyceniu jego pomysłów i implementacji. Wiedza o tym, jak zintegrować uczenie maszynowe, może pomóc Ci awansować w zawodzie, ponieważ technologia przejmuje kontrolę w każdej branży.
Podczas nauki uczenia maszynowego zalecamy przećwiczenie własnych koncepcji i napisanie wszystkich algorytmów. Pisanie algorytmów podczas nauki jest ważniejsze niż wykonanie projektu, a także daje przewagę we właściwym zrozumieniu tematów.
Dodaj komentarz