Зміст[Сховати][Показати]
- 1 Титанік
- 2. Класифікація ірландських квітів
- 3. Прогнозування цін на будинок у Бостоні
- 4. Перевірка якості вина
- 5. Прогнозування фондового ринку
- 6. Рекомендація фільму
- 7. Прогноз відповідності навантаженню
- 8. Аналіз настроїв за допомогою даних Twitter
- 9. Прогнозування майбутніх продажів
- 10. Виявлення фейкових новин
- 11. Прогноз купівлі купонів
- 12. Прогнозування відтоку клієнтів
- 13. Прогнозування продажів Wallmart
- 14. Аналіз даних Uber
- 15. Аналіз Covid-19
- Висновок
Машинне навчання — це просте дослідження того, як навчити комп’ютерну програму або алгоритм поступово вдосконалювати конкретну роботу, представлену на високому рівні. Ідентифікація зображень, виявлення шахрайства, системи рекомендацій та інші програми машинного навчання вже довели свою популярність.
Робота ML робить працю людини простою та ефективною, заощаджуючи час та забезпечуючи високоякісний результат. Навіть Google, найпопулярніша пошукова система у світі, використовує навчання за допомогою машини.
Від аналізу запиту користувача та зміни результату на основі результатів до показу популярних тем і реклами, пов’язаних із запитом, доступні різні варіанти.
Технологія, яка є сприйнятливою та самокоригуючою, не за горами в майбутньому.
Один із найкращих способів розпочати – це навчитися та розробити проект. Тому ми склали список із 15 найкращих проектів машинного навчання для початківців, щоб ви могли почати.
1. Титанічна
Це часто вважається одним із найбільших і найприємніших завдань для тих, хто хоче дізнатися більше про машинне навчання. Titanic challenge — це популярний проект машинного навчання, який також є хорошим способом познайомитися з платформою Kaggle Data Science. Набір даних "Титаніка" складається зі справжніх даних про затоплення злощасного корабля.
Він містить такі деталі, як вік людини, соціально-економічний статус, стать, номер каюти, порт відправлення та, що найважливіше, чи вижили вони!
Техніка K-Nearest Neighbor і класифікатор дерева рішень дали найкращі результати для цього проекту. Якщо ви шукаєте швидке завдання на вихідні, щоб покращити свій Здатності до машинного навчання, цей на Kaggle для вас.
2. Класифікація ірландських квітів
Початківцям подобається проект категоризації квітів ірису, і це чудове місце для початку, якщо ви новачок у машинному навчанні. Довжина чашолистків і пелюсток відрізняє ірис від інших видів. Мета цього проекту полягає в тому, щоб розділити квіти на три види: Virginia, setosa та Versicolor.
Для класифікаційних вправ у проекті використовується набір даних Iris flower, який допомагає учням вивчити основи роботи з числовими значеннями та даними. Набір даних квітки ірису є крихітним, його можна зберігати в пам’яті без необхідності масштабування.
3. Прогнозування цін на будинок у Бостоні
Ще один відомий набір даних для новачків у машинному навчанні це дані Boston Housing. Його мета — спрогнозувати вартість будинків у різних районах Бостона. Він включає важливі статистичні дані, такі як вік, ставка податку на нерухомість, рівень злочинності та навіть близькість до центрів зайнятості, усе це може вплинути на ціни на житло.
Набір даних простий і крихітний, тому новачкам легко експериментувати. Щоб з’ясувати, які фактори впливають на ціну нерухомості в Бостоні, широко використовуються методи регресії за різними параметрами. Це чудове місце, щоб відпрацювати методи регресії та оцінити, наскільки добре вони працюють.
4. Перевірка якості вина
Вино – незвичайний алкогольний напій, який потребує років бродіння. В результаті антикварна пляшка вина – це дороге і якісне вино. Вибір ідеальної пляшки вина потребує багаторічних знань про дегустацію вина, і це може бути непростим процесом.
Проект перевірки якості вина оцінює вина за допомогою фізико-хімічних тестів, таких як рівень алкоголю, фіксована кислотність, щільність, pH та інші фактори. Проект також визначає критерії якості та кількість вина. У результаті придбання вина стає легким.
5. Прогнозування фондового ринку
Ця ініціатива інтригує незалежно від того, працюєте ви у фінансовому секторі чи ні. Дані фондового ринку широко вивчаються науковцями, компаніями та навіть як джерело вторинного доходу. Здатність дослідника даних вивчати та досліджувати дані часових рядів також є життєво важливою. Дані з фондового ринку – чудове місце для початку.
Суть спроби полягає в прогнозуванні майбутньої вартості акцій. Це базується на поточних показниках ринку, а також на статистиці за попередні роки. Kaggle збирає дані про індекс NIFTY-50 з 2000 року, і зараз він оновлюється щотижня. З 1 січня 2000 року він містить курси акцій більш ніж 50 організацій.
6. Рекомендація фільму
Я впевнений, що у вас було таке відчуття після перегляду хорошого фільму. Ви коли-небудь відчували бажання пощекотати свої почуття, переглядаючи подібні фільми?
Ми знаємо, що служби OTT, такі як Netflix, значно покращили свої системи рекомендацій. Як студент машинного навчання, вам потрібно буде зрозуміти, як такі алгоритми орієнтуються на клієнтів на основі їхніх уподобань і відгуків.
Набір даних IMDB на Kaggle, мабуть, один із найповніших, що дозволяє робити висновки про моделі рекомендацій на основі назви фільму, рейтингу клієнтів, жанру та інших факторів. Це також чудовий спосіб дізнатися про фільтрацію на основі вмісту та розробку функцій.
7. Прогноз відповідності навантаженню
Світ крутиться навколо кредитів. Основним джерелом прибутку банків є відсотки за кредити. Тому вони є основним бізнесом.
Окремі особи чи групи осіб можуть розширювати економіку, лише інвестуючи гроші у фірму в надії на те, що в майбутньому вона подорожчає. Іноді важливо отримати позику, щоб мати можливість ризикувати таким чином і навіть брати участь у певних мирських задоволеннях.
Перш ніж прийняти позику, банки зазвичай мають дотримуватись досить суворої процедури. Оскільки позики є надзвичайно важливим аспектом життя багатьох людей, прогнозування права на отримання позики, на яку хтось подає заявку, було б надзвичайно корисним, дозволяючи краще планувати, окрім прийняття або відмови в позиці.
8. Аналіз настроїв за допомогою даних Twitter
Завдяки мережі соціальних медіа як у Twitter, Facebook і Reddit, екстраполювати думки та тенденції стало значно легше. Ця інформація використовується для усунення думок про події, людей, спорт та інші теми. Ініціативи машинного навчання, пов’язані з аналізом громадської думки, застосовуються в різних ситуаціях, зокрема в політичних кампаніях і оцінках продуктів Amazon.
Цей проект буде виглядати фантастично у вашому портфоліо! Для виявлення емоцій і аналізу на основі аспектів можна широко використовувати такі методи, як машини опорних векторів, регресія та алгоритми класифікації (пошук фактів і думок).
9. Прогнозування майбутніх продажів
Великі B2C компанії та торговці хочуть знати, скільки буде продаватися кожен продукт із їх асортименту. Прогнозування продажів допомагає власникам бізнесу визначити, які товари користуються великим попитом. Точне прогнозування продажів суттєво зменшить втрати, а також визначить додатковий вплив на майбутні бюджети.
Роздрібні торговці, такі як Walmart, IKEA, Big Basket і Big Bazaar, використовують прогноз продажів для оцінки попиту на продукцію. Ви повинні бути знайомі з різними техніками очищення необроблених даних, щоб створювати такі проекти ML. Крім того, необхідно добре володіти регресійним аналізом, особливо простою лінійною регресією.
Для таких завдань вам знадобиться використовувати такі бібліотеки, як Dora, Scrubadub, Pandas, NumPy та інші.
10. Виявлення фейкових новин
Це ще одна передова спроба машинного навчання, спрямована на школярів. Як ми всі знаємо, фейкові новини поширюються як лісова пожежа. Усе доступне в соціальних мережах, від зв’язку окремих людей до читання щоденних новин.
Як наслідок, сьогодні виявити неправдиві новини стає все важче. Багато великих соціальних мереж, таких як Facebook і Twitter, уже мають алгоритми для виявлення фальшивих новин у публікаціях і стрічках.
Для виявлення неправдивих новин цей тип ML-проекту потребує глибокого розуміння багатьох підходів і алгоритмів класифікації NLP (PassiveAggressiveClassifier або Naive Bayes classifier).
11. Прогноз купівлі купонів
Коли коронавірус атакував планету в 2020 році, клієнти все частіше замислюються про онлайн-покупки. У результаті торгові заклади були змушені перевести свій бізнес в Інтернет.
З іншого боку, клієнти все ще шукають вигідні пропозиції, як і в магазинах, і все частіше шукають суперекономні купони. Є навіть сайти, присвячені створенню купонів для таких клієнтів. У цьому проекті ви можете дізнатися про інтелектуальний аналіз даних у машинному навчанні, створення гістограм, секторних діаграм і гістограм для візуалізації даних і розробки функцій.
Щоб створити прогнози, ви також можете ознайомитися з підходами імпутації даних для керування значеннями NA та косинусної подібності змінних.
12. Прогнозування відтоку клієнтів
Споживачі є найважливішим активом компанії, і їх утримання є життєво важливим для будь-якого бізнесу, який прагне збільшити дохід і створити з ними довгострокові значущі зв’язки.
Крім того, вартість залучення нового клієнта в п’ять разів вища, ніж вартість утримання існуючого. Відтік/відтік клієнтів — це добре відома бізнес-проблема, коли клієнти або передплатники припиняють співпрацювати зі службою чи компанією.
В ідеалі вони більше не будуть клієнтом, що платить. Клієнт вважається вилученим, якщо минуло певну кількість часу з моменту останньої взаємодії клієнта з компанією. Визначення того, чи буде клієнт відтікати, а також швидке надання відповідної інформації, спрямованої на утримання клієнтів, мають вирішальне значення для зниження відтоку.
Наш мозок не в змозі передбачити оборот мільйонів клієнтів; ось де може допомогти машинне навчання.
13. Прогнозування продажів Wallmart
Одним із найвідоміших застосувань машинного навчання є прогнозування продажів, яке включає виявлення характеристик, які впливають на продажі продукту, і прогнозування майбутніх обсягів продажів.
У цьому дослідженні машинного навчання використовується набір даних Walmart, який містить дані про продажі з 45 місць. Продажі на магазин за категоріями на тижневій основі включені в набір даних. Мета цього проекту машинного навчання полягає в тому, щоб передбачити продажі для кожного відділу в кожній торговій точці, щоб вони могли приймати кращі рішення щодо оптимізації каналів на основі даних і планування запасів.
Працювати з набором даних Walmart складно, оскільки він містить вибрані події уцінки, які впливають на продажі, і їх слід враховувати.
14. Аналіз даних Uber
Коли справа доходить до впровадження та інтеграції машинного та глибокого навчання в їхні програми, популярний сервіс спільного використання поїздок не відстає. Щороку він обробляє мільярди поїздок, дозволяючи пасажирам подорожувати в будь-який час дня чи ночі.
Оскільки компанія має таку велику клієнтську базу, їй потрібне виняткове обслуговування клієнтів, щоб якнайшвидше розглядати скарги споживачів.
Uber має набір даних про мільйони прийомів, які він може використовувати для аналізу та відображення поїздок клієнтів, щоб отримати інформацію та покращити взаємодію з клієнтами.
15. Аналіз Covid-19
Сьогодні COVID-19 охопив світ, і не просто в сенсі пандемії. Поки медичні експерти зосереджуються на створенні ефективних щеплень та імунізації світу, дані вчених не відстають.
Статистичні дані про нові випадки, щоденну активність, летальні випадки та статистику тестування оприлюднюються. Прогнози робляться щодня на основі спалаху SARS у попередньому столітті. Для цього можна використовувати регресійний аналіз і підтримувати векторні машинні моделі прогнозування.
Висновок
Підводячи підсумок, ми обговорили деякі з найкращих проектів машинного навчання, які допоможуть вам тестувати програмування машинного навчання, а також зрозуміти його ідеї та реалізацію. Знання того, як інтегрувати машинне навчання, може допомогти вам просунутися у вашій професії, оскільки технологія бере верх у кожній галузі.
Вивчаючи машинне навчання, ми рекомендуємо практикувати свої концепції та писати всі свої алгоритми. Написання алгоритмів під час навчання важливіше, ніж виконання проекту, і це також дає вам перевагу в правильному розумінні предметів.
залишити коментар