Содержание[Скрывать][Показывать]
- 1. титановый
- 2. Классификация ирландских цветов
- 3. Прогноз цен на жилье в Бостоне
- 4. Тестирование качества вина
- 5. Прогноз фондового рынка
- 6. Рекомендация фильма
- 7. Прогноз приемлемости загрузки
- 8. Анализ настроений с использованием данных Twitter
- 9. Прогноз будущих продаж
- 10. Обнаружение фейковых новостей
- 11. Прогноз покупки купонов
- 12. Прогноз оттока клиентов
- 13. Прогнозирование продаж Wallmart
- 14. Анализ данных Uber
- 15. Covid-19 Анализ
- Заключение
Машинное обучение — это простое исследование того, как обучить компьютерную программу или алгоритм постепенному улучшению конкретной работы, представленной на высоком уровне. Идентификация изображений, обнаружение мошенничества, системы рекомендаций и другие приложения машинного обучения уже доказали свою популярность.
Работа с машинным обучением делает работу человека простой и эффективной, экономя время и обеспечивая качественный результат. Даже Google, самая популярная поисковая система в мире, использует обучение с помощью машины.
От анализа запроса пользователя и изменения результата на основе результатов до показа популярных тем и рекламы в связи с запросом — доступно множество вариантов.
Технологии, которые являются одновременно проницательными и самокорректирующими, не за горами в будущем.
Один из лучших способов начать работу — это приступить к работе и разработать проект. Поэтому мы составили список из 15 лучших проектов по машинному обучению для начинающих, которые помогут вам начать работу.
1. Титанический
Это часто считается одной из самых больших и приятных задач для всех, кто хочет больше узнать о машинном обучении. Titanic Challenge — это популярный проект машинного обучения, который также служит хорошим способом познакомиться с платформой обработки данных Kaggle. Набор данных «Титаника» состоит из подлинных данных о гибели злополучного корабля.
Он включает в себя такие детали, как возраст человека, социально-экономический статус, пол, номер каюты, порт отправления и, самое главное, выжил ли он!
Было определено, что метод K-ближайших соседей и классификатор дерева решений дают наилучшие результаты для этого проекта. Если вы ищете быстрый вызов на выходные, чтобы улучшить свои Возможности машинного обучения, это на Kaggle для вас.
2. Классификация ирландских цветов
Новичкам нравится проект категоризации цветов ириса, и это отличное место для начала, если вы новичок в машинном обучении. Длина чашелистиков и лепестков отличает цветы ириса от других видов. Цель этого проекта — разделить цветы на три вида: вирджиния, сетоза и лишай.
Для упражнений по классификации в проекте используется набор данных цветов ириса, который помогает учащимся изучить основы работы с числовыми значениями и данными. Набор данных цветка ириса крошечный, и его можно хранить в памяти без необходимости масштабирования.
3. Прогноз цен на жилье в Бостоне
Еще один известный набор данных для новичков в машинном обучении данные Бостонского жилищного фонда. Его цель — спрогнозировать стоимость домов в различных районах Бостона. Он включает в себя основные статистические данные, такие как возраст, ставка налога на имущество, уровень преступности и даже близость к центрам занятости, и все это может повлиять на цены на жилье.
Набор данных простой и крошечный, что упрощает эксперименты для новичков. Чтобы выяснить, какие факторы влияют на цену недвижимости в Бостоне, для различных параметров активно используются методы регрессии. Это отличное место, чтобы попрактиковаться в методах регрессии и оценить, насколько хорошо они работают.
4. Проверка качества вина
Вино — необычный алкогольный напиток, требующий многолетнего брожения. В результате старинная бутылка вина — это дорогое и качественное вино. Выбор идеальной бутылки вина требует многолетних знаний о дегустации вин, и это может быть процесс наугад.
В рамках проекта тестирования качества вина вина оцениваются с использованием физико-химических тестов, таких как уровень алкоголя, фиксированная кислотность, плотность, pH и другие факторы. Проект также определяет критерии качества вина и его количество. В результате покупка вина становится легкой задачей.
5. Прогноз фондового рынка
Эта инициатива интригует независимо от того, работаете ли вы в финансовом секторе или нет. Данные фондового рынка широко изучаются учеными, предприятиями и даже в качестве источника вторичного дохода. Способность ученого данных изучать и исследовать данные временных рядов также имеет жизненно важное значение. Данные с фондового рынка — отличное место для начала.
Суть попытки состоит в том, чтобы предсказать будущую стоимость акции. Это основано на текущих рыночных показателях, а также на статистике за предыдущие годы. Kaggle собирает данные об индексе NIFTY-50 с 2000 года, и в настоящее время он обновляется еженедельно. С 1 января 2000 г. он содержит котировки акций более 50 организаций.
6. Рекомендация фильма
Уверен, у вас возникало такое чувство после просмотра хорошего фильма. Испытывали ли вы когда-нибудь желание пощекотать себе нервы просмотром похожих фильмов?
Мы знаем, что сервисы OTT, такие как Netflix, значительно улучшили свои системы рекомендаций. Как студент, изучающий машинное обучение, вам необходимо понимать, как такие алгоритмы ориентируются на клиентов на основе их предпочтений и отзывов.
Набор данных IMDB на Kaggle, вероятно, является одним из наиболее полных, что позволяет выводить модели рекомендаций на основе названия фильма, рейтинга клиентов, жанра и других факторов. Это также отличный способ узнать о контентной фильтрации и разработке функций.
7. Прогноз приемлемости загрузки
Мир вращается вокруг кредитов. Основным источником прибыли банков являются проценты по кредитам. Следовательно, они являются их основным бизнесом.
Отдельные лица или группы лиц могут расширять экономику, только вкладывая деньги в фирму в надежде увидеть ее рост в будущем. Иногда важно получить кредит, чтобы иметь возможность рисковать такого рода и даже участвовать в определенных мирских удовольствиях.
Прежде чем ссуда может быть принята, банки обычно проводят довольно строгий процесс. Поскольку кредиты являются таким важным аспектом жизни многих людей, прогнозирование права на получение кредита, на который кто-то подает заявку, было бы чрезвычайно полезным, позволяя лучше планировать, помимо принятия или отказа в кредите.
8. Анализ настроений с использованием данных Twitter
Благодаря сети социальных сетей подобно Twitter, Facebook и Reddit, экстраполяция мнений и тенденций стала значительно проще. Эта информация используется для устранения мнений о событиях, людях, спорте и других темах. Инициативы машинного обучения, связанные с анализом мнений, применяются в различных условиях, включая политические кампании и оценку продуктов Amazon.
Этот проект будет отлично смотреться в вашем портфолио! Для обнаружения эмоций и анализа на основе аспектов можно широко использовать такие методы, как машины опорных векторов, алгоритмы регрессии и классификации (поиск фактов и мнений).
9. Прогноз будущих продаж
Крупные предприятия и продавцы B2C хотят знать, сколько будет продаваться каждый продукт в их ассортименте. Прогнозирование продаж помогает владельцам бизнеса определить, какие товары пользуются повышенным спросом. Точное прогнозирование продаж значительно сократит потери, а также определит дополнительное влияние на будущие бюджеты.
Розничные торговцы, такие как Walmart, IKEA, Big Basket и Big Bazaar, используют прогнозирование продаж для оценки спроса на продукцию. Вы должны быть знакомы с различными методами очистки необработанных данных, чтобы создавать такие проекты машинного обучения. Кроме того, требуется хорошее понимание регрессионного анализа, особенно простой линейной регрессии.
Для таких задач вам понадобятся такие библиотеки, как Dora, Scrubadub, Pandas, NumPy и другие.
10. Обнаружение фейковых новостей
Это еще одна передовая разработка в области машинного обучения, предназначенная для школьников. Как мы все знаем, фейковые новости распространяются со скоростью лесного пожара. Все доступно в социальных сетях, от общения с людьми до чтения ежедневных новостей.
В результате в наши дни обнаружение ложных новостей становится все труднее. Во многих крупных социальных сетях, таких как Facebook и Twitter, уже есть алгоритмы для обнаружения ложных новостей в публикациях и лентах.
Чтобы идентифицировать ложные новости, этот тип проекта ML требует глубокого понимания нескольких подходов НЛП и алгоритмов классификации (PassiveAggressiveClassifier или наивный байесовский классификатор).
11. Прогноз покупки купонов
Клиенты все чаще задумываются о покупках в Интернете, когда в 2020 году планету атаковал коронавирус. В результате торговые заведения были вынуждены перевести свой бизнес в онлайн.
Покупатели, с другой стороны, по-прежнему ищут выгодные предложения, как и в магазинах, и все чаще охотятся за суперэкономными купонами. Есть даже сайты, посвященные созданию купонов для таких клиентов. В этом проекте вы можете узнать об интеллектуальном анализе данных в машинном обучении, создании столбчатых диаграмм, круговых диаграмм и гистограмм для визуализации данных, а также о разработке функций.
Чтобы сгенерировать прогнозы, вы также можете изучить подходы к вменению данных для управления значениями NA и косинусным сходством переменных.
12. Прогнозирование оттока клиентов
Потребители являются самым важным активом компании, и их сохранение жизненно важно для любого бизнеса, стремящегося увеличить доход и построить с ними долгосрочные значимые связи.
Кроме того, стоимость привлечения нового клиента в пять раз выше, чем стоимость поддержания существующего. Отток/отток клиентов — это хорошо известная бизнес-проблема, из-за которой клиенты или подписчики перестают вести дела со службой или компанией.
В идеале они больше не будут платными клиентами. Клиент считается уволенным, если с момента его последнего взаимодействия с компанией прошло определенное количество времени. Определение того, будет ли отток клиентов, а также быстрое предоставление соответствующей информации, направленной на удержание клиентов, имеют решающее значение для снижения оттока.
Наш мозг не в состоянии предсказать оборот миллионов клиентов; здесь может помочь машинное обучение.
13. Прогноз продаж Wallmart
Одним из наиболее известных применений машинного обучения является прогнозирование продаж, которое включает в себя определение характеристик, влияющих на продажи продуктов, и прогнозирование будущих объемов продаж.
В этом исследовании машинного обучения используется набор данных Walmart, который содержит данные о продажах из 45 мест. Еженедельные продажи в магазине по категориям включаются в набор данных. Цель этого проекта машинного обучения — прогнозировать продажи для каждого отдела в каждой торговой точке, чтобы они могли принимать более эффективные решения по оптимизации каналов и планированию запасов на основе данных.
Работать с набором данных Walmart сложно, поскольку он содержит выбранные события уценки, которые влияют на продажи и должны учитываться.
14. Анализ данных Uber
Когда дело доходит до внедрения и интеграции машинного обучения и глубокого обучения в свои приложения, популярный сервис совместного использования не отстает. Каждый год он обрабатывает миллиарды поездок, позволяя пассажирам путешествовать в любое время дня и ночи.
Поскольку у компании такая большая клиентская база, ей необходимо исключительное обслуживание клиентов, чтобы как можно быстрее реагировать на жалобы потребителей.
У Uber есть набор данных из миллионов пикапов, которые он может использовать для анализа и отображения поездок клиентов, чтобы получить информацию и улучшить качество обслуживания клиентов.
15. Covid-19 Анализ
COVID-19 сегодня охватил весь земной шар, и не просто в смысле пандемии. В то время как медицинские эксперты концентрируются на создании эффективных вакцин и иммунизации мира, ученые-данные не отстают.
Новые случаи, ежедневное количество активных случаев, летальные исходы и статистика тестирования публикуются. Прогнозы составляются ежедневно на основе данных о вспышке атипичной пневмонии прошлого века. Для этого вы можете использовать регрессионный анализ и поддерживать векторные машинные модели прогнозирования.
Заключение
Подводя итог, мы обсудили некоторые из лучших проектов машинного обучения, которые помогут вам протестировать программирование машинного обучения, а также понять его идеи и реализацию. Знание того, как интегрировать машинное обучение, может помочь вам продвинуться в своей профессии, поскольку технологии распространяются во всех отраслях.
Во время изучения машинного обучения мы рекомендуем вам практиковать свои концепции и писать все свои алгоритмы. Написание алгоритмов во время обучения важнее, чем выполнение проекта, и это также дает вам преимущество в правильном понимании предметов.
Оставьте комментарий