Índice analítico[Ocultar][Mostrar]
- 1 Titanic
- 2. Clasificación de flores irlandesas
- 3. Predición de prezos da casa de Boston
- 4. Probas de calidade do viño
- 5. Predición do mercado de valores
- 6. Recomendación de películas
- 7. Predición de elixibilidade de carga
- 8. Análise de sentimentos mediante datos de Twitter
- 9. Predición de vendas futuras
- 10. Detección de noticias falsas
- 11. Predición de compra de cupóns
- 12. Predición de abandono do cliente
- 13. Previsión de vendas de Wallmart
- 14. Análise de datos de Uber
- 15. Análise Covid-19
- Conclusión
A aprendizaxe automática é un estudo sinxelo sobre como educar un programa informático ou un algoritmo para mellorar gradualmente un traballo específico presentado a un alto nivel. A identificación de imaxes, a detección de fraudes, os sistemas de recomendación e outras aplicacións de aprendizaxe automática xa demostraron ser populares.
Os traballos de ML fan que o traballo humano sexa sinxelo e eficiente, aforrando tempo e garantindo un resultado de alta calidade. Incluso usa Google, o buscador máis popular do mundo aprendizaxe de máquina.
Desde analizar a consulta do usuario e alterar o resultado en función dos resultados ata mostrar temas de tendencia e anuncios relacionados coa consulta, hai unha variedade de opcións dispoñibles.
A tecnoloxía que é á vez perceptiva e autocorrexible non está moi lonxe no futuro.
Unha das mellores formas de comezar é poñerse en práctica e deseñar un proxecto. Polo tanto, compilamos unha lista de 15 proxectos de aprendizaxe automática para principiantes para comezar.
1. Titânico
A miúdo considérase que esta é unha das tarefas máis grandes e agradables para quen estea interesado en aprender máis sobre a aprendizaxe automática. O desafío Titanic é un popular proxecto de aprendizaxe automática que tamén serve como unha boa forma de familiarizarse coa plataforma de ciencia de datos Kaggle. O conxunto de datos do Titanic está formado por datos xenuínos do afundimento do desafortunado barco.
Inclúe detalles como a idade da persoa, o estado socioeconómico, o sexo, o número de cabina, o porto de saída e, o máis importante, se sobreviviu.
A técnica K-Nearest Neighbor e o clasificador da árbore de decisión determináronse para producir os mellores resultados para este proxecto. Se estás buscando un reto de fin de semana rápido para mellorar o teu Habilidades de aprendizaxe automática, este de Kaggle é para ti.
2. Clasificación de flores irlandesas
Aos principiantes encántalles o proxecto de categorización de flores de iris, e é un excelente lugar para comezar se es novo na aprendizaxe automática. A lonxitude dos sépalos e pétalos distingue as flores do iris doutras especies. O propósito deste proxecto é separar as floracións en tres especies: Virginia, setosa e Versicolor.
Para os exercicios de clasificación, o proxecto emprega o conxunto de datos Iris flower, que axuda aos estudantes a aprender os fundamentos de manexar valores e datos numéricos. O conxunto de datos de flores de iris é pequeno que se pode almacenar na memoria sen necesidade de escalalo.
3. Predición de prezos da casa de Boston
Outro coñecido conxunto de datos para novatos en aprendizaxe automática son os datos de Boston Housing. O seu obxectivo é prever os valores das vivendas en varios barrios de Boston. Inclúe estatísticas vitais como a idade, a taxa de impostos sobre a propiedade, a taxa de criminalidade e mesmo a proximidade aos centros de traballo, que poden afectar ao prezo da vivenda.
O conxunto de datos é sinxelo e pequeno, polo que é fácil de experimentar para os novatos. Para descubrir cales son os factores que inflúen no prezo da propiedade en Boston, as técnicas de regresión úsanse moito en varios parámetros. É un gran lugar para practicar técnicas de regresión e avaliar o ben que funcionan.
4. Probas de calidade do viño
O viño é unha bebida alcohólica inusual que require anos de fermentación. Como resultado, a antiga botella de viño é un viño caro e de alta calidade. Elixir a botella de viño ideal require anos de coñecementos sobre a cata de viños, e pode ser un proceso inesperado.
O proxecto de proba de calidade do viño avalía os viños mediante probas fisicoquímicas como o nivel de alcohol, a acidez fixa, a densidade, o pH e outros factores. O proxecto tamén determina os criterios de calidade e cantidades do viño. Como resultado, a compra de viño convértese nunha brisa.
5. Predición do mercado de valores
Esta iniciativa é interesante se traballas ou non no sector financeiro. Os datos do mercado de valores son estudados amplamente por académicos, empresas e mesmo como fonte de ingresos secundarios. A capacidade dun científico de datos para estudar e explorar datos de series temporais tamén é vital. Os datos do mercado de accións son un excelente lugar para comezar.
A esencia do esforzo é prever o valor futuro dunha acción. Isto baséase no rendemento actual do mercado, así como nas estatísticas de anos anteriores. Kaggle leva recopilando datos sobre o índice NIFTY-50 desde 2000, e actualmente actualízase semanalmente. Desde o 1 de xaneiro de 2000, contén os prezos das accións de máis de 50 organizacións.
6. Recomendación de película
Seguro que tiveches esa sensación despois de ver unha boa película. Algunha vez sentiches o impulso de estimular os teus sentidos vendo películas similares?
Sabemos que os servizos OTT como Netflix melloraron significativamente os seus sistemas de recomendación. Como estudante de aprendizaxe automática, terás que comprender como estes algoritmos apuntan aos clientes en función das súas preferencias e comentarios.
O conxunto de datos de IMDB en Kaggle é probablemente un dos máis completos, xa que permite inferir modelos de recomendación en función do título da película, a valoración dos clientes, o xénero e outros factores. Tamén é un excelente método para aprender sobre o filtrado baseado en contidos e a enxeñería de funcións.
7. Cargar a predición de elegibilidade
O mundo xira arredor dos préstamos. A principal fonte de beneficios dos bancos provén dos intereses dos préstamos. De aí que sexan o seu negocio fundamental.
Os individuos ou grupos de individuos só poden expandir as economías investindo diñeiro nunha empresa coa esperanza de velo aumentar de valor no futuro. Ás veces é importante buscar un préstamo para poder asumir riscos desta natureza e mesmo participar de certos praceres mundanos.
Antes de aceptar un préstamo, os bancos normalmente teñen un proceso bastante estrito a seguir. Como os préstamos son un aspecto tan crucial da vida de moitas persoas, prever a elegibilidade para un préstamo que alguén solicita sería extremadamente beneficioso, permitindo unha mellor planificación ademais de aceptar ou rexeitar o préstamo.
8. Análise de sentimentos usando datos de Twitter
Grazas a redes de redes sociais como Twitter, Facebook e Reddit, extrapolar opinións e tendencias fíxose considerablemente fácil. Esta información úsase para eliminar opinións sobre eventos, persoas, deportes e outros temas. As iniciativas de aprendizaxe automática relacionadas coa minería de opinións aplícanse nunha variedade de contextos, incluíndo campañas políticas e avaliacións de produtos de Amazon.
Este proxecto quedará fantástico na túa carteira! Para a detección de emocións e a análise baseada en aspectos, pódense utilizar amplamente técnicas como máquinas vectoriais de apoio, regresión e algoritmos de clasificación (buscando feitos e opinións).
9. Predición de vendas futuras
As grandes empresas e comerciantes B2C queren saber canto se venderá cada produto do seu inventario. A previsión de vendas axuda aos propietarios de empresas a determinar cales son os artigos máis demandados. A previsión de vendas precisa diminuirá significativamente o desperdicio á vez que determinará o impacto incremental nos orzamentos futuros.
Venda polo miúdo como Walmart, IKEA, Big Basket e Big Bazaar utilizan a previsión de vendas para estimar a demanda de produtos. Debes estar familiarizado con varias técnicas de limpeza de datos brutos para construír estes proxectos de ML. Ademais, é necesario un bo coñecemento da análise de regresión, especialmente a regresión lineal simple.
Para este tipo de tarefas, terás que empregar bibliotecas como Dora, Scrubadub, Pandas, NumPy e outras.
10. Detección de noticias falsas
É outro esforzo de aprendizaxe automática de vangarda dirixido aos escolares. As noticias falsas están a espallarse como a pólvora, como todos sabemos. Todo está dispoñible nas redes sociais, desde conectar a persoas ata ler as noticias diarias.
Como resultado, detectar noticias falsas volveuse cada vez máis difícil estes días. Moitas grandes redes sociais, como Facebook e Twitter, xa contan con algoritmos para detectar noticias falsas en publicacións e fontes.
Para identificar noticias falsas, este tipo de proxecto de ML precisa dunha comprensión completa de múltiples enfoques de PNL e algoritmos de clasificación (PassiveAggressiveClassifier ou clasificador Naive Bayes).
11. Predición de compra de cupóns
Os clientes contemplan cada vez máis comprar en liña cando o coronavirus atacou o planeta en 2020. Como resultado, os establecementos comerciais víronse obrigados a cambiar o seu negocio en liña.
Os clientes, en cambio, seguen buscando grandes ofertas, igual que nas tendas, e cada vez buscan máis cupóns de super-aforro. Incluso hai sitios web dedicados a crear cupóns para tales clientes. Podes aprender sobre a minería de datos na aprendizaxe automática, a produción de gráficos de barras, gráficos circulares e histogramas para visualizar datos e a enxeñería de funcións con este proxecto.
Para xerar predicións, tamén pode analizar enfoques de imputación de datos para xestionar os valores NA e a semellanza coseno das variables.
12. Predicción de abandono do cliente
Os consumidores son o activo máis importante dunha empresa, e mantelos é vital para calquera empresa que pretenda aumentar os ingresos e establecer conexións significativas a longo prazo con eles.
Ademais, o custo de adquirir un novo cliente é cinco veces maior que o de manter un existente. O abandono/desgaste de clientes é un problema empresarial ben coñecido no que os clientes ou subscritores deixan de facer negocios cun servizo ou cunha empresa.
O ideal é que xa non sexan un cliente que paga. Un cliente considérase despedido se pasou un tempo determinado desde a última vez que o cliente interactuou coa empresa. Identificar se un cliente vai abandonar, así como proporcionar rapidamente información relevante destinada á retención do cliente, son cruciais para reducir o abandono.
O noso cerebro é incapaz de anticipar a facturación de millóns de clientes; aquí é onde a aprendizaxe automática pode axudar.
13. Previsión de vendas de Wallmart
Unha das aplicacións máis destacadas da aprendizaxe automática é a previsión de vendas, que consiste en detectar características que inflúen nas vendas de produtos e anticipar o volume de vendas futuro.
O conxunto de datos de Walmart, que contén datos de vendas de 45 localizacións, úsase neste estudo de aprendizaxe automática. No conxunto de datos inclúense as vendas por tenda, por categoría, nunha base semanal. O obxectivo deste proxecto de aprendizaxe automática é anticipar as vendas de cada departamento en cada punto de venda para que poidan tomar mellores decisións de planificación de inventarios e optimización de canles baseadas en datos.
Traballar co conxunto de datos de Walmart é difícil xa que contén eventos de rebaixa escollidos que teñen un impacto nas vendas e deben ser considerados.
14. Análise de datos de Uber
Cando se trata de implementar e integrar a aprendizaxe automática e a aprendizaxe profunda nas súas aplicacións, o popular servizo de transporte compartido non se queda atrás. Cada ano, procesa miles de millóns de viaxes, o que permite aos viaxeiros viaxar a calquera hora do día ou da noite.
Debido a que ten unha base de clientes tan grande, necesita un servizo ao cliente excepcional para atender as queixas dos consumidores o máis rápido posible.
Uber ten un conxunto de datos de millóns de recollidas que pode usar para analizar e mostrar as viaxes dos clientes para descubrir información e mellorar a experiencia do cliente.
15. Análise Covid-19
O COVID-19 arrasou o mundo hoxe, e non só no sentido dunha pandemia. Mentres os expertos médicos se concentran en xerar vacinas eficaces e inmunizar o mundo, científicos de datos non se quedan atrás.
Os novos casos, o reconto de activos diarios, as vítimas mortais e as estatísticas de probas fanse públicas. As previsións fanse a diario en función do brote de SARS do século anterior. Para iso, pode utilizar a análise de regresión e admitir modelos de predición baseados en máquinas vectoriais.
Conclusión
Para resumir, comentamos algúns dos principais proxectos de ML que che axudarán a probar a programación de Machine Learning, así como a comprender as súas ideas e implementación. Saber como integrar a aprendizaxe automática pode axudarche a avanzar na túa profesión a medida que a tecnoloxía toma o relevo en todas as industrias.
Mentres aprendes Machine Learning, recomendámosche que practiques os teus conceptos e escribas todos os teus algoritmos. Escribir algoritmos mentres se aprende é máis importante que realizar un proxecto, e tamén che proporciona unha vantaxe para comprender correctamente as materias.
Deixe unha resposta