Índice analítico[Ocultar][Mostrar]
O mundo está a cambiar rapidamente debido á intelixencia artificial e á aprendizaxe automática, que ten un impacto en todos os aspectos da nosa vida cotiá.
Desde asistentes de voz que usan PNL e aprendizaxe automática para reservar citas, buscar eventos no noso calendario e reproducir música ata dispositivos que son tan precisos que poden anticiparse ás nosas necesidades antes de que os consideremos.
Os ordenadores poden xogar ao xadrez, facer cirurxía e converterse en máquinas máis intelixentes e máis semellantes aos humanos coa axuda de algoritmos de aprendizaxe automática.
Estamos nun momento de avance tecnolóxico continuo, e ao ver como se desenvolveron os ordenadores ao longo do tempo, podemos facer predicións sobre o que sucederá no futuro.
A democratización das ferramentas e métodos informáticos é un dos aspectos fundamentais desta revolución que destaca. Científicos de datos crearon potentes ordenadores de procesamento de datos durante os últimos cinco anos implementando sen esforzo metodoloxías de vangarda. Os resultados son sorprendentes.
Neste post, mirarémolo detidamente aprendizaxe de máquina algoritmos e todas as súas variacións.
Entón, que son os algoritmos de aprendizaxe automática?
O enfoque utilizado polo sistema de intelixencia artificial para levar a cabo a súa tarefa (en xeral, predicir os valores de saída a partir de datos de entrada dados) coñécese como algoritmo de aprendizaxe automática.
Un algoritmo de aprendizaxe automática é un proceso que utiliza datos e úsase para crear modelos de aprendizaxe automática que están listos para a produción. Se a aprendizaxe automática é o tren que realiza un traballo, entón os algoritmos de aprendizaxe automática son as locomotoras que moven o traballo.
O mellor enfoque de aprendizaxe automática para utilizar dependerá do problema empresarial que esteas intentando resolver, do tipo de conxunto de datos que estás utilizando e dos recursos que tes dispoñibles.
Os algoritmos de aprendizaxe automática son aqueles que converten un conxunto de datos nun modelo. Dependendo do tipo de problema ao que intentes responder, a potencia de procesamento dispoñible e o tipo de datos que teñas, os algoritmos de aprendizaxe supervisados, sen supervisión ou de reforzo poden funcionar ben.
Entón, falamos de aprendizaxe supervisada, non supervisada e de reforzo, pero cales son? Explorémolos.
Aprendizaxe supervisada, non supervisada e de reforzo
Aprendizaxe supervisada
Na aprendizaxe supervisada, o modelo de IA desenvólvese en función da entrada que se proporcionou e da etiqueta que representa o resultado previsto. A partir das entradas e saídas, o modelo desenvolve unha ecuación de mapeo e, utilizando esa ecuación de mapeo, prevé a etiqueta das entradas no futuro.
Digamos que necesitamos crear un modelo que poida distinguir entre un can e un gato. Varias fotos de gatos e cans incorpóranse ao modelo con etiquetas que indican se son gatos ou cans para adestrar o modelo.
O modelo busca establecer unha ecuación relacionando as etiquetas das fotografías de entrada con esas imaxes. Aínda que o modelo nunca vira a imaxe antes, despois do adestramento, pode identificar se é un gato ou un can.
Aprendizaxe sen supervisión
A aprendizaxe non supervisada implica adestrar un modelo de IA só en entradas sen etiquetalas. O modelo divide os datos de entrada en grupos con características relacionadas.
A futura etiqueta da entrada prevese entón dependendo de como se correspondan os seus atributos cunha das clasificacións. Considere a situación na que debemos dividir un grupo de bólas vermellas e azuis en dúas categorías.
Supoñamos que as outras características das bólas son idénticas, con excepción da cor. A partir de como pode dividir as bólas en dúas clases, o modelo busca as características que son diferentes entre as bólas.
Dous grupos de bólas, unha azul e outra vermella, prodúcense cando as bólas se dividen en dous grupos segundo a súa tonalidade.
Aprendizaxe de reforzo
Na aprendizaxe por reforzo, o modelo de IA busca maximizar o beneficio global actuando tan ben como pode nunha circunstancia particular. A retroalimentación sobre os seus resultados anteriores axuda ao modelo a aprender.
Pense no escenario no que se lle indica a un robot que seleccione unha ruta entre os puntos A e B. O robot escolle primeiro calquera dos cursos porque non ten experiencia previa.
O robot recibe información sobre a ruta que fai e adquire coñecemento a partir del. O robot pode utilizar a entrada para solucionar o problema a próxima vez que se atope cunha circunstancia similar.
Por exemplo, se o robot elixe a opción B e recibe unha recompensa, como comentarios positivos, entende que esta vez debe seleccionar a forma B para aumentar a súa recompensa.
Agora, finalmente, o que todos estades esperando son os algoritmos.
Principais algoritmos de aprendizaxe automática
1. Regresión lineal
O enfoque máis sinxelo de aprendizaxe automática que se desvía da aprendizaxe supervisada é a regresión lineal. Co coñecemento das variables independentes, utilízase principalmente para resolver problemas de regresión e crear predicións sobre variables dependentes continuas.
O obxectivo da regresión lineal é atopar a liña de mellor axuste, que pode axudar a predicir o resultado das variables dependentes continuas. Os prezos da vivenda, a idade e os salarios son algúns exemplos de valores continuos.
Un modelo coñecido como regresión lineal simple usa unha liña recta para calcular a asociación entre unha variable independente e unha variable dependente. Hai máis de dúas variables independentes na regresión lineal múltiple.
Un modelo de regresión lineal ten catro presupostos subxacentes:
- Linealidade: existe unha conexión lineal entre X e a media de Y.
- Homoscedasticidade: para cada valor de X, a varianza residual é a mesma.
- Independencia: as observacións son independentes entre si en termos de independencia.
- Normalidade: cando X é fixo, Y distribúese normalmente.
A regresión lineal funciona de forma admirable para os datos que se poden separar ao longo de liñas. Pode controlar o sobreajuste mediante técnicas de regularización, validación cruzada e redución da dimensionalidade. Non obstante, hai casos nos que se require unha ampla enxeñaría de funcións, o que ocasionalmente pode producir un exceso de axuste e ruído.
2. Regresión loxística
A regresión loxística é outra técnica de aprendizaxe automática que se afasta da aprendizaxe supervisada. O seu uso principal é a clasificación, aínda que tamén se pode utilizar para problemas de regresión.
A regresión loxística úsase para prever a variable dependente categórica utilizando a información dos factores independentes. O obxectivo é clasificar as saídas, que só poden estar entre 0 e 1.
O total ponderado das entradas é procesado pola función sigmoide, unha función de activación que converte valores entre 0 e 1.
A base da regresión loxística é a estimación de máxima verosimilitude, un método para calcular os parámetros dunha distribución de probabilidade asumida dados datos observados específicos.
3. Árbore de decisión
Outro método de aprendizaxe automática que se separa da aprendizaxe supervisada é a árbore de decisións. Tanto para cuestións de clasificación como de regresión, pódese empregar o enfoque da árbore de decisións.
Esta ferramenta de toma de decisións, que se asemella a unha árbore, utiliza representacións visuais para mostrar os resultados, os custos e as repercusións prospectivas das accións. Ao dividir os datos en partes separadas, a idea é análoga á mente humana.
Os datos foron divididos en partes distintas tanto como puidemos granular. O obxectivo principal dunha árbore de decisións é construír un modelo de adestramento que se poida usar para prever a clase da variable obxectivo. Os valores que faltan pódense xestionar automaticamente mediante a árbore de decisións.
Non hai ningún requisito para a codificación única, variables ficticias ou outros pasos de pretratamento de datos. É ríxido no sentido de que é difícil engadirlle datos novos. Se tes datos adicionais etiquetados, deberías volver adestrar a árbore en todo o conxunto de datos.
Como resultado, as árbores de decisión son unha mala opción para calquera aplicación que requira un cambio de modelo dinámico.
Segundo o tipo de variable obxectivo, as árbores de decisión clasifícanse en dous tipos:
- Variable categórica: unha árbore de decisións na que a variable obxectivo é categórica.
- Variable continua: unha árbore de decisións na que a variable obxectivo é continua.
4. Bosque aleatorio
O Método de bosque aleatorio é a seguinte técnica de aprendizaxe automática e é un algoritmo de aprendizaxe automático supervisado que se usa amplamente en cuestións de clasificación e regresión. Tamén é un método baseado en árbores, semellante a unha árbore de decisións.
Un bosque de árbores, ou moitas árbores de decisión, úsase polo método do bosque aleatorio para facer xuízos. Ao manexar tarefas de clasificación, o método do bosque aleatorio empregou variables categóricas mentres se manexaban tarefas de regresión con conxuntos de datos que conteñen variables continuas.
Un conxunto, ou mestura de moitos modelos, é o que fai o método forestal aleatorio, o que significa que as predicións fanse utilizando un grupo de modelos en lugar de só un.
A capacidade de usar tanto para problemas de clasificación como de regresión, que constitúen a maioría dos sistemas modernos de aprendizaxe automática, é un beneficio fundamental do bosque aleatorio.
Ensemble utiliza dúas estratexias diferentes:
- Ensacado: ao facer isto, prodúcense máis datos para o conxunto de datos de adestramento. Para diminuír a variación das previsións, faise isto.
- O impulso é o proceso de combinar estudantes débiles con aprendices fortes mediante a construción de modelos sucesivos, dando como resultado o modelo final coa máxima precisión.
5. Bayes inxenuo
Pódese resolver un problema de clasificación binaria (de dúas clases) e multiclase mediante a técnica de Naive Bayes. Cando o método se explica mediante valores de entrada binarios ou de categoría, é máis sinxelo de entender. Unha suposición feita por un clasificador naive Bayes é que a existencia dunha característica nunha clase non ten relación coa presenza doutras características.
A fórmula anterior indica:
- P(H): a probabilidade de que a hipótese H sexa correcta. A probabilidade previa denomínase esta.
- P(E): A probabilidade da evidencia
- P(E|H): A probabilidade de que a hipótese estea apoiada pola evidencia.
- P(H|E): A probabilidade de que a hipótese sexa certa, dada a evidencia.
Un clasificador de Bayes inxenuo tería en conta cada unha destas características individualmente ao determinar a probabilidade dun determinado resultado, aínda que estes atributos estean conectados entre si. Un modelo bayesiano inxenuo é sinxelo de construír e eficaz para grandes conxuntos de datos.
Sábese que funciona mellor que as técnicas de categorización máis complexas aínda que é básica. É unha colección de algoritmos que están baseados no Teorema de Bayes, en lugar dun único método.
6. K-Veciños máis próximos
A técnica K-nearest neighbors (kNN) é un subconxunto de aprendizaxe automática supervisada que se pode usar para resolver problemas de clasificación e regresión. O algoritmo KNN presume que se poden atopar obxectos comparables nas proximidades.
Lémbroo como unha reunión de persoas afíns. kNN aproveita a idea de semellanza entre outros puntos de datos utilizando a proximidade, a proximidade ou a distancia. Para etiquetar os datos non vistos en función dos puntos de datos observables etiquetados máis próximos, emprégase un método matemático para determinar a separación entre os puntos dun gráfico.
Debes determinar a distancia entre os puntos de datos para identificar os puntos comparables máis próximos. Para iso pódense usar medidas de distancia como a distancia euclidiana, a distancia de Hamming, a distancia a Manhattan e a distancia de Minkowski. O K coñécese como o número veciño máis próximo, e moitas veces é un número impar.
KNN pódese aplicar a problemas de clasificación e regresión. A predición que se fai cando se utiliza KNN para problemas de regresión baséase na media ou mediana das K ocorrencias máis similares.
O resultado dun algoritmo de clasificación baseado en KNN pódese determinar como a clase con maior frecuencia entre as K ocorrencias máis semellantes. Cada instancia esencialmente vota para a súa clase e a predición pertence á clase que recibe máis votos.
7. K-medios
É unha técnica para a aprendizaxe non supervisada que aborda os problemas de agrupación. Os conxuntos de datos divídense nun número determinado de clústeres (chame imos K) de tal xeito que os puntos de datos de cada clúster sexan homoxéneos e distintos dos dos outros clústeres.
Metodoloxía de agrupación de medios K:
- Para cada cluster, o algoritmo K-means selecciona k centroides, ou puntos.
- Cos centroides ou K clusters máis próximos, cada punto de datos forma un cluster.
- Agora, prodúcense novos centroides dependendo dos membros do clúster xa presentes.
- A distancia máis próxima para cada punto de datos calcúlase utilizando estes centroides actualizados. Ata que os centroides non cambian, este proceso repítese.
É máis rápido, máis fiable e máis sinxelo de comprender. Se hai problemas, a adaptabilidade de k-means simplifica os axustes. Cando os conxuntos de datos son distintos ou ben illados entre si, os resultados son mellores. Non pode xestionar datos erráticos ou valores atípicos.
8. Apoio ás máquinas vectoriais
Cando se utiliza a técnica SVM para clasificar datos, os datos en bruto móstranse como puntos nun espazo n-dimensional (onde n é o número de características que ten). Os datos pódense clasificar facilmente porque o valor de cada característica está conectado a unha coordenada específica.
Para separar os datos e colocalos nun gráfico, emprega liñas coñecidas como clasificadores. Este enfoque representa cada punto de datos como un punto nun espazo n-dimensional, onde n é o número de características que ten e o valor de cada característica é un valor de coordenadas específico.
Agora localizaremos unha liña que divide os datos en dous conxuntos de datos que foron categorizados de forma diferente. As distancias dos puntos máis próximos de cada un dos dous grupos serán as máis afastadas nesta liña.
Dado que os dous puntos máis próximos son os que están máis afastados da liña do exemplo anterior, a liña que divide os datos nos dous grupos que se clasificaron de forma diferente é a liña do medio. O noso clasificador é esta liña.
9. Redución da dimensionalidade
Usando o enfoque da redución da dimensionalidade, os datos de adestramento poden ter menos variables de entrada. En termos sinxelos, refírese ao proceso de diminución do tamaño do seu conxunto de funcións. Imaxinemos que o teu conxunto de datos ten 100 columnas; a redución da dimensionalidade diminuirá esa cantidade a 20 columnas.
O modelo faise automaticamente máis sofisticado e ten un maior risco de sobreadaptación a medida que aumenta o número de funcións. O maior problema ao traballar con datos en dimensións maiores é o que se coñece como a "maldición da dimensionalidade", que ocorre cando os teus datos conteñen un número excesivo de características.
Pódense usar os seguintes elementos para lograr a redución da dimensionalidade:
- Para atopar e escoller as características pertinentes, utilízase a selección de características.
- Usando funcións xa existentes, a enxeñaría de funcións crea novas funcións manualmente.
Conclusión
A aprendizaxe automática non supervisada ou supervisada é posible. Escolle aprendizaxe supervisada se os teus datos son menos abundantes e están ben etiquetados para a formación.
Os grandes conxuntos de datos a miúdo funcionarían e producirían mellores resultados mediante a aprendizaxe sen supervisión. Aprendizaxe profunda Os métodos son mellores se tes unha colección de datos considerable que estea facilmente dispoñible.
Aprendizaxe de reforzo e a aprendizaxe por reforzo profundo son algúns dos temas que estudaches. As características, os usos e as limitacións das redes neuronais agora están claros para ti. Por último, pero non menos importante, consideraches as opcións para diferentes linguaxes de programación, IDEs e plataformas á hora de crear o teu propio modelos de aprendizaxe automática.
O seguinte que debes facer é comezar a estudar e usar cada un aprendizaxe de máquina achegamento. Aínda que o tema sexa amplo, calquera tema pódese entender en poucas horas se te centras na súa profundidade. Cada suxeito está separado dos outros.
Debes pensar nun problema á vez, estudalo, poñelo en práctica e utilizar un idioma que elixas para implementar o(s) algoritmo(s) nel.
Deixe unha resposta