Tipos de Machine Learning

Uno puede segmentar los modelos de aprendizaje automático por diferentes características, que incluyen:

• Los tipos de datos/estructuras orgánicas que utilizan (árbol/gráfico/neural red)

• El campo de las matemáticas con el que están más relacionados (estadística/probabilística)

• El nivel de computación requerido para entrenar (aprendizaje profundo)

Partiendo del nivel superior de aprendizaje automático, existen los siguientes subconjuntos:

• Aprendizaje supervisado

• Aprendizaje sin supervisión

Tipos de aprendizaje supervisado

En pocas palabras, el aprendizaje supervisado encuentra asociaciones entre las características de un conjunto de datos y una variable objetivo. Por ejemplo, los modelos de aprendizaje supervisado podrían tratar de encontrar la asociación entre las características de salud de una persona (frecuencia cardíaca, nivel de obesidad, etc.) y el riesgo de que esa persona sufra un ataque al corazón (la variable objetivo).

Estas asociaciones permiten que los modelos supervisados hagan predicciones basadas en el pasado, esto es a menudo lo primero que viene a la mente de las personas cuando escuche la frase, aprendizaje automático, pero de ninguna manera abarca el ámbito de aprendizaje automático.

El aprendizaje automático supervisado requiere un cierto tipo de datos llamados datos etiquetados. Esta significa que debemos enseñar nuestro modelo dándole ejemplos históricos que están etiquetados con la respuesta correcta. Recuerde el ejemplo del reconocimiento facial eso es modelo de aprendizaje supervisado porque estamos entrenando nuestro modelo con las imágenes anteriores etiquetadas como rostro o no rostro, y luego pedirle al modelo que prediga si un nuevo la imagen tiene una cara en ella.

Existen, en general, dos tipos de modelos de aprendizaje supervisado: regresión y clasificación. La diferencia entre los dos es bastante simple y radica en la respuesta variable.

Modelos de regresión le permiten predecir un valor numérico basado en una o más características. El entrenamiento de un modelo de regresión es una tarea de aprendizaje automático supervisado, lo que significa que debe proporcionar suficientes datos de muestra para entrenar el modelo para predecir el valor numérico deseado.

Los modelos de regresión intentan predecir una respuesta continua. Esto significa que la respuesta puede tomar un rango de valores infinitos. Considere los siguientes ejemplos:

• Importe en dólares

° Salario

° Presupuesto

• Temperatura

• Hora

° Generalmente se registra en segundos o minutos

Modelos de clasificación le permiten predecir una etiqueta de clase para un conjunto determinado de entradas. Esta etiqueta puede ser tan simple como una etiqueta de sí/no o un color azul, verde o rojo. Por ejemplo, Dejar que las máquinas realicen el entrenamiento del modelo, entrenará un modelo de clasificación para detectar si un cliente va a cancelar su suscripción telefónica o no. Predecir si una persona va a dejar de hacer algo se conoce como detección de abandono. El entrenamiento de un modelo de clasificación es una tarea de aprendizaje automático supervisado y requiere un conjunto de datos etiquetado para entrenar el modelo. Un conjunto de datos etiquetado contiene tanto las entradas como la etiqueta que desea que prediga el modelo.

La clasificación intenta predecir una respuesta categórica, lo que significa que la respuesta solo tiene una cantidad finita de opciones. Los ejemplos incluyen los dados como sigue:

• Grado de cáncer (1, 2, 3, 4, 5).

• Preguntas de verdadero/falso, como los siguientes ejemplos:

° "¿Esta persona tendrá un ataque al corazón dentro de un año?"

° "¿Conseguirás este trabajo?"

• Dada la foto de una cara, ¿a quién pertenece esta cara? (reconocimiento facial)

• Prediga el año en que nació alguien:

° Tenga en cuenta que hay muchas respuestas posibles (más de 100) pero todavía finitas

Aprendizaje sin supervisión

El segundo tipo de aprendizaje automático no se ocupa de las predicciones, pero tiene un objetivo más abierto. El aprendizaje no supervisado toma un conjunto de predictores y utiliza relaciones entre los predictores con el fin de realizar tareas, tales como la siguiente:

• Reducir la dimensión de los datos condensando variables juntas. Un ejemplo de esto sería la compresión de archivos. La compresión funciona por utilizando patrones en los datos y representando los datos en un formato más pequeño.

• Encontrar grupos de observaciones que se comporten de manera similar y agruparlos juntos.

El primer elemento de esta lista se llama reducción de dimensión y el segundo se llama agrupamiento Ambos son ejemplos de aprendizaje no supervisado porque no intentan encontrar una relación entre los predictores y una respuesta específica y por lo tanto no se utilizan para hacer predicciones de ningún tipo. Modelos sin supervisión, en su lugar, se utilizan para encontrar organizaciones y representaciones de los datos que fueron previamente desconocidos.

Clustering es una tarea de aprendizaje automático no supervisada que agrupa datos. A diferencia de los dos tipos de modelos anteriores, clustering no requiere datos de entrenamiento. Opera en el conjunto de datos dado y crea la cantidad deseada de grupos, asignando cada punto de datos a la colección a la que pertenece. Un caso de uso común de los modelos de agrupación es cuando intenta identificar distintos grupos de consumidores en su base de clientes a los que se dirigirá con campañas de marketing específicas.

Los sistemas de recomendación están diseñados para recomendar las mejores opciones en función de los perfiles de usuario. Los motores de búsqueda, las tiendas electrónicas y las plataformas populares de transmisión de video utilizan este tipo de modelo para producir recomendaciones personalizadas sobre qué hacer a continuación.

Los modelos de detección de anomalías pueden detectar valores atípicos de un conjunto de datos o dentro de un flujo de datos. Los valores atípicos son elementos que no pertenecen al resto de los elementos, lo que indica anomalías. Por ejemplo, si un sensor de vibración de una máquina comienza a enviar mediciones anormales, puede ser una buena indicación de que el dispositivo está a punto de fallar.

Buscar este blog

Publicaciones Roberto Martinez Gonzalez