Los ensambles en Machine Learning son una técnica para mejorar el rendimiento de los modelos de aprendizaje automático. Estos incluyen ensambles de promedio, ensambles de votación, ensambles de boosting y ensambles de aprendizaje profundo. Cada uno de estos tipos de ensambles ofrece diferentes beneficios y desventajas.
Read More »Support Vector Machine Learning – SVM
El algoritmo SVM (Support Vector Machine) es un método de aprendizaje supervisado utilizado para la clasificación y regresión de datos. El objetivo principal de SVM es encontrar el hiperplano de decisión que mejor separe las clases en un espacio de características de alta dimensión. El hiperplano de decisión es un …
Read More »Análisis de Componentes Principales – PCA – Machine Learning
Esta técnica tiene como finalidad encontrar una transformación de datos que permita reducir la dimensión del problema eliminando información redundante y a la vez explicar la mayor varianza de los datos para poder utilizarlos con distintas finalidades. Permitirá eventualmente visualizar la información multidimensional y explorar variables latentes. Una recta define …
Read More »Data Leakage Machine Learning
Existen los casos en que después de entrenar un modelo con resultados del 99% de accuracy, fracasa vergonzosamente cuando se lo expone a un nuevo dataset. En varias oportunidades, la razón de esto se debe al data leakage. Demasiado bueno para ser verdad Esto ocurre cuando, de alguna manera, información …
Read More »Regresión Lineal – Variables Dummy
Las regresiones lineales multivariables, consisten en una variable dependiente y varias independientes. Por ejemplo: En este caso, x1, x2, x3, representan valores numéricos de la tabla pero D4 es una representación de la columna State que es Categórico. Para procesarlo, se genera una columna New York Dummy booleana que guarda …
Read More »Redes Neuronales Perceptrón Estructura, Tipos [Weka]
El ser humano ha tratado de recrear el funcionamiento del cerebro y proceso de aprendizaje mediante modelos computacionales llamados redes neuronales. Las neuronas son células nerviosas interconectadas entre sí que intercambian estímulos y, si la suma de estímulos que reciben rompen cierto umbral, “dispara” hacia otra neurona en forma de …
Read More »Support Vector Machine (SVM) – Machine Learning
Si pensamos en separar estos dos grupos, vemos como la línea que mejor lo hace a la que logra el camino más ancho entre ellos. Es decir, el margen más grande logrado por el hiperplano (línea en rojo) según los support vectors. Para maximizar el margen, estudiaremos el problema como …
Read More »Árboles de Decisión – Machine Learning
Los árboles de decisión intentan ofrecer una manera simple de catalogar donde a través de la menor cantidad de preguntas posibles, identificar un ítem con una clase determinada. Idealmente los atributos que conforman los nodos del árbol, deben generar partes “puras” donde dividan completamente las clases. Por ejemplo pensemos en …
Read More »Random Forest – Arboles de Decisión Machine Learning
Random Forest es un algoritmo flexible de machine learning que genera grandes resultados aún sin tunear los hyper-parameter. Es uno de los más usados y sirve tanto para clasificar como para regresiones. Random Forest es un algoritmo de aprendizaje supervisado, es decir, que aprende en función de datos anteriores de …
Read More »