El siguiente trabajo se desarrollará la evaluación de la acidez del vino rojo, que es a menudo parte del proceso de certificación y se puede utilizar para mejorar la elaboración del vino.
Se modelarán los datos por el método del modelo lineal, polinomial y análisis de outliers por el cual se compararán para tener modelos predictivos y elegir el que mejor satisfaga las condiciones establecidas normales.
Tabla 2: Correlación de Variables
Tabla 1: Base de datos (Acidity)
Ilustración 1: Grafica de Correlación
Ilustración 2: Grafica de Dispersión
La base de datos corresponde a las variantes del vino rojo portugués "Vinho Verde".
Después de seleccionar las variables para el análisis se creó la variable de Acidity para comparar la acidez con el pH.
Ilustración 3: Gráfica (Train, Test)
Tabla 4: RMSE(Train error), RMSE(Test error).
Se realiza el modelo de análisis de regresión polinomial para una mejor observación de Train y Test que respectivamente se determinaran de acuerdo con las variables dependientes e independientes que se encuentran en nuestra base de datos.
Ilustración 3: Gráfica (Train, Test)
Tabla 7: Modelo Ajustado
Ilustración 5: Gráfica Probabilidad Residual
En base al modelo obtenido (Tabla 7), se observa un mayor incremento tanto en su R2 del 61.4% aproximadamente.
Ilustración 7: Correlación de Variables
En este trabajo, se probaron los modelos de regresión polinomial y el análisis de outliers para analizar los modelos de la relación entre la acidez y el pH del vino rojo de Portugal, siendo el modelo de análisis de outliers el que mejor se ajusta a nuestros datos de las mediciones de las variables de la acidez y el pH, presentando un coeficiente de determinación R2 aproximadamente al 61.4% y un error menor en nuestro modelo.