En el análisis del rendimiento de un modelo de clasificación, ¿qué problemas pueden surgir si solo se considera la métrica de accuracy cuando se trabaja con clases desbalanceadas, por ejemplo, con un 90 % de instancias de la clase positiva y un 10 % de la clase negativa?
En respuesta a EDUARDO JOSé MONTERO BERMUDEZ
Re: Accuracy Modelos de Clasificación
Hola Eduardo,
Muy buena pregunta, en problemas de clasificación con clases muy desbalanceadas (ej. 90% positiva – 10% negativa), la accuracy puede ser engañosamente alta (hasta ~90%) incluso con un modelo inútil que siempre predice la clase mayoritaria, ocultando un pobre desempeño en la clase minoritaria.
Por ende se deben usar varias métricas como F1-score, recall (especialmente de la clase minoritaria), precision-recall curve o AUC-PR en lugar de solo accuracy.
Muy buena pregunta, en problemas de clasificación con clases muy desbalanceadas (ej. 90% positiva – 10% negativa), la accuracy puede ser engañosamente alta (hasta ~90%) incluso con un modelo inútil que siempre predice la clase mayoritaria, ocultando un pobre desempeño en la clase minoritaria.
Por ende se deben usar varias métricas como F1-score, recall (especialmente de la clase minoritaria), precision-recall curve o AUC-PR en lugar de solo accuracy.