Skip to content

[R-es] Regresión Logística desbalanceada

5 messages · Milagros Camacho Bellido, Carlos Ortega, José Luis Cañadas +1 more

#
Hola Comunidad, Feliz Año 2017:


Tengo un problemilla con una regresión logística desbalanceada, tengo 
demasiados TRUE (93%). ¿Sabría alguién alguna forma de corregir el 
problema con R?


Un slaudo,


Milagros Camacho



---
El software de antivirus Avast ha analizado este correo electrónico en busca de virus.
https://www.avast.com/antivirus
#
Hola,

Sí, puedes balancear las clases de diferentes formas...
Mira lo que ofrece el paquete "caret" aquí:

http://topepo.github.io/caret/subsampling-for-class-imbalances.html


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 5 de enero de 2017, 13:28, Milagros Camacho Bellido <
mila.camachobellido en gmail.com> escribió:

  
    
#
Hola.
En principio podrías hacer sobremuestreo de tus FALSE. Teóricamente el
sobre muestreo NO debería mejorar sustancialmente un modleo logístico y si
se utiliza hay que corregir las estimaciones.  Un par de referencias de los
compañeros Raúl Vaquerizo y Carlos Gil, respectivamente

1- http://analisisydecision.es/el-sobremuestreo-%C2%BFmejora-mi-estimacion/
2-
https://www.datanalytics.com/2014/11/17/los-coeficientes-de-la-regresion-logistica-con-sobremuestreo/


Si sigues pensando en utilizar "oversampling" o "undersampling"  mira la
técnica SMOTE  (crea ejemplos sintéticos de la clase minoritaria). está
implementada en el paquete DMwR
https://rdrr.io/cran/DMwR/

Saludos

El 5 de enero de 2017, 13:28, Milagros Camacho Bellido <
mila.camachobellido en gmail.com> escribió:

  
  
#
Ante las muestras desbalanceadas hay 3 estrategias a seguir:


Undersampling

Oversampling

Algoritmos sensibles al coste



Lo mas facil es hacer oversampling o undersampling, es decir, o bine reducir la clase mayoritaria o bien aumentar la clase minoritaria.


En R una buena manera de hacrerlo es con SMOTE.


Un saludo

Jesús
#
Olvidé adjuntar el paquete para balancear los datso:


https://cran.r-project.org/web/packages/unbalanced/unbalanced.pdf

Package 'unbalanced' - R<https://cran.r-project.org/web/packages/unbalanced/unbalanced.pdf>
cran.r-project.org
Package 'unbalanced' June 26, 2015 Type Package Title Racing for Unbalanced Methods Selection Version 2.0 Date 2015-06-25 Author Andrea Dal Pozzolo, Olivier ...



Un saludo

Jesús