Skip to content

[R-es] GLM con clusters

7 messages · Freddy Omar López Quintero, Xavier-Andoni Tibau Alberdi, Sebastian Gadea +2 more

#
Buenas tardes,

desde Uruguay, quiero realizar una regresión logística,con la función GLM,
pero ademas quiero designarle a las observaciones clusters.

La idea es decirle al programa que las observaciones corresponden a
diferentes clusters.


Saludos!
Sebastián.
#
?Hola.?

2017-03-22 12:33 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
?Si no entiendo mal, quieres estimar un modelo marginal; entonces la opción
inmediata (para mí) está en el paquete gee. Su función del mismo nombre
tiene un ejemplo para datos binarios.

Si el modelo que quieres no es marginal sino un modelo mixto más general,
podrías utilizar (entre muchísimas opciones) el paquete lme4,
específicamente la función glmer.

Cabe sin embargo la posibilidad que haya entendido todo mal y debas darnos
un poco más de información para intentar ayudarte mejor.

¡Salud!
#
Buenas,

No estoy muy seguro de porqué quieres hacer esto. Si no te entiendo mal,
quieres hacer una regresión logística, y con los resultados un análisis de
clústers. Quizá lo mejor seria usar ambos métodos de predicción y comparar
los resultados. Aún así, si te he entendido bien, entonces la manera de
hacerlo sería: primero la regresión y luego recuperas las predicciones. Por
ejemplo:

mylogit <- glm(variable ~ ., data = df, family = "binomial") #Regresion
logistica

summary(mylogit) #Ves que tal ha quedado.

Puedes recuperar las prediciones con 'mylogit$fitted.values' y las puedes
poner en el dataframe original

df$fitted <- mylogit$fitted.values

Luego, puedes realizar un análisis de clusters usando las predicciones.

Como se trata de una regresión logística, tendira sentido que antes del
analisis redondees los resultados hacia 1 o hacia 0.

Espero que esto te sirva.

Un saludo,

Xavier Tibau








2017-03-22 16:33 GMT+01:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:

  
  
#
Gracias a todos por sus respuestas, perdón si no fui muy claro.

Lo que intento replicar es un análisis realizado en Stata, tengo que hacer
los mismos cálculos pero en el r.

En Stata lo que se hizo fue:

xi: logistic i.coord i.v11_sexo, vce (cluster red)


*Vce (cluster clustvar) especifica que los errores estándar permiten la
correlación intragrupo, relajando el requisito habitual de que las
observaciones sean independientes. Es decir, las observaciones son
independientes entre grupos (grupos) pero no necesariamente dentro de los
grupos. *
http://www.stata.com/manuals13/rvce_option.pdf


O sea, quitan el supuesto de independencia entre observaciones de un mismo
grupo, en este lo indica la variable red. Pero ésto no afecta la estimación
de los coeficientes, si los intervalos de confianza.


El 22 de marzo de 2017, 13:38, Xavi tibau alberdi <xavitibau en gmail.com>
escribió:

  
    
#
Hola, ¿qué tal?

Tienes una discusión sobre esos asuntos aquí
<http://rpsychologist.com/r-guide-longitudinal-lme-lmer>. Puedes usar los
paquetes lmer o nlme (me decantaría por el primero).

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El 22 de marzo de 2017, 17:48, Sebastian Gadea <sebastiangadea.uy en gmail.com>
escribió:

  
  
#
2017-03-22 13:48 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
Podrías utilizar el paquete pglm (glm para datos de panel).

Para ello debes preparar previamente tus datos utilizando pdata.frame con
el id red. Luego en model del pglm indicas 'pooling' (además de la familia
binomial). Algo como:

pglm(y ~ x1+x2, data=tus_datos, family = binomial, model = "pooling")

?Ojalá sea de utilidad.

¡
?Salud!?
#
Estimado Sebastian Gadea

Leo que usted desea algo de glm, cluster, y nombre la palabra red. Se me viene a la cabeza el libro Statistical Analysis of Network Data with R, editorial springer, por ahí sus requerimientos no son nada que ver, pero si la palabra red hace referencia a redes, ese libro puede aportarle algo.

Javier Rubén Marcuzzi

De: Freddy Omar López Quintero
Enviado: miércoles, 22 de marzo de 2017 17:12
Para: Sebastian Gadea
CC: Lista R
Asunto: Re: [R-es] GLM con clusters

2017-03-22 13:48 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
Podrías utilizar el paquete pglm (glm para datos de panel).

Para ello debes preparar previamente tus datos utilizando pdata.frame con
el id red. Luego en model del pglm indicas 'pooling' (además de la familia
binomial). Algo como:

pglm(y ~ x1+x2, data=tus_datos, family = binomial, model = "pooling")

?Ojalá sea de utilidad.

¡
?Salud!?