Buenas tardes, desde Uruguay, quiero realizar una regresión logÃstica,con la función GLM, pero ademas quiero designarle a las observaciones clusters. La idea es decirle al programa que las observaciones corresponden a diferentes clusters. Saludos! Sebastián.
[R-es] GLM con clusters
7 messages · Freddy Omar López Quintero, Xavier-Andoni Tibau Alberdi, Sebastian Gadea +2 more
?Hola.? 2017-03-22 12:33 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
quiero realizar una regresión logÃstica,con la función GLM, pero ademas quiero designarle a las observaciones clusters.
?Si no entiendo mal, quieres estimar un modelo marginal; entonces la opción inmediata (para mÃ) está en el paquete gee. Su función del mismo nombre tiene un ejemplo para datos binarios. Si el modelo que quieres no es marginal sino un modelo mixto más general, podrÃas utilizar (entre muchÃsimas opciones) el paquete lme4, especÃficamente la función glmer. Cabe sin embargo la posibilidad que haya entendido todo mal y debas darnos un poco más de información para intentar ayudarte mejor. ¡Salud!
«PÃdeles sus tÃtulos a los que te persiguen, pregúntales cuándo nacieron, diles que te demuestren su existencia.» Rafael Cadenas [[alternative HTML version deleted]]
Buenas, No estoy muy seguro de porqué quieres hacer esto. Si no te entiendo mal, quieres hacer una regresión logÃstica, y con los resultados un análisis de clústers. Quizá lo mejor seria usar ambos métodos de predicción y comparar los resultados. Aún asÃ, si te he entendido bien, entonces la manera de hacerlo serÃa: primero la regresión y luego recuperas las predicciones. Por ejemplo: mylogit <- glm(variable ~ ., data = df, family = "binomial") #Regresion logistica summary(mylogit) #Ves que tal ha quedado. Puedes recuperar las prediciones con 'mylogit$fitted.values' y las puedes poner en el dataframe original df$fitted <- mylogit$fitted.values Luego, puedes realizar un análisis de clusters usando las predicciones. Como se trata de una regresión logÃstica, tendira sentido que antes del analisis redondees los resultados hacia 1 o hacia 0. Espero que esto te sirva. Un saludo, Xavier Tibau 2017-03-22 16:33 GMT+01:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
Buenas tardes,
desde Uruguay, quiero realizar una regresión logÃstica,con la función GLM,
pero ademas quiero designarle a las observaciones clusters.
La idea es decirle al programa que las observaciones corresponden a
diferentes clusters.
Saludos!
Sebastián.
[[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Gracias a todos por sus respuestas, perdón si no fui muy claro. Lo que intento replicar es un análisis realizado en Stata, tengo que hacer los mismos cálculos pero en el r. En Stata lo que se hizo fue: xi: logistic i.coord i.v11_sexo, vce (cluster red) *Vce (cluster clustvar) especifica que los errores estándar permiten la correlación intragrupo, relajando el requisito habitual de que las observaciones sean independientes. Es decir, las observaciones son independientes entre grupos (grupos) pero no necesariamente dentro de los grupos. * http://www.stata.com/manuals13/rvce_option.pdf O sea, quitan el supuesto de independencia entre observaciones de un mismo grupo, en este lo indica la variable red. Pero ésto no afecta la estimación de los coeficientes, si los intervalos de confianza. El 22 de marzo de 2017, 13:38, Xavi tibau alberdi <xavitibau en gmail.com> escribió:
Buenas, No estoy muy seguro de porqué quieres hacer esto. Si no te entiendo mal, quieres hacer una regresión logÃstica, y con los resultados un análisis de clústers. Quizá lo mejor seria usar ambos métodos de predicción y comparar los resultados. Aún asÃ, si te he entendido bien, entonces la manera de hacerlo serÃa: primero la regresión y luego recuperas las predicciones. Por ejemplo: mylogit <- glm(variable ~ ., data = df, family = "binomial") #Regresion logistica summary(mylogit) #Ves que tal ha quedado. Puedes recuperar las prediciones con 'mylogit$fitted.values' y las puedes poner en el dataframe original df$fitted <- mylogit$fitted.values Luego, puedes realizar un análisis de clusters usando las predicciones. Como se trata de una regresión logÃstica, tendira sentido que antes del analisis redondees los resultados hacia 1 o hacia 0. Espero que esto te sirva. Un saludo, Xavier Tibau 2017-03-22 16:33 GMT+01:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
Buenas tardes,
desde Uruguay, quiero realizar una regresión logÃstica,con la función GLM,
pero ademas quiero designarle a las observaciones clusters.
La idea es decirle al programa que las observaciones corresponden a
diferentes clusters.
Saludos!
Sebastián.
[[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Saludos! Sebastián. [[alternative HTML version deleted]]
Hola, ¿qué tal? Tienes una discusión sobre esos asuntos aquà <http://rpsychologist.com/r-guide-longitudinal-lme-lmer>. Puedes usar los paquetes lmer o nlme (me decantarÃa por el primero). Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El 22 de marzo de 2017, 17:48, Sebastian Gadea <sebastiangadea.uy en gmail.com> escribió:
Gracias a todos por sus respuestas, perdón si no fui muy claro. Lo que intento replicar es un análisis realizado en Stata, tengo que hacer los mismos cálculos pero en el r. En Stata lo que se hizo fue: xi: logistic i.coord i.v11_sexo, vce (cluster red) *Vce (cluster clustvar) especifica que los errores estándar permiten la correlación intragrupo, relajando el requisito habitual de que las observaciones sean independientes. Es decir, las observaciones son independientes entre grupos (grupos) pero no necesariamente dentro de los grupos. * http://www.stata.com/manuals13/rvce_option.pdf O sea, quitan el supuesto de independencia entre observaciones de un mismo grupo, en este lo indica la variable red. Pero ésto no afecta la estimación de los coeficientes, si los intervalos de confianza. El 22 de marzo de 2017, 13:38, Xavi tibau alberdi <xavitibau en gmail.com> escribió:
Buenas, No estoy muy seguro de porqué quieres hacer esto. Si no te entiendo mal, quieres hacer una regresión logÃstica, y con los resultados un análisis
de
clústers. Quizá lo mejor seria usar ambos métodos de predicción y
comparar
los resultados. Aún asÃ, si te he entendido bien, entonces la manera de hacerlo serÃa: primero la regresión y luego recuperas las predicciones.
Por
ejemplo: mylogit <- glm(variable ~ ., data = df, family = "binomial") #Regresion logistica summary(mylogit) #Ves que tal ha quedado. Puedes recuperar las prediciones con 'mylogit$fitted.values' y las puedes poner en el dataframe original df$fitted <- mylogit$fitted.values Luego, puedes realizar un análisis de clusters usando las predicciones. Como se trata de una regresión logÃstica, tendira sentido que antes del analisis redondees los resultados hacia 1 o hacia 0. Espero que esto te sirva. Un saludo, Xavier Tibau 2017-03-22 16:33 GMT+01:00 Sebastian Gadea <sebastiangadea.uy en gmail.com :
Buenas tardes, desde Uruguay, quiero realizar una regresión logÃstica,con la función
GLM,
pero ademas quiero designarle a las observaciones clusters.
La idea es decirle al programa que las observaciones corresponden a
diferentes clusters.
Saludos!
Sebastián.
[[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Saludos!
Sebastián.
[[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
2017-03-22 13:48 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
O sea, quitan el supuesto de independencia entre observaciones de un mismo grupo, en este lo indica la variable red. Pero ésto no afecta la estimación de los coeficientes, si los intervalos de confianza.
PodrÃas utilizar el paquete pglm (glm para datos de panel). Para ello debes preparar previamente tus datos utilizando pdata.frame con el id red. Luego en model del pglm indicas 'pooling' (además de la familia binomial). Algo como: pglm(y ~ x1+x2, data=tus_datos, family = binomial, model = "pooling") ?Ojalá sea de utilidad. ¡ ?Salud!?
«PÃdeles sus tÃtulos a los que te persiguen, pregúntales cuándo nacieron, diles que te demuestren su existencia.» Rafael Cadenas [[alternative HTML version deleted]]
Estimado Sebastian Gadea Leo que usted desea algo de glm, cluster, y nombre la palabra red. Se me viene a la cabeza el libro Statistical Analysis of Network Data with R, editorial springer, por ahà sus requerimientos no son nada que ver, pero si la palabra red hace referencia a redes, ese libro puede aportarle algo. Javier Rubén Marcuzzi De: Freddy Omar López Quintero Enviado: miércoles, 22 de marzo de 2017 17:12 Para: Sebastian Gadea CC: Lista R Asunto: Re: [R-es] GLM con clusters 2017-03-22 13:48 GMT-03:00 Sebastian Gadea <sebastiangadea.uy en gmail.com>:
O sea, quitan el supuesto de independencia entre observaciones de un mismo grupo, en este lo indica la variable red. Pero ésto no afecta la estimación de los coeficientes, si los intervalos de confianza.
PodrÃas utilizar el paquete pglm (glm para datos de panel). Para ello debes preparar previamente tus datos utilizando pdata.frame con el id red. Luego en model del pglm indicas 'pooling' (además de la familia binomial). Algo como: pglm(y ~ x1+x2, data=tus_datos, family = binomial, model = "pooling") ?Ojalá sea de utilidad. ¡ ?Salud!?
«PÃdeles sus tÃtulos a los que te persiguen, pregúntales cuándo nacieron, diles que te demuestren su existencia.» Rafael Cadenas [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]