[R-es] Una pregunta de estadística (marginalmente relacionada con R) - R-help-es

Thu, Apr 30, 2009 8:25 AM #

Muchas gracias por la contestaciÃ³n (y bienvenido a la lista).

PensÃ© en utilizar AIC pero me da algo de miedo cuando los modelos no
estÃ¡n anidados (la exponencial lo estÃ¡, en cierto modo, en la
weibull), pero, en general...

Â¿Has probado a experimentar con tu cÃ³digo y a probar distintos valores
del nÃºmero de datos y de distribuciones con los que los generas?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El dÃa 30 de abril de 2009 16:23, Pablo Emilio Verde
<PabloEmilio.Verde en uni-duesseldorf.de> escribiÃ³:

Kjetil Halvorsen

Thu, Apr 30, 2009 9:23 AM #

An embedded and charset-unspecified text was scrubbed...
Name: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20090430/bf98eb82/attachment.pl>

Olivier Nuñez

Thu, Apr 30, 2009 9:53 AM #

An embedded and charset-unspecified text was scrubbed...
Name: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20090430/d083d0af/attachment.pl>

Kjetil Halvorsen

Thu, Apr 30, 2009 11:47 AM #

An embedded and charset-unspecified text was scrubbed...
Name: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20090430/e7cc3950/attachment.pl>

Carlos J. Gil Bellosta

Thu, Apr 30, 2009 12:39 PM #

Hola, Â¿quÃ© tal?

Tengo que emitir una excusa parcial por haberle temido al AIC y por
hablerme temblado la mano al teclear "anidado". Ahora cuento por quÃ©.

Estoy leyendo (y haciendo cosas relacionadas con) el siguiente artÃculo:

http://mpra.ub.uni-muenchen.de/10423/1/MPRA_paper_10423.pdf

En Ã©l se buscan distribuciones que mejor ajustan un vector de datos
(pÃ©rdidas econÃ³micas por catÃ¡strofes). Entre las distribuciones
candidatas estÃ¡n la Weibull y la exponencial. En este Ã¡mbito, mÃ¡s que
"anidadas", prefiero decir que la una es una caso particular de la
otra.

Â¿CÃ³mo se ajustan las distribuciones? Por mÃ¡xima verosimilitud. Â¿CÃ³mo
se elige la "mejor"? Aplicando (versiones de) los tests de bondad de
ajuste habituales (Kolmogorov-Smirnov, Anderson-Darling, etc.). Y yo
me planteÃ© lo siguiente: si la exponencial es un caso particular de la
Weibull, aplicando este procedimiento, "siempre" se va a preferir la
segunda. Alguien que habÃa hecho las cuentas me lo corroborÃ³ (Â¡incluso
cuando los datos proceden de una exponencial!).

Fue por eso que escribÃ a la lista: Â¿existe algÃºn modo de penalizar
por complejidad? Mi primera referencia al AIC vino por analogÃa (dado
que la mayor parte de nosotros lo habrÃ¡ utilizado al elegir modelos
mÃ¡s que para comparar el ajuste de dos distribuciones, dejando de lado
las discusiones sobre si, en el fondo, es o no lo mismo).

Por ejemplo, ahora podrÃamos discutir, si a la luz de los comentarios
de Kjetil, el AIC es en sÃ una medida de bondad de ajuste (por su
relaciÃ³n con la distancia de KL, etc.). No he visto que nadie lo use
como tal en este campo que me ocupa. Pero igual es vÃ¡lido: el que
nadie haga algo no significa que no sea factible.

Y, bueno, agradezco a todos los que han participado en este hilo el
interÃ©s por mi cuestiÃ³n.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

Olivier Nuñez

Thu, Apr 30, 2009 1:17 PM #

An embedded and charset-unspecified text was scrubbed...
Name: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20090430/00182de0/attachment.pl>