Skip to content

[R-es] Una pregunta de estadística (marginalmente relacionada con R)

6 messages · Kjetil Halvorsen, Carlos J. Gil Bellosta, Olivier Nuñez

#
Muchas gracias por la contestación (y bienvenido a la lista).

Pensé en utilizar AIC pero me da algo de miedo cuando los modelos no
están anidados (la exponencial lo está, en cierto modo, en la
weibull), pero, en general...

¿Has probado a experimentar con tu código y a probar distintos valores
del número de datos y de distribuciones con los que los generas?

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El día 30 de abril de 2009 16:23, Pablo Emilio Verde
<PabloEmilio.Verde en uni-duesseldorf.de> escribió:
#
Hola, ¿qué tal?

Tengo que emitir una excusa parcial por haberle temido al AIC y por
hablerme temblado la mano al teclear "anidado". Ahora cuento por qué.

Estoy leyendo (y haciendo cosas relacionadas con) el siguiente artículo:

http://mpra.ub.uni-muenchen.de/10423/1/MPRA_paper_10423.pdf

En él se buscan distribuciones que mejor ajustan un vector de datos
(pérdidas económicas por catástrofes). Entre las distribuciones
candidatas están la Weibull y la exponencial. En este ámbito, más que
"anidadas", prefiero decir que la una es una caso particular de la
otra.

¿Cómo se ajustan las distribuciones? Por máxima verosimilitud. ¿Cómo
se elige la "mejor"? Aplicando (versiones de) los tests de bondad de
ajuste habituales (Kolmogorov-Smirnov, Anderson-Darling, etc.). Y yo
me planteé lo siguiente: si la exponencial es un caso particular de la
Weibull, aplicando este procedimiento, "siempre" se va a preferir la
segunda. Alguien que había hecho las cuentas me lo corroboró (¡incluso
cuando los datos proceden de una exponencial!).

Fue por eso que escribí a la lista: ¿existe algún modo de penalizar
por complejidad? Mi primera referencia al AIC vino por analogía (dado
que la mayor parte de nosotros lo habrá utilizado al elegir modelos
más que para comparar el ajuste de dos distribuciones, dejando de lado
las discusiones sobre si, en el fondo, es o no lo mismo).

Por ejemplo, ahora podríamos discutir, si a la luz de los comentarios
de Kjetil, el AIC es en sí una medida de bondad de ajuste (por su
relación con la distancia de KL, etc.). No he visto que nadie lo use
como tal en este campo que me ocupa. Pero igual es válido: el que
nadie haga algo no significa que no sea factible.

Y, bueno, agradezco a todos los que han participado en este hilo el
interés por mi cuestión.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com