Skip to content
Prev 373 / 15380 Next

[R-es] PRUEBAS DE NORMALIDAD

John,

Estoy de acuerdo con Kjetil, un "qqplot es mucho mas efectivo
para mirar normalidad, que el test de "kolmogorov-smirnov".

En realidad estos tests estadisticos estan obsoletos. Es mas, la
idea es que con el R podes analizar y entender mucho mejor tus datos!

Te mando un script que tengo sobre el tema y lo aplico a tus datos.
La idea es simular datos, e.g. en tu caso normales con la media
y el desvio iguales a los estimados, y luego comparar caracteristicas
importantes de tus datos con estas simulaciones.

En este script hago un qq-plot de normalidad con los datos y las
simulaciones. Y despues comparo 3 caracteristicas de los datos,
el maximo, el minimo  y la diferencia intercuartil.

Espero que te sirva.

#########################################################################
# qq-plot para normalidad

qqnorm(Puntaje)

# qq-plot para normalidad y
# comarar datos simulados con datos reales

set.seed(123)
m.p <- mean(Puntaje)
sd.p <- sd(Puntaje)
n.p <- length(Puntaje)

sim.data <- matrix(rnorm(n.p*500, mean = m.p, sd =sd.p), nrow=500, ncol=n.p)
qqnorm(Puntaje, ylim =c(min(sim.data), max(sim.data)), cex=3, col="red",
pch="*")

# primeros 50 simulaciones
for(i in 1: 50){
    points(qqnorm(sim.data[i,], plot=F),
     cex=0.5, col="blue")
               }
#########################################################################

# de otras caracteristicas de los datos
# comparar minimos, maximos y differencia entre cuartiles
# maximos y minimos
max.sim <- apply(sim.data, 1, max)
min.sim <- apply(sim.data, 1, min)

# diferencia entre el cuantile del 75% y 25%
dif <- function(x){
    a <- quantile(x)
    a[4]-a[2]
    }

dif.sim <- apply(sim.data, 1, dif)

par(mfrow=c(3,1))
  hist(max.sim, breaks = 20)
    abline(v = max(Puntaje), lwd=3, lty=2, col="red")
  hist(min.sim, breaks = 20)
    abline(v = min(Puntaje), lwd=3, lty=2, col="red")
  hist(dif.sim, breaks = 20)
    abline(v = dif(Puntaje), lwd=3, lty=2, col="red")
par(mfrow=c(1,1))

#########################################################################

Pablo













----- Original Message -----
From: "Kjetil Halvorsen" <kjetil1001 en gmail.com>
To: "Olivier Nuñez" <onunez en iberstat.es>
Cc: <r-help-es en r-project.org>; "John Miguel Jacho Vera"
<jjacho en mednet.com.ec>
Sent: Friday, November 06, 2009 3:16 PM
Subject: Re: [R-es] PRUEBAS DE NORMALIDAD


mire abajo.

2009/11/6 Olivier Nuñez <onunez en iberstat.es>:
la
la
Este criterio es extraño. ¿Que es el problema en usar Shapiro cuando
n>50 ? En R se puede usar Shapiro para n < 5000. Y si tienes más que 5000
observaciones no necesitas un test, sabes de antomano que el resultado será
"rechazar". Un qq-plot es más útil.

Kjetil
el
los
--
"... an entire human genome would fit on a music CD."

--- www.thinkgene.com

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es