[R-es] Media de elementos tomados uno a uno de un data.frame

Sun, Nov 27, 2011 7:16 AM

Hola:

Antes de nada, gracias por vuestras respuestas.

El 27/11/11 12:17, oscar.perpinan en upm.es escribiÃ³:

Aclaro que mis datos estaban en un data.frame (como pone en el asunto 
del hilo) pero al preparar el ejemplo me fui a una matriz, vaya usted a 
saber porque.

Aprovecho para preguntar, Â¿porque es mejor utilizar un data.frame en vez 
de una matriz? (En mi ignorancia, y hasta el momento en mi corta 
trayectoria por R, no he advertido demasiadas diferencias entre los dos 
tipos de objetos)

Vale, entiendo que el objetivo de la funciÃ³n es Â«cambiarÂ» el nÃºmero de 
los meses por la estaciÃ³n a la que pertenecen. Lo que me pierde es la 
definiciÃ³n de Â«nÂ», Â¿restamos 1 para dividir por tres y sumar 1? No lo 
pillo, lo siento.

Con el ejemplo preparado esto funciona de escandalo, con los datos 
reales Â«medio funcionaÂ». Varias cosas:

- Con cbind agrupamos las columnas, en los datos reales tengo:

  > dim(Aero.vientos)
[1] 180  16

diecisÃ©is columnas, que no son demasiadas, pero si hubiera muchas mÃ¡s, 
Â¿como podrÃa Â«pasarlasÂ» a cbind de una tacada?

(Bueno, poco a poco, acabo de pensar -cosa muy importante, pensar- y 
probar con as.matrix(Aero.vientos[,3:14]) y funciona aunque las columnas 
del resultado vienen seÃ±aladas con NA).

- Segundo problema: ejecutando

aggregate(
   cbind(as.matrix(Aero.vientos[,3:14])) ~
     est(Aero.vientos[["Meses"]]) + Aero.vientos[["DirecciÃ³n"]],
   FUN = mean,
   data = Aero.vientos[,1:14]
)

El resultado no es el esperado.

   est(Aero.vientos[["Meses"]]) Aero.vientos[["DirecciÃ³n"]]
1                          inv                       Total
2                          oto                       Total
3                          pri                       Total
4                          ver                       Total
   as.matrix(Aero.vientos[, 3:14])       NA       NA       NA       NA 
       NA
1                        11,53333 32,39833 33,41667 12,76000 7,166667 
1,8000000
2                        10,93333 34,11167 36,10000 12,15667 5,545000 
0,9866667
3                        13,20000 30,63050 30,52367 12,46711 9,733556 
2,8521667
4                        15,96667 33,95333 32,14667 10,29500 6,385000 
1,0766667

[...]

Solo agrupa por la direcciÃ³n "Total" -que, precisamente, es una que 
quiero eliminar-, cuando hay unas cuantas mÃ¡s:

dimnames(Aero.vientos)[[2]]
  [1] "Meses"      "DirecciÃ³n"  "Calma"      "X01...06"   "X06...11"
  [6] "X11...16"   "X16...21"   "X21...26"   "X26...31"   "X31...36"
[11] "X36...41"   "X41...46"   "X46...50"   "X..50"      "Total"
[16] "NÂº.de.obs."

Hasta el momento no consigo encontrar soluciÃ³n. Consultando la ayuda de 
aggregate he probado varias cosas, como:

aggregate(
   cbind(Aero.vientos[,3],Aero.vientos[,4]) #~
     #est(Aero.vientos[["Meses"]]),
   ,list(Dir=Aero.vientos[["DirecciÃ³n"]]),
   FUN = mean, data = Aero.vientos[,1:14]
)

(Si se incorpora la funciÃ³n est(), aggregate falla)

que realiza el agrupamiento por direcciones tal y como quiero pero 
obvia, logicamente a la vista del cÃ³digo, la agrupaciÃ³n por estaciones.

Â¡Â¡ Opss !! Bien, como voy pensando y probando mientras escribo, he 
atinado por prueba y error:

aggregate(
   cbind(as.matrix(Aero.vientos[,3:14])),
   list(Dir=Aero.vientos[["DirecciÃ³n"]],
     Est=est(Aero.vientos[["Meses"]])),
   FUN = mean, data = Aero.vientos[,1:14]
)

AdemÃ¡s, respeta el nombre de las columnas.

Â¿Alguien harÃa el favor de explicarme porque falla el primero y 
Â«aciertaÂ» el Ãºltimo?

Pues el mismo cÃ³digo anterior falla miserablemente para estas dos 
funciones. :^(

 > aggregate(
+   cbind(as.matrix(Aero.vientos[,3:14])),
+   list(Dir=Aero.vientos[["DirecciÃ³n"]],
+     Est=est(Aero.vientos[["Meses"]])),
+   FUN = sd, data = Aero.vientos[,1:14]
+ )
Error en FUN(X[[1L]], ...) :
   el argumento(s) no fue utilizado(s) (data = list(Meses = c(1, 1, 1, 
1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 
3, 3, 3,
3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 
4, 4, 4,
5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 6, 
6, 6, 6,
6, 6, 6, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 
8, 8, 8,
8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 10, 10, 
10, 10,
10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11,
Calls: aggregate ... aggregate.data.frame -> lapply -> FUN -> lapply -> FUN

Pues he repasado toda la ayuda y, la verdad, no he visto nada.

Enviar el correo anterior desde el mÃ³vil es, cuando menos, una proeza; 
no hay nada que disculpar, al revÃ©s, es de ensalzar.

Muchas gracias de nuevo a todos, a ver si alguien me puede dar una pista 
para lo que me queda. (Y perdÃ³n por el ladrillo que ha quedado)

Salud y RevoluciÃ³n.

Lobo.

Pd: Por cierto Oscar (permÃteme tutearte), terminando con esto me lÃo 
con datos de insolaciÃ³n, asÃ que creo que me pelearÃ© con tu paquete 
SolaR que tiene una pinta estupenda; si no pregunto es buena seÃ±al. ^_^

Libertad es poder elegir en cualquier momento. Ahora yo elijo GNU/Linux,
para no atar mis manos con las cadenas del soft propietario.
---------
Desde El Ejido, en AlmerÃa, usuario registrado Linux #294013
http://www.counter.li.org

[R-es] Media de elementos tomados uno a uno de un data.frame

Thread (9 messages)