[R-es] Cantidad de datos

Hola!

2009/8/7 Manuel Bonilla <napso00 en gmail.com>:
Gracias por la ayuda

Intento con un computador de 3GB Hyper X de ram Procesador core i7 y
maiboard extreme con video PCIex 1Gb...pero cuando hago el proceso R me dice
esto:
Read: 52 232 796 items (pero tengo solamente 30 000 000 datos no se porque
me dice este numero)
Seguramente incluye overhead durante la lectura, que puede ser grande.
Si usas read.table,
puedes tratar de leer los datos directamente con scan(), que usa menos
memoria. Si usas windows, la utilizaciÃ³n de la memoria no es Ã³ptimo,
en este caso puede ayudar cambiar a linux!
Error: no se puede ubicar un vector de tamaÃ±o 398.5Mb
Mi archivo es un archivo .txt de 281 569 Kb.
Tal ves no uso la buena funcion, para informaciÃ³n uso la funciÃ³n "read".
Otras ideas: lee
CRAN Task View: High Performance and Parallel Computing, y
partucularmente los paquetes (CRAN)  biglm que puede estimar modelos
lm() y glm() con datos no en memoria, leyendo los datos por partes., y
bigmemory que tambiÃ©n parece interesante.

Otra idea: Con preguntas similares en R-help, Brian Ripley multiples
veces ha comentado
que con conjuntos de datos de este tamaÃ±o no se puede esperar
homogeneidad. Seguramente
existe multiples subgrupos dentro de los datos, que se puede analizar
por separado, y despues
juntar los analisis, talvez como un "meta-analisis". para este puede
ayudar representar los datos
usando una base de datos, R tiene mÃºltiples paquetes que hace interfaz
a varios bases de datos.

kjetil
Manuel Bonilla

Kjetil Halvorsen escribiÃ³:

BiÃ©n, yo creo que tienes que dar un poco mÃ¡s de informaciÃ³n, por
ejemplo cuanto RAM
tiene tu maquina, sistema operativo, que mÃ©todos estadÃsticos quieres usar,
etc.

Si 30 000 000 de dator significa 30 000 000 numeros reales, esto significa
(cada uno usa 8 byte de memoria) 8* 30 000 000 =240 000 000 bytes o
240 MB. Como R trabaja con todo en RAM,
necesitas por lo menos algo como 1 Giga B de RAM. Si 30 000 000 refiere a
numero
de individuos (personas "units") en los datos, mucho mÃ¡s. Tienes que
dar mejor info!

Kjetil

2009/8/7 Manuel Bonilla <napso00 en gmail.com>:

Buenas, tengo 30 000 000 de datos, y el R no me deja trabajar, como podria
corregir eso problema para trabajar con los 30 000 000, mintras es estoy
trabajando cada 1 000 000 pero no es igual.
Espero puedan ayudarme

saludos

--
Manuel Bonilla

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

"... an entire human genome would fit on a music CD."

--- www.thinkgene.com
An embedded and charset-unspecified text was scrubbed...
Name: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20090807/66023adb/attachment.pl>