Skip to content

[R-es] fusionar archivos

5 messages · Belén Cillero Jiménez, Carlos J. Gil Bellosta, José Luis Cañadas +2 more

#
Recién llegada al mundo R necesito mucha, mucha ayuda y mis dudas os resultarán tontas pero no tengo mucho más donde apoyarme, de momento.
Me gustaría saber

- si se puede leer de un fichero de texto (en este caso csv separado por comas) un número concreto de columnas, no todas, y cómo hacerlo

- una vez leídos todos los csv, necesito fusionarlos en uno pero no de cualquier manera, ya que tengo una variable que me identifica al mismo individuo en cada uno de los ficheros. Creo que así no me explico bien, tengo dos tablas en acces, Esudb11d y H_mod relacionadas por las variables DB030 (de la primera) y HB030 (de la segunda) y creo una única tabla así:
SELECT Esudb11d.DB010, Esudb11d.DB030, Esudb11d.DB040, Esudb11d.DB090, Esudb11d.DB100, H_mod.HY020AI, H_mod.HY020, H_mod.HY022, H_mod.HY023, H_mod.HS011, H_mod.HS021, H_mod.HS031, H_mod.HS040, H_mod.HS050, H_mod.HS060, H_mod.HS070, H_mod.HS080, H_mod.HS090, H_mod.HS100, H_mod.HS110, H_mod.HS120, H_mod.HS130, H_mod.HS140, H_mod.HS150, H_mod.HS160, H_mod.HS170, H_mod.HS180, H_mod.HS190, H_mod.HH010, H_mod.HH021, H_mod.HH030, H_mod.HH031, H_mod.HH040, H_mod.HH050, H_mod.HH081, H_mod.HH091, H_mod.HX040, H_mod.HX060, H_mod.HX140, H_mod.HX240, H_mod.RentaE, H_mod.RentaE_AI, *
FROM Esudb11d INNER JOIN H_mod ON Esudb11d.DB030 = H_mod.HB030;
¿cómo puedo hacer esto en R?

Muchas gracias
BB




[cid:PGDLUGBUXTFP.IMAGE_55.jpg]
________________________________

GOBIERNO DE LA RIOJA
AVISO LEGAL: La información contenida en este mensaje es confidencial y está destinada a ser leída sólo por la persona a la que va dirigida. Si Ud. no es el destinatario señalado le informamos que está prohibida, y puede ser ilegal, cualquier divulgación o reproducción de este mensaje.
Antes de imprimir este e-mail piense bien si es necesario hacerlo.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/649c718e/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/jpg
Size: 15662 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/649c718e/attachment-0001.jpg>
#
Hola, ¿qué tal?

Bienvenida al mundo de R.


El 9 de mayo de 2013 15:32, Belén Cillero Jiménez
<belen.cillero en larioja.org> escribió:
Léelas todas. Filtra luego. Usa las función subset o los corchetes.
Tienes que usar la función merge. Mira su ayuda. Tiene varios ejemplos.

Si el campo de cruce se llama igual en las dos tablas y no hay otras
columnas con nombres comunes, es muy sencillo:

tabla.final <- merge(tabla.1, tabla.2)

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com
#
Hola Belén. Bienvenida.

Si se puede. Échale un vistazo a las funciones
read.table, read.csv, read.csv2, read.delim para leer los ficheros 
separados por comas u otros separadores.

Y para fusionar archivos, mira la función merge

Para acceder a la ayuda de las funciones utiliza help(), como 
help(merge) o también ?merge.


Saludos..

El 09/05/13 15:32, Belén Cillero Jiménez escribió:
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/e747189a/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/jpeg
Size: 15662 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/e747189a/attachment-0001.jpe>
#
Estimada Belén Jiménez

Si se puede, pero ¿tienes acceso a la base de datos? aunque sea acces, porque es más sencillo seleccionar los datos en este, y luego exportarlos al csv.
También se puede importar los csv a data.frame y seleccionar lo necesario.
Combinar, utilizando merge, sqldf, ...
Hace poco en la lista se hablo de importar solo algunas columnas.

El problema es ¿cuántos miles de datos? por los requerimientos informáticos y ¿que le resulta más fácil o cómodo?

Javier Marcuzzi

From: Belén Cillero Jiménez 
Sent: Thursday, May 09, 2013 10:32 AM
To: r-help-es en r-project.org 
Subject: [R-es] fusionar archivos

Recién llegada al mundo R necesito mucha, mucha ayuda y mis dudas os resultarán tontas pero no tengo mucho más donde apoyarme, de momento.
Me gustaría saber

- si se puede leer de un fichero de texto (en este caso csv separado por comas) un número concreto de columnas, no todas, y cómo hacerlo

- una vez leídos todos los csv, necesito fusionarlos en uno pero no de cualquier manera, ya que tengo una variable que me identifica al mismo individuo en cada uno de los ficheros. Creo que así no me explico bien, tengo dos tablas en acces, Esudb11d y H_mod relacionadas por las variables DB030 (de la primera) y HB030 (de la segunda) y creo una única tabla así:
SELECT Esudb11d.DB010, Esudb11d.DB030, Esudb11d.DB040, Esudb11d.DB090, Esudb11d.DB100, H_mod.HY020AI, H_mod.HY020, H_mod.HY022, H_mod.HY023, H_mod.HS011, H_mod.HS021, H_mod.HS031, H_mod.HS040, H_mod.HS050, H_mod.HS060, H_mod.HS070, H_mod.HS080, H_mod.HS090, H_mod.HS100, H_mod.HS110, H_mod.HS120, H_mod.HS130, H_mod.HS140, H_mod.HS150, H_mod.HS160, H_mod.HS170, H_mod.HS180, H_mod.HS190, H_mod.HH010, H_mod.HH021, H_mod.HH030, H_mod.HH031, H_mod.HH040, H_mod.HH050, H_mod.HH081, H_mod.HH091, H_mod.HX040, H_mod.HX060, H_mod.HX140, H_mod.HX240, H_mod.RentaE, H_mod.RentaE_AI, *
FROM Esudb11d INNER JOIN H_mod ON Esudb11d.DB030 = H_mod.HB030;

¿cómo puedo hacer esto en R?

Muchas gracias
BB




 

--------------------------------------------------------------------------------

GOBIERNO DE LA RIOJA
AVISO LEGAL: La información contenida en este mensaje es confidencial y está destinada a ser leída sólo por la persona a la que va dirigida. Si Ud. no es el destinatario señalado le informamos que está prohibida, y puede ser ilegal, cualquier divulgación o reproducción de este mensaje.
Antes de imprimir este e-mail piense bien si es necesario hacerlo.



--------------------------------------------------------------------------------
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/58305df7/attachment-0001.html>
------------ próxima parte ------------
A non-text attachment was scrubbed...
Name: no disponible
Type: image/jpg
Size: 15662 bytes
Desc: no disponible
URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130509/58305df7/attachment-0001.jpg>