TenÃa la versión data.table 1.9.6.- Actualicé a la data.table 1.10.0 y
funcionó tal cual lo indicás. Muchas gracias.
?Para eliminar las " adicionales estoy usando:
library(stringr)
library(plyr)
datos$d_nomenclador <- str_replace(datos$d_nomenclador, pattern='\\","',
replacement="")
datos$nomenclador_descripcion<- str_replace(datos$nomenclador_descripcion,
pattern='\\","', replacement="")
Pero elimina las del principio y sigo con problemas con las del final, como
si no las reconociera (deberÃa: en el Excel cuando corro el reemplazar "
por [nada] elimina todas.
Las dos variables son chr.
head(datos)
d_nomenclador baja_nomenclador nomenclador_descripcion
nomenclador_asociado
1: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
2: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
3: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
4: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
5: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
6: 67" NA NOMENCLADOR GCBA Res. 1893 Vig. 09-2016"
"20"
El 19 de enero de 2017, 4:25, Carlos Ortega <cof en qualityexcellence.es>
escribió:
¿Qué versión usas de data.table?.
Yo tengo la 1.10.0... creo que es la última...
Saludos,
Carlos Otega
www.qualityexcellence.es
El 19 de enero de 2017, 1:30, Mauricio Monsalvo <m.monsalvo en gmail.com>
escribió:
No le gustó:
Error in fread("datos.csv", sep = "|", header = TRUE, quote = "") :
unused argument (quote = "")
El 18 de enero de 2017, 20:35, Carlos Ortega <cof en qualityexcellence.es>
escribió:
Hola,
Prueba con esto:
fread("datos.csv", sep = "|", header = TRUE, quote="")
Con el parámetro quote, ignora las comillas del principio.
No elimina todas, pero te permite cargar el conjunto sin problemas.
Una vez cargado, ya puedes limpiar las columnas, quitando las comillas
adicionales, etc...
Saludos,
Carlos Ortega
www.qualityexcellence.es
El 19 de enero de 2017, 0:22, Mauricio Monsalvo <m.monsalvo en gmail.com>
escribió:
Hola.
Tengo un archivo que viene separado por "|" y a su vez con (casi) todos
los campos entre comillas ("..."), incluso los valores numéricos. Adjunto
algunos datos de prueba. El error que da es que no encuentra 14 elementos
en las filas (son 15 variables).
Probé algunas variantes y traté de orientarme por la ayuda y Stack (
http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no
encontré mejor solución que:
1) Abrir el archivo con Excel.
2) Reemplazar | por ;
3) Reemplazar " por [nada];
4) Abrirlo con:
datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote =
"", encoding = "UTF-8")
y digamos que funciona, salvo que la primera variable contiene un " al
inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO
CRITICO", NIÑO NEONATO", "etc).-
¿PodrÃan ayudarme a levantarlo de una (separado por | y con los datos
entre "") o bien a levantarlo luego del replace sin esas incómodas " al
inicio de la primera variable y al final de la última?
Muchas gracias.
Saludos!
--
Mauricio