Message-ID: <e4ed5f81-f1ea-f6e5-f4b1-91e94a58ef4a@urjc.es>
Date: 2022-06-03T08:24:05Z
From: Marcelino de la Cruz Rot
Subject: [R-es] A vueltas con el encoding
In-Reply-To: <001801d8771d$0d50b6a0$27f223e0$@jccm.es>
Hola Isidro:
Yo creo que puedes solucionarlo con algo asÃ:
readLines(con <- file("fichero.txt", encoding = ""), encoding="latin1")
Es decir, especificando el encoding como "" en la connection e indicando
el encoding del fichero en readLines.
Lo cuentan en la sección "Encoding" de ?connections.
Un saludo,
Marcelino
El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:
> La ?ltima versi?n de R (4.2.0. patched), a la que estoy cogiendo una man?a
> nada despreciable, no me carga correctamente ficheros de texto latinos (con
> ?? y otros caracteres) aunque especifique el encoding ISO-8859-1.
>
> Obtengo el mismo resultado con ?readLines(fichero)? que con
> ?readLines(fichero, encoding = ?ISO-8859-1?)?.
>
> Por ejemplo, estas l?neas me las carga as?:
>
>
>
> [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] " MES: MAYO A\xd1O:
> 2022"
>
>
>
> ? cuando el contenido del fichero es ?ste:
>
>
>
> [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES.
> ACTIVOS)"
>
> [2] " MES: MAYO A?O:
> 2022"
>
>
>
> En las notas oficiales de la nueva versi?n se hace referencia a que se ha
> cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece
> perfecto, pero si especificas un juego de caracteres espec?fico, R deber?a
> ser obediente, ?no?
>
>
>
> No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona
> perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding?
>
>
>
> A ver si pod?is ayudarme, please. Gracias
>
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Marcelino de la Cruz Rot
Depto. de BiologÃa y GeologÃa
FÃsica y QuÃmica Inorgánica
Universidad Rey Juan Carlos
Móstoles España