Estimado Rubén Tobalina Ramirez
Puede ser un problema el tener como regla el buscar un parámetro, porque
de pronto una palabra contiene justo esa secuencia de letras, por lo cuál
yo buscarÃa las letras en forma que no queden dudas, me tomarÃa el trabajo
de hacer o buscar un diccionario emojis a eliminar o traducir.
*De: *Ruben Tobalina Ramirez <lagrimaescrita en gmail.com>
*Enviado: *viernes, 9 de septiembre de 2016 4:16
*Para: *r-help-es <r-help-es en r-project.org>
*Asunto: *[R-es] Borrar carácteres extraños /xax
Buenos dÃas,
estoy realizando análisis de texto con Twitter y tengo un problema con unos
carácteres que no logro quitar. Són cadenas de letras con forma similar a
*xaexdfxdeaxoa*. Creo que surgen de la códificación de los emojis.
Yo suelo utilizar, más o menos el siguiente codigo con gsub para limpiar
texto, pero no me sirve
# remove rt
x = gsub("rt", "", x)
# remove at
x = gsub("@\\w+", "", x)
# remove punctuation
x = gsub("[[:punct:]]", "", x)
# remove numbers
x = gsub("[[:digit:]]", "", x)
# remove links http
x = gsub("http\\w+", "", x)
# remove tabs
x = gsub("[ |\t]{2,}", "", x)
# remove blank spaces at the beginning
x = gsub("^ ", "", x)
# remove blank spaces at the end
x = gsub(" $", "", x)
¿Alguna forma de eliminarlos?
Muchas gracias!!!
--
Rubén.
[[alternative HTML version deleted]]