Saludos estimado foro, por comentarles que estoy haciendo un proceso de webscrapping con Rselenium por medio de contenedores docker y al automatizar la cargar paginas html con el paquete XML por medio de la función read_html me sale el siguiente mensaje de error: Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html, : Excessive depth in document: 256 use XML_PARSE_HUGE option [1] Si alguien me puede guiar como solventarlo les agradecerÃa del fondo de mi alma ya que voy algunos dÃas tratando de resolverlo pero no lo logro. De Antemano agradezco su atención Atte Diego Maldonado Chiefanalytics officer Mentalytica
[R-es] ERROR EN LECTURA DE PAGINAS HTML GIGANTES
2 messages · Diego Maldonado, Javier Marcuzzi
Estimado Diego Maldonado Por ahà leà que hay un error pendiente, pero está fechado en el año 2019, hace muuccchhooo. Puede ser que una actualización tenga solucionado el problema? Yo en lo personal opte por casi el mismo camino, excepto que no uso R y no uso contenedores. C# me resulta una opción más adecuada para extraer los datos, luego analizo con R. Javier Rubén Marcuzzi El vie., 10 ene. 2020 a las 1:01, Diego Maldonado via R-help-es (< r-help-es en r-project.org>) escribió:
Saludos estimado foro, por comentarles que estoy haciendo un proceso de webscrapping con Rselenium por medio de contenedores docker y al automatizar la cargar paginas html con el paquete XML por medio de la función read_html me sale el siguiente mensaje de error: Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html, : Excessive depth in document: 256 use XML_PARSE_HUGE option [1] Si alguien me puede guiar como solventarlo les agradecerÃa del fondo de mi alma ya que voy algunos dÃas tratando de resolverlo pero no lo logro. De Antemano agradezco su atención Atte Diego Maldonado Chiefanalytics officer Mentalytica
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es