Buenas Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion. Gracias Jesús
[R-es] Tibble o data.table?
9 messages · Carlos Ortega, Freddy López, Jesús Para Fernández +1 more
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernandez en hotmail.com> escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los
data.table, ya que para mi, quitando el uso de librerias como tidyr o
purrr, en el resto prefiero usar data.table. Me parece igual de potente y
mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse... Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Tibble o data.table?
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
El mié, 22-11-2017 a las 20:51 +0000, Jesús Para Fernández escribió:
Me parece que queda mas limpio, pero no se porque no le pillo la gracia
No estás solo en el mundo: si bien muchas cosas facilitan la vida utilizando elementos de tidyverse, en su conjunto, yo no lo compro, tampoco. Son como un dialecto en el idioma R. ¡Salud!
«...homines autem hominum causa esse generatos...» Cicero [[alternative HTML version deleted]]
Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front. El mié., 22 nov. 2017 21:51, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse... Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Tibble o data.table?
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es<
https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>
escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los
data.table, ya que para mi, quitando el uso de librerias como tidyr o
purrr, en el resto prefiero usar data.table. Me parece igual de potente y
mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<
https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
--
Saludos,
Carlos Ortega
www.qualityexcellence.es<
https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Que es postgres y presto?? Se uqe google tiene la respuesta,....
De: José Luis Cañadas <canadasreche en gmail.com>
Enviado: miércoles, 22 de noviembre de 2017 22:01
Para: Jesús Para Fernández
Cc: Carlos Ortega; r-help-es en r-project.org
Asunto: Re: [R-es] Tibble o data.table?
Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front.
El mié., 22 nov. 2017 21:51, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió:
Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse...
Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <cof en qualityexcellence.es<mailto:cof en qualityexcellence.es>>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org<mailto:r-help-es en r-project.org>
Asunto: Re: [R-es] Tibble o data.table?
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com><mailto:j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>> escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org><mailto:R-help-es en r-project.org<mailto:R-help-es en r-project.org>>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
Te pongo enlace de Presto. De postgress hay muchas referencias. https://aws.amazon.com/es/emr/details/presto/ Y para Presto existe Rpresto, que permite usar DBI sobre Presto. Básicamente, permite ver tablas hive en R y hacer sql muy rápidas sobre grandes volúmenes de datos, sin tener que levantar un spark. El mié., 22 nov. 2017 22:07, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió:
Que es postgres y presto?? Se uqe google tiene la respuesta,.... ------------------------------ *De:* José Luis Cañadas <canadasreche en gmail.com> *Enviado:* miércoles, 22 de noviembre de 2017 22:01 *Para:* Jesús Para Fernández *Cc:* Carlos Ortega; r-help-es en r-project.org *Asunto:* Re: [R-es] Tibble o data.table? Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front. El mié., 22 nov. 2017 21:51, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió: Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse... Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Tibble o data.table?
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es
<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
<
https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>
escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los
data.table, ya que para mi, quitando el uso de librerias como tidyr o
purrr, en el resto prefiero usar data.table. Me parece igual de potente y
mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es
<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
<
https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0
--
Saludos,
Carlos Ortega
www.qualityexcellence.es
<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
<
https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
Muchisimas gracias ?
De: José Luis Cañadas <canadasreche en gmail.com>
Enviado: miércoles, 22 de noviembre de 2017 22:23 Para: Jesús Para Fernández Cc: Carlos Ortega; r-help-es en r-project.org Asunto: Re: [R-es] Tibble o data.table? Te pongo enlace de Presto. De postgress hay muchas referencias. https://aws.amazon.com/es/emr/details/presto/<https://eur03.safelinks.protection.outlook.com/?url=https%3A%2F%2Faws.amazon.com%2Fes%2Femr%2Fdetails%2Fpresto%2F&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7Cf775a4ba7b784a806a4e08d531ef46a7%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469826098044239&sdata=z0y7Av3UAVw%2FJfqvzSwENNWQsIpIfnfeW2ju9%2BrC%2F%2Bo%3D&reserved=0> Y para Presto existe Rpresto, que permite usar DBI sobre Presto. Básicamente, permite ver tablas hive en R y hacer sql muy rápidas sobre grandes volúmenes de datos, sin tener que levantar un spark. El mié., 22 nov. 2017 22:07, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió: Que es postgres y presto?? Se uqe google tiene la respuesta,.... ________________________________ De: José Luis Cañadas <canadasreche en gmail.com<mailto:canadasreche en gmail.com>> Enviado: miércoles, 22 de noviembre de 2017 22:01 Para: Jesús Para Fernández Cc: Carlos Ortega; r-help-es en r-project.org<mailto:r-help-es en r-project.org> Asunto: Re: [R-es] Tibble o data.table? Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front. El mié., 22 nov. 2017 21:51, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió: Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse... Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras... ________________________________ De: Carlos Ortega <cof en qualityexcellence.es<mailto:cof en qualityexcellence.es>> Enviado: miércoles, 22 de noviembre de 2017 21:29 Para: Jesús Para Fernández Cc: r-help-es en r-project.org<mailto:r-help-es en r-project.org> Asunto: Re: [R-es] Tibble o data.table? Hola, Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te queda otra opción que usar los tibbles. La sintaxis de data.table es un tanto compleja frente a la sencillez que ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta diferencia en rendimiento. Por otro lado, son cada vez más los paquetes que se quieren hacer compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el mismo "sparklyr"). Gracias, Carlos Ortega www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0> El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com><mailto:j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>> escribió: Buenas Os queria preguntar que ventaja le veis a las tibbles frente a los data.table, ya que para mi, quitando el uso de librerias como tidyr o purrr, en el resto prefiero usar data.table. Me parece igual de potente y mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer vuestra opinion. Gracias Jesús [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org<mailto:R-help-es en r-project.org><mailto:R-help-es en r-project.org<mailto:R-help-es en r-project.org>> https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKSv89psbhpA489A%3D&reserved=0> -- Saludos, Carlos Ortega www.qualityexcellence.es<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0><https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0> [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org<mailto:R-help-es en r-project.org> https://stat.ethz.ch/mailman/listinfo/r-help-es<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
PostgresSQL (es una base de datos relacional opensource) Y Presto es un motor de base de datos distribuida que se entiende con Hive, Cassandra, etc.. Vaya, lo que querÃa aportar es otra idea. LeÃa hace poco en este blog: http://winvector.github.io/FluidData/DataWranglingAtScale.html *"R its is packages"* Que me parece una de las mejores definiciones a la tradicional de "entorno y lenguaje para análisis de datos"... data.table es en sà otro "lenguaje" dentro de "R", su creador ahora está en H2O que también lo han integrado en la lectura de ficheros. No veo mucho problema en que RStudio apoye todo el "tidyverse", casi al contrario es una forma de garantizar consistencia entre toda su sintaxis con la que puedes hacer gran parte de las actividades que requiere un proceso de análisis. Y esto que con "dplyr" puedas conectarte a casi cualquier fuente de datos (ahora tiene conectores empresariales para las bases de datos BigData: Hive, Impala, ...) es una gran ventaja. O todo lo que están haciendo con "sparklyr", o más recientemente con "keras" y "tensorflow". Y con el fichaje de Max Kuhn, y su paquete "recipes", "caret" también formará parte del ecosistema "tidy". Saludos, Carlos Ortega www.qualityexcellence.es El 22 de noviembre de 2017, 22:07, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió:
Que es postgres y presto?? Se uqe google tiene la respuesta,.... ------------------------------ *De:* José Luis Cañadas <canadasreche en gmail.com> *Enviado:* miércoles, 22 de noviembre de 2017 22:01 *Para:* Jesús Para Fernández *Cc:* Carlos Ortega; r-help-es en r-project.org *Asunto:* Re: [R-es] Tibble o data.table? Yo la ventaja que le veo a tibble y demás cosas del mundo tidy es la conexión a fuentes externas , como postgres,spark, presto y usar dplyr como front. El mié., 22 nov. 2017 21:51, Jesús Para Fernández < j.para.fernandez en hotmail.com> escribió: Tienes razon de que hay una serie de paquetes que lo usan, pero me da que vienen impulsados por Rstudio desde el paquete tidyverse... Yo me resisto a usarlo. Me parece que queda mas limpio, pero no se porque no le pillo la gracia...Quizas sea el apoyo de Rstudio lo que me tire para atras...
________________________________
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado: miércoles, 22 de noviembre de 2017 21:29
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Tibble o data.table?
Hola,
Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.
La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").
Gracias,
Carlos Ortega
www.qualityexcellence.es
<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernandez en hotmail.com<mailto:j.para.fernandez en hotmail.com>>
escribió:
Buenas
Os queria preguntar que ventaja le veis a las tibbles frente a los
data.table, ya que para mi, quitando el uso de librerias como tidyr o
purrr, en el resto prefiero usar data.table. Me parece igual de potente y
mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
vuestra opinion.
Gracias
Jesús
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es
<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
<https://nam04.safelinks.protection.outlook.com/?url=https%3A%2F%
2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=
02%7C01%7Cj.para.fernandez%40hotmail.com%7C1ec53787fa774b89b75108d531e7
b193%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%
7C636469793538852484&sdata=LBGtHVYjOSxGOJQGFL9KcHApdkoFKS
v89psbhpA489A%3D&reserved=0>
--
Saludos,
Carlos Ortega
www.qualityexcellence.es
<https://eur01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=7xIo1ziqT0P2%2FjCSbXT%2Fsl4WqKElhFhTUOqcny7riR0%3D&reserved=0>
<https://nam04.safelinks.protection.outlook.com/?url=http%3A%2F%
2Fwww.qualityexcellence.es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%
7C1ec53787fa774b89b75108d531e7b193%7C84df9e7fe9f640afb435aaaaaaaa
aaaa%7C1%7C0%7C636469793538852484&sdata=ynjSePt%2B7%
2B4hjxRlVetzbh37RmBUCVW8BaBYC0GqY8Y%3D&reserved=0>
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
<https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es&data=02%7C01%7Cj.para.fernandez%40hotmail.com%7C6c89c3a810f24aebef8408d531ec3e03%7C84df9e7fe9f640afb435aaaaaaaaaaaa%7C1%7C0%7C636469813071210024&sdata=PLdZUjtvp17rwQjt%2B6a5SFmafEGlfe104suA%2FWh9Otg%3D&reserved=0>
Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]