[R-es] Rendimiento del R

Hola, Â¿quÃ© tal?

Hace mucho que no toco PL/R, pero no creo que ganes demasiado con Ã©l
en tÃ©rmino de capacidad de proceso. Usando PL/R tu motor (el programa
que va a hacer los cÃ¡lculos) serÃ¡ R, no Postgres.

En la documentaciÃ³n de PL/R aparece este ejemplo:

CREATE TABLE emp (name text, age int, salary numeric(10,2));
INSERT INTO emp VALUES ('Joe', 41, 250000.00);
INSERT INTO emp VALUES ('Jim', 25, 120000.00);
INSERT INTO emp VALUES ('Jon', 35, 50000.00);

CREATE OR REPLACE FUNCTION overpaid (emp) RETURNS bool AS '
    if (200000 < arg1$salary) {
        return(TRUE)
    }
    if (arg1$age < 30 && 100000 < arg1$salary) {
        return(TRUE)
    }
    return(FALSE)
' LANGUAGE 'plr';

SELECT name, overpaid(emp) FROM emp;
 name | overpaid
------+----------
 Joe  | t
 Jim  | t
 Jon  | f
(3 rows)

Si te das cuenta, en la definiciÃ³n de la funciÃ³n (de R) la tabla de
origen se convierte en un DF de R. Me extraÃ±arÃa mucho que la
implementaciÃ³n interna fuese muy distinta de:

1) Transforma la tabla en un df de R.
2) Opera con R (en memoria y con las consabidas limitaciones).
3) Vuelca el resultado a Postgres como una tabla.

Igual no es asÃ. Pero podÃas hacer la prueba con una tabla grande
midiendo el uso de memoria del proceso R (para eso usas Linux, Â¿no?)
para ver si es cierto.

Lo que sÃ que puedes hacer es usar Postgres para agregar y preparar
datos que luego exportes a R.

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El dÃa 2 de noviembre de 2010 20:03, Maikel (UCI-2009)
<mfrosabal en uci.cu> escribiÃ³:

[R-es] Rendimiento del R

Thread (3 messages)