Buenas erreros!!
Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no....
Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje.
H2O es una herramienta que nos permite hacer datamining para grandes datasets, balanceando entre los nodos/clusters del sistema, y conectado con R o Python puedes hacerlo usando el lenguaje de estos.
Entonces, para que me vale Spark si tengo ya H2O?
Es que no veo claro para que vale cada herramienta.
Gracias
Jesús