Skip to content
Prev 11724 / 15380 Next

[R-es] OFFTOPIC: SPARK Y H2O

Hola Jesús,

Te comento varios detalles, aunque son muchos los matices...

   - Desde el punto de vista de algoritmos, H2O tiene ventajas sobre Spark
   tanto de performance como de variedad. H2O incorpora ya un algoritmo propio
   de deeplearning y recientemente ya es compatible con Keras, Tensorflow,
   Mxnet ademas de con xgboost. Spark no ha entrado en este mundo todavía.
      - Estos son los algoritmos que recoge Spark:
      https://spark.apache.org/docs/latest/mllib-guide.html
      - Y estos los de H2O:
      http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms
      - No me olvidaría de dar una vuelta por esta comparativa de H2O,
      Spark, Python, R para diferentes tamaños de conjuntos, capacidad de
      predicción, velocidad, etc: https://github.com/szilard/benchm-ml


   - Desde el punto de vista de implementación en "producción". Spark está
   mucho más extendido, se utiliza como solución para procesamiento en
   streaming mientras que h2o no está planteado para esto, aunque puedes crear
   un modelo y como objeto ponerlo en producción independiente de arrancar
   H2O.


   - Spark forma parte de las distribuciones enterprise por defecto y hay
   mucho apoyo de las grandes empresas que junto con una gran comunidad hace
   más fácil encontrar respuesta a dudas, problemas. H2O está consolidándose
   cada vez más pero es una compañía de 70 empleados y está centrada puramente
   en el MachineLearning Aunque van creciendo muy rápido y los acuerdos
   recientes con Nvidia harán que veamos ya H2O sobre GPUs.


Saludos,
Carlos Ortega
www.qualiytexcellence.es

El 1 de julio de 2017, 11:06, Jesús Para Fernández <
j.para.fernandez en hotmail.com> escribió:

  
    
Message-ID: <CAOKbq8j=hErWXt5FB_8Gq8PitiRs3iRiqdB1QdcWZn-OtA1JcQ@mail.gmail.com>
In-Reply-To: <VI1PR0801MB2096739735E62BCBFF748AB9CCD00@VI1PR0801MB2096.eurprd08.prod.outlook.com>