Skip to content
Back to formatted view

Raw Message

Message-ID: <AM5PR0802MB2577C065680BCF9434449E49CC760@AM5PR0802MB2577.eurprd08.prod.outlook.com>
Date: 2017-01-27T18:44:45Z
From: Jesús Para Fernández
Subject: [R-es] Como abordar un problema?

Buenas,


Empieza el finde, así que abro un hilo algo OFF TOPIC en cuanto a R se conoce.


Imaginad un problema cualquiera supervisado, por ejemplo la relacione entre variables y que un suceeso ocurra o no. ¿Cómo lo abordamos?


Yo empezaría de la siguietne manera:

1- Hablar con la gente que conozca el proceso del cual provienen esos datos y entender bien le proceso

2. Buscar la sanidad del dataset (datos faltantes,outliers, distribucion de los datos, normalizarlos...)

3. Hacer un clustering para entender posibles asociaciones entre datos

4. Partir los datos en train y test

5. Poner los modelos y pasarlos por un Kfold en funcion del train/test

6. Ver el mejor modelo

7. Extraeer conclusiones de ese modelo.


¿Vosotros que haceis? Usais el clustering para el análisis exploratorio?


Un saludo y buen finde

	[[alternative HTML version deleted]]