[R-es] Duda sobre cómo analizar un experimento factorial con algoritmos de extracción de características, clustering y clasificación como factores
Hola, Daniel: Quizá deberÃas ser más explÃcito porque de la información que suministras yo solo te puedo decir que no veo la relación entre los 3 tipos de algoritmos que nombras: - un análisis de componentes principales puede ser una fase previa de los otros dos - hacer un cluster es un tipo de aprendizaje no supervisado, mientras que un clasificador normalmente es utilizado en aprendizaje supervisado, porque se modeliza conociendo la variable dependiente Por ello, no veo cómo montar un ANOVA para analizar 3 procedimientos que a mà me parece que se utilizan para cosas completamente diferentes... Me imagino que no he sido de mucha ayuda, pero... ¿por qué no nos dices exactamente que quieres hacer, a ver si te podemos ayudar algo más? Un saludo, Isidro Hidalgo
El 25/11/2014, a las 22:09, Daniel Carrillo Zapata escribió: Hola compañeros Soy Daniel Carrillo, y os escribo porque me ha surgido una duda
sobre si
puedo tratar algoritmos de clustering como un factor en un
experimento.
Concretamente, tengo un conjunto de datos sin etiquetar, y quiero
probar
los siguientes algoritmos sobre él: 1) Extracción de caracterÃsticas por PCA y por ICA. 2) Una vez tenga extraÃdas las caracterÃsticas, para cada uno de los dos conjuntos transformados quisiera probar 3 diferentes
algoritmos
de clustering: k-medoids, EM y hierachical clustering. 3) Por último, para cada conjunto etiquetado quisiera probar 4 ó 5
clasificadores. Como se puede ver, estoy diseñando un experimento factorial para encontrar el mejor clasificador basándome en probar diferentes
técnicas
de extracción de caracterÃsticas, clustering y clasificación. Mi objetivo final es entrenar al mejor clasificador basándome en el
mejor algoritmo de clustering, de clasificación y de extracción de
caracterÃsticas para que etiquete futuros datos. Sin embargo, me han surgido dudas de cómo analizar los resultados,
y es
que no sé si se puede aplicar una ANOVA de 3 vÃas con
interacción,
siendo los 3 factores el algoritmo de extracción de
caracterÃsticas,
algoritmo de clustering y algoritmo de clasificación. Mis preguntas
por
tanto son: 1) ¿Tiene sentido aplicar ANOVA de 3 vÃas con interacción? 2) Si no, ¿cuál serÃa la mejor manera de analizar los resultados del experimento? 3) ¿Hay alguna forma de seleccionar al mejor clasificador teniendo en cuenta los errores de clasificación y cuán bien el algoritmo de
clustering agrupa los datos (por ejemplo, comparando los "silhouette
coefficients")?, porque pienso que esto lo deberÃa tener en cuenta
también.
Mis dudas vienen suscitadas por el hecho de que pienso que los algoritmos de clasificación son totalmente dependientes del los de clustering (que les etiqueta los datos). ConfÃo en vuestra experiencia para que me aportéis un rayo de luz
en esto
¡MuchÃsimas gracias! Un saludo, DANI
_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz..ch/mailman/listinfo/r-help-es