Preprocesamiento con WEKA

carvear · #1 (**permalink**) 02/02/2012, 10:21

Hola tengo la herramienta WEKA para mineria de datos. Por otro lado tengo la coleccion R4, R6, JCR y R8B (Un directorio y varios subdirectorios y dentro los archivos con texto).
Lo que quiero hacer es aplicar clustering con kmeans, dbscan y optics.

El problema creo que esta cuando hago el procesamiento de los datos, en primer lugar creo el archivo arff y luego el filtro stringtowordvector. Cuando quiero aplicar dbscan u otro no anda. Quizas necesite preparar el arff de otra manera. Alguien sabe como hacerlo?

Gracias.