Hola tengo la herramienta WEKA para mineria de datos. Por otro lado tengo la coleccion R4, R6, JCR y R8B (Un directorio y varios subdirectorios y dentro los archivos con texto).
Lo que quiero hacer es aplicar clustering con kmeans, dbscan y optics.
El problema creo que esta cuando hago el procesamiento de los datos, en primer lugar creo el archivo arff y luego el filtro stringtowordvector. Cuando quiero aplicar dbscan u otro no anda. Quizas necesite preparar el arff de otra manera. Alguien sabe como hacerlo?
Gracias.