estoy intentando implementar una función que lea un fichero linea a linea, y que calcule la similitud entre las lineas.
Mi objetivo sería sacar un diccionario de [ID,ValorDeSimilitud]
Por ejemplo:
Id Estilo Altura Amplitud Fabricante Peso Grosor
1 casual 2 2 AR 5 0.5
2 casual 1 1 BR 2 0.5
La columna fabricante no la pondero en esta función ya que me es indiferente.
Ahora mismo como código tengo lo siguiente (no tengo el bucle aplicado de linea por linea porque primero quiero verificar que leo las columnas adecuadas):
Código:
A mi me gustaría que al hacer el print de la LineaFichero le pudiese indicar que me imprimiese solo la 5 columna de dicha fila.#open file file = open('AttributeDataSet.txt', 'r') infile=file.readline() LineaFichero=infile.split('/t') print('>>> Read one line') print(LineaFichero) # close file file.close() #Read columns 1,2,10,11,13,14
Alguien me puede dar alguna idea?
Gracias.