Hola a todos,
estoy intentando implementar una función que lea un fichero linea a linea, y que calcule la similitud entre las lineas.
Mi objetivo sería sacar un diccionario de [ID,ValorDeSimilitud]
Por ejemplo:
Id Estilo Altura Amplitud Fabricante Peso Grosor
1 casual 2 2 AR 5 0.5
2 casual 1 1 BR 2 0.5
La columna fabricante no la pondero en esta función ya que me es indiferente.
Ahora mismo como código tengo lo siguiente (no tengo el bucle aplicado de linea por linea porque primero quiero verificar que leo las columnas adecuadas):
Código:
#open file
file = open('AttributeDataSet.txt', 'r')
infile=file.readline()
LineaFichero=infile.split('/t')
print('>>> Read one line')
print(LineaFichero)
# close file
file.close()
#Read columns 1,2,10,11,13,14
A mi me gustaría que al hacer el print de la LineaFichero le pudiese indicar que me imprimiese solo la 5 columna de dicha fila.
Alguien me puede dar alguna idea?
Gracias.