[SOLUCIONADO] Manipulacion de caracteres en python3

Instru · #1 (**permalink**) 25/07/2013, 14:20

Hola. Tengo una duda. Primero, como dice el titulo, estoy usando la version3 de python.

Por lo que he leido, en esta version ya todas las cadenas de caracteres usan unicode.

Ahora, dentro del programa que estoy haciendo hago cierta manipulacion de cadenas caracter por caracter. Y pues el unicode me ha dado mas problemas que soluciones. Afortunadamente todo fue solucionado. Pero al igual que en posts pasados, quisiera saber si esta es la forma correcta de trabajar con cadenas.

Pongo un ejemplo:

Código:

currentline = str(line.strip()) 
if len(currentline) == 0 \
or currentline[2] == '\n' \
or currentline[2] == ';':

Anterior a este codigo, tengo un for que lee una linea de texto de un archivo a la vez. Lo que hago es usar str para convertirlo a byte-string. Sin embargo, me agrega una b y un apostrofe '. Por lo tanto mi texto comienza en 2 en vez de 0.

Estoy muy acostumbrado aun a C, C++ y PHP. Entonces no se si esto sea normal... que las cadenas empiezen en 2, en vez de 0, gracias a los caracteres adicionales que se agregan.

Alguien tiene alguna sugerencia?

Saludos

PD: Oohh, lo olvidaba. el metodo split no funciona con unicode. O la verdad no se que pasa, porque si no uso str(currentline), me lanza una excepcion en donde intento usar split.

razpeitia · #2 (**permalink**) 25/07/2013, 14:58

Deberías leer sobre str vs bytes

Código Python:

Ver original# Asumo que line son bytes
currentline = line.strip()
# Recuerda no mezclar string y bytes
if not currentline or currentline.startswith(b'$') or currentline.startswith(b'\n'):

Instru · #3 (**permalink**) 25/07/2013, 15:48

Gracias por la info. En el texto que ando leyendo también lo mencionan, sin embargo si ha sido algo confuso para mi. Aun asi, leeré el texto que me pasaste.

Ahora otra duda.

La forma de abrir el archivo ("r", "rb"), afecta el tipo de objeto que leo usando el for??

Saludos

razpeitia · #4 (**permalink**) 25/07/2013, 15:56

Si, especialmente si le indicas un encoding.

http://docs.python.org/3/library/fun...ight=open#open

Instru · #5 (**permalink**) 25/07/2013, 17:05

Excelente. Muchas gracias.