Foros del Web » Programando para Internet » Python »

[SOLUCIONADO] pdfminer

Estas en el tema de pdfminer en el foro de Python en Foros del Web. hola es la primera vez que trabajo con python y la verdad ando un poco perdido, necesito obtener texto de un pdf manteniendo estilos y ...
  #1 (permalink)  
Antiguo 05/06/2013, 03:21
 
Fecha de Ingreso: marzo-2011
Mensajes: 226
Antigüedad: 13 años, 7 meses
Puntos: 1
pdfminer

hola

es la primera vez que trabajo con python y la verdad ando un poco perdido, necesito obtener texto de un pdf manteniendo estilos y todo lo relacionado con el texro e indagando por internet vi que PDFMINER da la posibilidad de extraer el texto como html

como nunca use python ni esta libreria asi que estoy probando con los ejemplos que trae dicha libreria, pero me da este error y no se por que es


Código Python:
Ver original
  1. pdf2text.py -o out.html samples/naacl06-shinyama.pdf
  2. SyntaxError: invalid syntax
  3. >>>

estoy probando en linea de comandos en windows y el error me lo marca en la palabra out

alguien sabe a que es debido?
  #2 (permalink)  
Antiguo 05/06/2013, 08:51
AlvaroG
Invitado
 
Mensajes: n/a
Puntos:
Respuesta: pdfminer

Parece que lo estás intentando desde el intérprete de python, no lo hagas. Intenta desde la línea de comandos:

python pdf2text.py -o out.html samples/naac106-shinyama.html

Etiquetas: Ninguno
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 11:54.