Foros del Web

Estas en el tema de Tipo PDF en el foro de .NET en Foros del Web. Hola: Estoy utilizando un OCR, concretamente Tesseract para ficheros PDF que sólo contiene imagenes y pdftotext para los que tienen texto. El problema es detectar ...

#1 (permalink)

11/12/2009, 14:01

netempleo

Fecha de Ingreso: mayo-2004

Mensajes: 22

Antigüedad: 20 años, 11 meses

Puntos: 0

Tipo PDF

Hola:

Estoy utilizando un OCR, concretamente Tesseract para ficheros PDF que sólo contiene imagenes y pdftotext para los que tienen texto.

El problema es detectar cuando un fichero PDF tiene sólo imágenes o texto. ¿Alguno de vosotros sabe como detectarlo?.

Gracias.

Saludos.

¿Tienes una mejor respuesta a este tema? ¿Quiéres hacerle una pregunta a nuestra comunidad y sus expertos? Registrate

Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.