Hola:
Estoy utilizando un OCR, concretamente Tesseract para ficheros PDF que sólo contiene imagenes y pdftotext para los que tienen texto.
El problema es detectar cuando un fichero PDF tiene sólo imágenes o texto. ¿Alguno de vosotros sabe como detectarlo?.
Gracias.
Saludos.