Ver Mensaje Individual
  #2 (permalink)  
Antiguo 20/08/2010, 00:33
erjotace
 
Fecha de Ingreso: agosto-2010
Mensajes: 1
Antigüedad: 14 años, 4 meses
Puntos: 0
Respuesta: Indexar y buscar en documentos PDF con PDFBox y Lucene

Hola, Dexya:

Yo las he utilizado únicamente para extraer el contenido de un PDF en una string. Es relativamente fácil. Debes añadir dos referencias a tu proyecto:

IKVM.GNU.Classpath.dll
PDFBox-0.7.3.dll

Te copio el código que yo utilizo para extraer el PDF:

using org.pdfbox;
using org.pdfbox.util;
using org.pdfbox.pdmodel;

private string leeFichero(string fichero)
{
PDDocument documento = PDDocument.load(fichero);
PDFTextStripper lector = new PDFTextStripper();
string texto = lector.getText(documento);
return texto;
}

Espero que te haya servido de ayuda.