20/08/2010, 00:33
|
| | Fecha de Ingreso: agosto-2010
Mensajes: 1
Antigüedad: 14 años, 3 meses Puntos: 0 | |
Respuesta: Indexar y buscar en documentos PDF con PDFBox y Lucene Hola, Dexya:
Yo las he utilizado únicamente para extraer el contenido de un PDF en una string. Es relativamente fácil. Debes añadir dos referencias a tu proyecto:
IKVM.GNU.Classpath.dll
PDFBox-0.7.3.dll
Te copio el código que yo utilizo para extraer el PDF:
using org.pdfbox;
using org.pdfbox.util;
using org.pdfbox.pdmodel;
private string leeFichero(string fichero)
{
PDDocument documento = PDDocument.load(fichero);
PDFTextStripper lector = new PDFTextStripper();
string texto = lector.getText(documento);
return texto;
}
Espero que te haya servido de ayuda. |