Foros del Web » Programando para Internet » PHP »

Abrir un archivo PDF con PHP

Estas en el tema de Abrir un archivo PDF con PHP en el foro de PHP en Foros del Web. Hola Foreros ! Estoy haciendo un buscador de textos y resulta que el origen de los textos, los tengo que sacar de un pdf. He ...
  #1 (permalink)  
Antiguo 31/01/2006, 12:45
 
Fecha de Ingreso: febrero-2002
Mensajes: 32
Antigüedad: 22 años, 9 meses
Puntos: 0
Abrir un archivo PDF con PHP

Hola Foreros !

Estoy haciendo un buscador de textos y resulta que el origen de los textos, los tengo que sacar de un pdf. He buscado en el foro la forma de abrir un PDF, pero todas las notas son referentes a como crearlos utilizando las librerías fpdf y pdflib...

¿Alguien me puede explicar como abrir y leer un archivo PDF?

Gracias, un saludo.
  #2 (permalink)  
Antiguo 31/01/2006, 12:54
Avatar de mauled  
Fecha de Ingreso: marzo-2005
Ubicación: Cd. de México.
Mensajes: 3.001
Antigüedad: 19 años, 8 meses
Puntos: 33
De acuerdo

Ya intentaste con la funcion fopen()
  #3 (permalink)  
Antiguo 31/01/2006, 13:39
 
Fecha de Ingreso: febrero-2002
Mensajes: 32
Antigüedad: 22 años, 9 meses
Puntos: 0
Cita:
Iniciado por mauled
Ya intentaste con la funcion fopen()
Hola !

fopen() hace una llamada al acrobat y este te muestra el PDF. Lo que yo quiero es extraer el texto que hay en un pdf para poder meterlo en mi base de datos y luego poder buscar desde un buscador en php.
  #4 (permalink)  
Antiguo 31/01/2006, 13:48
O_O
 
Fecha de Ingreso: enero-2002
Ubicación: Santiago - Chile
Mensajes: 34.417
Antigüedad: 22 años, 10 meses
Puntos: 129
Lamentablemente no es tan simple el hecho de "buscar" en un documento PDF.

Con PHP y su función fopen() abriras el archivo pero lo que vas a leer al abrilo es "chino". Tendrías que buscar información por otro lado de que formato (tal vez está hasta comprimido/encriptado?) para desvelar el formato de un PDF y de ahí "limpiarlo" (con expresiones regulares) para quedarte con el "contenido" en sí de tu PDF (el "texto") y empezar a busar sobre ese contenido "limpio".

Este proceso podría ser demasiado pesado para un script PHP .. He visto herramientas programadas en otros lenguajes para hacer busquedas sobre un PDF, si necesitas hacerlo bajo PHP .. se trataría de vía PHP llamar a esa aplicación externa (con exec() y funciones afines) que se controle por línea de comandos y recoger su resultado (a ser posible que entregue un XML? .. como para que puedas darle formato comodamente a los resultados)
Una de esas aplicaciones:

http://www.artspdf.com/arts_pdf_search.asp
(parece que tiene su própio API de programación .. vía COM para accederlo. PHP puede usar COM www.php.net/com si está instalado en Windows todo)

Un saludo,
  #5 (permalink)  
Antiguo 31/01/2006, 13:48
Avatar de mauled  
Fecha de Ingreso: marzo-2005
Ubicación: Cd. de México.
Mensajes: 3.001
Antigüedad: 19 años, 8 meses
Puntos: 33
Con fopen accedes al documento hecho esto con fread() lees el archivo y almencenas la info en tu BD
  #6 (permalink)  
Antiguo 31/01/2006, 14:53
 
Fecha de Ingreso: febrero-2002
Mensajes: 32
Antigüedad: 22 años, 9 meses
Puntos: 0
Cita:
Iniciado por Cluster
Lamentablemente no es tan simple el hecho de "buscar" en un documento PDF.

Con PHP y su función fopen() abriras el archivo pero lo que vas a leer al abrilo es "chino". Tendrías que buscar información por otro lado de que formato (tal vez está hasta comprimido/encriptado?) para desvelar el formato de un PDF y de ahí "limpiarlo" (con expresiones regulares) para quedarte con el "contenido" en sí de tu PDF (el "texto") y empezar a busar sobre ese contenido "limpio".

Este proceso podría ser demasiado pesado para un script PHP .. He visto herramientas programadas en otros lenguajes para hacer busquedas sobre un PDF, si necesitas hacerlo bajo PHP .. se trataría de vía PHP llamar a esa aplicación externa (con exec() y funciones afines) que se controle por línea de comandos y recoger su resultado (a ser posible que entregue un XML? .. como para que puedas darle formato comodamente a los resultados)
Una de esas aplicaciones:

http://www.artspdf.com/arts_pdf_search.asp
(parece que tiene su própio API de programación .. vía COM para accederlo. PHP puede usar COM www.php.net/com si está instalado en Windows todo)

Un saludo,

Gracias, Cluster.
Optaré por esa opción.
No creía que fuera tan complicado.
Un saludo.
  #7 (permalink)  
Antiguo 31/01/2006, 21:49
Avatar de dopon  
Fecha de Ingreso: julio-2005
Ubicación: Cucuta / Colombia
Mensajes: 493
Antigüedad: 19 años, 4 meses
Puntos: 1
Si que es complicado en mi universidad en la seccion de la biblioteca (yo trabajo alli) unos hicieron una tesis para realizar esto , buscar en pdf esta hecho en php con java . cuando entre a la Univ espero poder conseguir el fuente y compartirlo con ustedes.

Para leer el pdf no es simplemente fopen y ya como dice cluster es como leer en chino, si no sabes chino debes aprender como traducirlo y ahi si ;)
  #8 (permalink)  
Antiguo 30/05/2012, 10:06
 
Fecha de Ingreso: mayo-2012
Mensajes: 1
Antigüedad: 12 años, 5 meses
Puntos: 0
Respuesta: Abrir un archivo PDF con PHP

<?php
//$fecha = include ('fecha.php');
//$roe = pg_fetch_array($fecha);

/* incluimos primeramente el archivo que contiene la clase fpdf */
include ('Pdf/fpdf.php');
$oficina=$_GET['ofi'];

/* tenemos que generar una instancia de la clase */

$pdf = new FPDF();
$pdf->AddPage();

/* seleccionamos el tipo, estilo y tamaño de la letra a utilizar */



$pdf->SetFont('Helvetica', 'I', 8);
$pdf->Ln(15);
$pdf->Cell(0,0,"".date("d/m/Y"),0,'R',0,0);
$pdf->Ln(15);
$pdf->SetFont('Helvetica','', 14);
$pdf->Cell (0,10,'REPORTE DE EMPLEADOS','0','0','C');
$pdf->Ln();
$pdf->Ln(15);
$pdf->Cell(20,10,'Codigo',0,0,'C');
$pdf->Cell(20,10,'Nombre ',0,0,'C');
$pdf->Cell(20,10,'Apellido',0,0,'C',0);
$pdf->Cell(20,10,'Email',0,0,'C');
$pdf->Cell(30,10,'Cod oficina',0,0,'C');
$pdf->Cell(40,10,'Jefe inmediato',0,0,'C');
$pdf->Cell(20,10,'Extension',0,0,'C');
$pdf->Cell(20,10,'Cargo',0,0,'C');
$pdf->Ln(15);
$conn = mysql_connect("$HOST=Localhost $USER=root $PWD=root $BD=classicmodels");
$sql="select employeeNumber,FirstName,lastName,email,officeCode ,reportsTo,extension,jobTitle from employees where officeCode = '$oficina' ";
$query = mysql_query($conn,$sql);
$row = mysql_num_rows($query);


$fill=false;
$i=0;
while($i<$row)
{
$siape=utf8_decode;
$siape=pg_result($sql,$i,'nombre_producto');
$nome=pg_result($sql,$i,'precio');
$carac=pg_result($sql,$i,'caracteristicas_produc') ;
$pdf->SetFont('Helvetica','B', 8);
$pdf->Cell(57,13,$siape,1,0,'C',$fill);
$pdf->Cell(67,13,$carac,1,0,'C',$fill);
$pdf->Cell(57,13,$nome,1,1,'C',$fill);
//$fill=!$fill;
$i++;
}
$pdf->Output("Reporte.pdf",'F');
echo "<script language='javascript'>window.open('Reporte.pdf','_ self','');</script>";//para ver el archivo pdf generado
exit;
?>



este es mi cogigo y necesito ayuda
no puedo conectar la base de datos para que me muestre lo quye esta en mi BD
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 12:11.