Foros del Web » Programando para Internet » PHP »

Problema con spider cavernicola =P

Estas en el tema de Problema con spider cavernicola =P en el foro de PHP en Foros del Web. Hola!!, muchas personas son las que crean directorios y buscadores temáticos propios, entonces se me ocurrió hacer un ¡Spider cavernicola! jaja, nisiquiera los spiders antiguos ...
  #1 (permalink)  
Antiguo 20/10/2011, 13:38
 
Fecha de Ingreso: junio-2010
Mensajes: 49
Antigüedad: 14 años, 5 meses
Puntos: 3
Exclamación Problema con spider cavernicola =P

Hola!!, muchas personas son las que crean directorios y buscadores temáticos propios, entonces se me ocurrió hacer un ¡Spider cavernicola! jaja, nisiquiera los spiders antiguos son tan cavernicolas como este, pero en fin, es muy práctico porque en directorios o buscadores temáticos no podes utilizar los spiders comunes.

Con este proyecto no intento ganar fama ni dinero (aunque quisiera no podría ganar ninguna de las 2 jajaja xD). Bueno en fín, mi problema es el siguiente:

Tengo un input type text en el que uno escribe la url y al clickear en el botón te debería extraer el titulo, la meta description y las keywords en caso de que sea una url funcional.

Les dejo el código haber si pueden descubrir el problema, creo que es sobre la url que uno envía:

Código PHP:
<?php
if (isset($_GET['submitted'])) {

    
$url $_GET['url']; 
    
$valid = @fsockopen("$url"80$errno$errstr30);
    
    
$page $_SERVER['PHP_SELF'];

    if (!=
$valid) {
        
        
// No funciona
        
echo '<h3>'.$url.'</h3>
        <p><span style="color:#EE0000">Este link no funciona.</span></p>
        <p><a href="'
.$page.'">Probar otro enlace</a>';
        
    } else {
        
        
// Funciona
        
echo '<h3>'.$url.'</h3>
        <p><span style="color:#458B00">Este link funciona perfectamente.</span></p>
        <p><a href="'
.$page.'">Probar otro enlace</a>';
        
// Analizando etiquetas
        
$tags get_meta_tags($url);
    echo 
"<br></br>";
echo 
"<b>Keywords:</b>";
echo 
$tags['keywords'];
echo 
"<br></br>";
echo 
"<b>Description:</b>";
echo 
$tags['description'];
echo 
"<br></br>";
echo 
"<b>Title en metatag:</b>";
echo 
$tags['title'];
    }
} else {
?>
<h3>Tortuga Spider</h3>
<form action="<?php $_SERVER['PHP_SELF'?>" method="get">
<p><b>URL :</b> <input type="text" id="Enviar" name="url" size="30" value="<?php echo $_GET['url']; ?>" /></p>
<div align="center"><input type="submit" name="submit" value="Iniciar" /></div>
<input type="hidden" name="submitted" value="TRUE" />
</form>
<?php
}
?>
El spider se llama "Tortuga Spider" =P
__________________
Naica enciclopedia animal
  #2 (permalink)  
Antiguo 20/10/2011, 15:11
Avatar de Triby
Mod on free time
 
Fecha de Ingreso: agosto-2008
Ubicación: $MX->Gto['León'];
Mensajes: 10.106
Antigüedad: 16 años, 3 meses
Puntos: 2237
Respuesta: Problema con spider cavernicola =P

Nunca he hecho algo asi, no me imagino como lo interpreta PHP, si asignar el valor de $valid a NOT ( ! )... tengo curiosidad y voy a probarlo.

(!=$valid)

Ese if debiera ser ( ! $valid ) ... sin el =

Quita la @ del fsockopen, si hay algun error, ahi mismo lo vas a ver.
__________________
- León, Guanajuato
- GV-Foto
  #3 (permalink)  
Antiguo 21/10/2011, 15:18
 
Fecha de Ingreso: junio-2010
Mensajes: 49
Antigüedad: 14 años, 5 meses
Puntos: 3
Respuesta: Problema con spider cavernicola =P

Mira, probé con forosdelweb.com y me sale esto:

Cita:
Warning: get_meta_tags(www.forosdelweb.com) [function.get-meta-tags]: failed to open stream: No such file or directory in /home/a9177663/public_html/tortuga-spider2.php on line 23
saludos
__________________
Naica enciclopedia animal
  #4 (permalink)  
Antiguo 21/10/2011, 16:23
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 16 años, 7 meses
Puntos: 2534
Respuesta: Problema con spider cavernicola =P

Una URL válida debe comenzar siempre con el protocolo. Si tu escribes www.forosdelweb.com esa es una URL mal formada, correctamente sería así: http://www.forosdelweb.com/
Código PHP:
print_r(get_meta_tags('http://www.forosdelweb.com/')); 
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.
  #5 (permalink)  
Antiguo 21/10/2011, 23:37
 
Fecha de Ingreso: junio-2010
Mensajes: 49
Antigüedad: 14 años, 5 meses
Puntos: 3
Respuesta: Problema con spider cavernicola =P

Si uso el http:// me aparece este error:

Cita:
Warning: fsockopen() [function.fsockopen]: unable to connect to http://www.forosdelweb.com:80 (Unable to find the socket transport "http" - did you forget to enable it when you configured PHP?) in /home/a9177663/public_html/tortuga-spider2.php on line 5
Y si lo uso con www. me sale este:

Cita:
Warning: get_meta_tags(www.forosdelweb.com) [function.get-meta-tags]: failed to open stream: No such file or directory in /home/a9177663/public_html/tortuga-spider2.php on line 22
Salu2!
__________________
Naica enciclopedia animal
  #6 (permalink)  
Antiguo 22/10/2011, 10:24
Avatar de pateketrueke
Modernizr
 
Fecha de Ingreso: abril-2008
Ubicación: Mexihco-Tenochtitlan
Mensajes: 26.399
Antigüedad: 16 años, 7 meses
Puntos: 2534
Respuesta: Problema con spider cavernicola =P

La forma con http:// es la forma correcta, la otra forma que intentas no lo es.

Ahora, para que funcione tu código debes habilitar allow_url_fopen en tu configuración del php.ini si no, pues no va a funcionar jamás.
__________________
Y U NO RTFM? щ(ºдºщ)

No atiendo por MP nada que no sea personal.

Etiquetas: crawler, spider, tortuga
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 14:32.