Ver Mensaje Individual
  #1 (permalink)  
Antiguo 27/10/2007, 06:31
Avatar de Italico76
Italico76
 
Fecha de Ingreso: abril-2007
Mensajes: 3.303
Antigüedad: 18 años
Puntos: 292
Busqueda Expresiones regulares (ayudita)

AMIGOS: todo lo que trato me cuesta un parto sin experiencia y el manejo de expresiones regulares no es la excepcion

Tengo unos enlaces (cientos) que tengo que parsear y estan en este formato:

Cita:
<li><a href="http://anyveggie.blogspot.com" title="series de TV">Cualquier verdura</a> - series de TV, discos o &quot;cualquier verdura&quot;</li>
<li><a href='http://dientedelparnaso.blogspot.com/' >Diente del Parnaso</a> - un blog sobre noticias de actualidad nacional e internacional con un estilo cr&iacute;tico
<li><a href='http://www.exprofeso.com' title="periodismo">Ex profeso</a> - este es un sitio web de periodismo. el fin: elaborar un discurso crítico de calidad. el medio: la reflexión. la consigna: pensar es hacer periodismo, y hacer periodismo es hacer pensar.</li>
<li><a href="http://www.espacioblog.com/labana/blog" title="periodismo hispano">Mara Torres : página no oficial</a> - Weblog sobre la periodista y escritora Mara Torres. Para ponerse al día sobre su segundo libro, su etapa en La 2 Noticias, y leer una entrevista en exclusiva</li>
<li><a href="http://www.norbertoportugheiz.blogspot.com/" title="actualidad">Norberto Portugheiz</a> - informaciones y referencias de actualidad, respecto a personas y pueblos donde se leeran escritos mios, muchos ineditos: articulos, ensayos, poesia, narrativa, humor. </li>
<li><a href="http://www.otexto.net">Ojo al Texto</a> - bitácora del Prof. Alvaro Ramirez Ospina sobre sociedad, politica, comunicacion,... </li>
<li><a href='http://papearte.blogspot.com' >PapeArt</a> - Noticias, entretenimiento y humor</li>
<li><a href="http://quieroserjedi.blogspot.com/">Quiero ser un jedi </a>- videos, TV, música, chistes, ... </li>
Empecé a hacer algo para intentar parsearlo.... pero NI SIQUIERA pude separarlos teniendo en cuanta que estan flanqueados entre <li> y </li>

Código PHP:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Parserseo de enlaces</title>
</head>

<body>
  
      
<div align="center">
<form method="post" action="anal.php">
<textarea name="entrada" cols="45" rows="5"></textarea>
      <p/>      
      <input type="submit" value="Enviar"/>
</form>
  </div>
  <?php procesa(); ?>  
  </body>
</html>

<?php

Function procesa(){
if (isset(
$_POST["entrada"])) {
$enlaces $_POST["entrada"];
  
//$urls = spliti("<li>",$enlaces);  # prueba con spliti
  
eregi("(<li>)(.*)(</li>)",$enlaces,$urls); # separa  todo lo que este ente <li> </li>  
  
Print_r ($urls);  
  Print 
count($urls);
  }
}
?>

Ideas ?