Estoy creando una aplicación que recoge y procesa html de una web externa, exactamente, de unas tablas que contienen valores numéricos. La mejor manera para extraerlo, pienso, es un "preg_match_all", y procesar sus datos, pero hay un problema:
Código HTML:
<td>
3
</td>
<td>
11
<td>
13
</td>
<td>
15
</td>
En este trozo de fragmento html, que es lo que se recoge de la web, se ve que hay un error, la celda del 11 no está cerrada (y esto pasa en cada fila de registros). Este problema, al ser una web externa, no lo puedo solucionar, y me da problemas, ya que no puedo recoger el valor 13 (en el array de datos, tengo el 3, el 11 y me salta al 15).
Mi expresión regular es esta:
Código:
#<td\>[ \t\n\r]*([0-9/]+)[ \t\n\r]*[<\/td\>]?#
Esta expresión funciona bien, pero tiene el problema del <td> no cerrado, y me gustaría saber como se podria solucionar.
Alguna idea?
Gracias de antemano.