
04/11/2005, 07:58
|
| | Fecha de Ingreso: octubre-2005
Mensajes: 18
Antigüedad: 19 años, 4 meses Puntos: 1 | |
Funcion para quitar etiquetas html del codigo de una pagina Bueno, ya abri un post preguntando por cosillas o ideas para ir haciendo un mini-buscador en php...
Ahora estoy un poco recuperando infomracion, scripts, etc... sobre, a partir del codigo html de una pagina, dividir la informacion de una pagina segun este dentro de una etiqueta <b>, <i>, <hx>, etc...
Tengo 2 dudas:
1.- Si no recuerdo mal, existia una funcion que a partir de un codigo html, quitaba las etiquetas y devolvia ese mismo codigo pero sin etiquetas... No recuerdo si era en php o javascript o que, pero yo creo que era php...
¿Sabeis que funcion es?
2.- Que ideas a grandes rasgos teneis para analizar el codigo html para sacar la informacion de cada etiqueta teniendo en cuenta que:
Lo ideal seria que el coidgo viniera:
<p><b>El Ministerio de Agricultura</b> es uno de los ministerios de España</p>
<p> A veces alli hay ...</p>
Pero en realidad vienen los codigos de muchas paginas como:
<p><b>El Ministerio de Agricultura es uno de los ministerios de España
<p>A veces alli hay ...</p>
Vamos, que hay etiquetas sin cerrar, se abre un parrafo sin que se haya cerrado el anterior, etc...
Merci |