Estoy usando xPath para sacar cierta información del codigo HTML de una web.
Me encuentro con el siguiente problema:
La web tiene una lista asi:
Código:
Que expresion xPath puedo usar para obtener por orden el título y el contenido?? Daos cuenta de que tanto los h2 como los li estan en el mismo nivel dentro de ul.<ul> <h2><a href="dondesea1.html">Titulo 1</a> </h2> <li> <a href="dondesea2.html">Contenido 1</a></li> <li> <a href="dondesea3.html">Contenido 2</a> </li> <h2> <a href="dondesea4.html">Titulo 2 </a></h2> <li><a href="dondesea5.html"> Contenido 3</a></li> <li> <a href="dondesea6.html">Contenido 4</a></li> <li> <a href="dondesea7.html">Contenido 5 </a></li>
Me gustaria obtener algo asi:
Titulo 1
Contenido 1
Contenido2
Titulo2
Contenido 3
Contenido 4
Contenido 5
Pero de manera que sepa y pueda manejar en todo momento los h2 por un lado y los li por otro. Es decir, que no sólo los muestre así, sino que ademas sepa de qué elemnto se trata (si un h2 o un li) y pueda acceder despues al elemento href.
Lo que me gustaría obtener al final sería algo asi:
Titulo 1 es un h2 y su href es "dondesea1.html"
Contenido 1 es un li y su href es "dondesea2.html"
Contenido2 es un li y su href es "dondesea3.html"
Titulo2 es un h2 y su href es "dondesea4.html"
Contenido 3 es un li y su href es "dondesea5.html"
Contenido 4 es un li y su href es "dondesea6.html"
Contenido 5 es un li y su href es "dondesea7.html"
Sabeis como puedo hacerlo o algun ejemplo similar q me podais referenciar???
Muchisimas gracias y un saludo!
PD: Hasta ahora la expresion que usaba era //ul pero eso me devuelve todo junto, y quiero poder hacer en algun sitio un if y ver si es de tipo h2 o de tipo li y ademas sacar los enlaces en el mismo momento