De la página:
http://lema.rae.es/drae/?val=perro
Quiero extraer el siguiente código:
Código:
<div>
<a name="55351"></a>
<p class="p">
<span class="f">
<b>perro</b>
</span>
<span class="f">
<b>
<sup>1</sup>
</b>
</span>
<span class="f">
<b>, rra</b>
</span>
<span class="f">
<b>.</b>
</span>
</p>
<p></p>
<p></p>
<p class="q">
<a name="1_1"></a>
<span class="d">
<b> 1.</b>
</span>
<span title="adjetivo" class="d">adj.</span>
<span class="d">
<span title="coloquial" class="d">coloq.</span>
</span>
<span class="b"> Muy malo, indigno.</span>
</p>
<p class="q">
<a name="1_2"></a>
<span class="d">
<b> 2.</b>
</span>
<span class="g">
<span title="adjetivo" class="g">adj.</span>
</span>
<span class="d">
<i>
<span title="El Salvador" class="d">El Salv.</span>
</i>
</span>
<span class="b"> Dicho de una persona: Enojada, de mal genio.</span>
</p>
</div>
También quiero extraer más texto de la misma página. Ya que esto se refiere a 2 resultados de búsqueda. El código anterior se refiere al contenido del primer resultado. Y quiero poder extraer los 2 resultados. Lo único identificativo de cada resultado es que justo al acabar cada resultado, termina con la etiqueta </div> y justo después viene el siguiente código en cada uno de los resultados:
Código:
<p class="o">Real Academia Española © Todos los derechos reservados</p>
Y no se como hacerlo. A alguien se le ocurre alguna manera sencilla?
PD: El método propuesto no puede ser exclusivo para esta URL, tiene que valer para cualquier valor puesto después de "http://lema.rae.es/drae/?val="