Una pagina cualquiera de la que se extrae el body y a continuacion se debe fragmentar a trozos (no hay un numero especifico). No puede ser por tamanyo ej: x caracteres.
Primera duda:
Teniendo en cuenta que no se sabe como sera la pagina en la que tenemos que fragmentar su contenido que es mejor: Fragmentar sintacticamente o semanticamente?
Segunda duda
Cual es la mejor solucion para fragmentarlo? Por cada <div>? Por cada <br>? Despues de cada .? En cada una de ellas pueden surgir errores como por ejemplo que haya muchos "." o muchos saltos de linea.
Muchas gracias
Saludos