Ver Mensaje Individual
  #12 (permalink)  
Antiguo 09/10/2011, 22:15
fermdp
 
Fecha de Ingreso: diciembre-2001
Ubicación: Mar del Plata
Mensajes: 203
Antigüedad: 23 años
Puntos: 0
Respuesta: Como extraer secciones de texto de un html o txt?

Muchisimas gracias andresdzphp por la ayuda, aquí dejo el resultado al que llegue, quizas no es la solución mas elegante pero funciona!!! al final como me pidieron de apuro que los caracteres ## tampoco figuren en el archivo final use ereg_replace para sacarlos.

Gracias a todos!

Código PHP:
// archivo HTML a procesar
$archivo_html '8.HTML'

// nombre del archivo donde se generará el txt con el contenido deseado
$archivo_txt "script "date("Y-m-d H.i.s").".txt"

// leo el contenido del archivo y lo pongo en una variable
$contenido_con_etiquetas_html file_get_contents("$archivo_html"); 

// obtengo el contenido del archivo sin las etiquetas HTML
$contenido_a_filtrar =  strip_tags($contenido_con_etiquetas_html);

// Mediante Expresiones Regulares dejo lo que esta entre los delimitadores ##
//(gracias andresdzphp)
preg_match_all('/##(.*?)##/is'$contenido_a_filtrar$parrafos); 
 
//Generación del .txt final
foreach ($parrafos[0] as $p) {

if (
$fp fopen($archivo_txta))
{
fputs($fpereg_replace("##","",($p)) ."\r\n"."\r\n"."\r\n"."\r\n");
}
}

fclose($fp); 
__________________
:) Fernando Dichiera (:
[email protected]