Muchisimas gracias
andresdzphp por la ayuda, aquí dejo el resultado al que llegue, quizas no es la solución mas elegante pero funciona!!! al final como me pidieron de apuro que los caracteres ## tampoco figuren en el archivo final use ereg_replace para sacarlos.
Gracias a todos!
Código PHP:
// archivo HTML a procesar
$archivo_html = '8.HTML';
// nombre del archivo donde se generará el txt con el contenido deseado
$archivo_txt = "script ". date("Y-m-d H.i.s").".txt";
// leo el contenido del archivo y lo pongo en una variable
$contenido_con_etiquetas_html = file_get_contents("$archivo_html");
// obtengo el contenido del archivo sin las etiquetas HTML
$contenido_a_filtrar = strip_tags($contenido_con_etiquetas_html);
// Mediante Expresiones Regulares dejo lo que esta entre los delimitadores ##
//(gracias andresdzphp)
preg_match_all('/##(.*?)##/is', $contenido_a_filtrar, $parrafos);
//Generación del .txt final
foreach ($parrafos[0] as $p) {
if ($fp = fopen($archivo_txt, a))
{
fputs($fp, ereg_replace("##","",($p)) ."\r\n"."\r\n"."\r\n"."\r\n");
}
}
fclose($fp);