Esteban, ¿podrías ayudarnos a entender bien el problema? (código)
Lo que se me ocurre de entrada es que tu código primero verifique que tu documento sea válido, que tenga un DTD asociado y que, por lo tanto, al meter una etiqueta no válida el parseo sea "imposible" (improsedente pués).
Pero, en definitiva creo que ayudaría si muestras un código sencillo de ejemplo...
Saluton