es por la URL, se la estabas pasando mal! entonces al momento de intentar hacer la conexion, no encontraba nada.
lo de guardar el HTML, nadamas toma el texto que te regresa la clase, y guardalo en un archivo con extension *.html, lo del PDF, imagino que lo que quieres es guardar algo asi como un screenshoot o algo asi.... bueno, para eso si no se me ocurre nada
mas que ir interpretando el html o algo asi
have funnnnn