Triste Htmlparser y error de socket
hola quisiera saber si alguien me puede ayudar ya que intento hacer un programa para obtener datos de una pagina web y guardarlos en una bd, estoy leyendo lo de htmlparser pero no se como funciona no le entiendo y no se donde poner la libreria que descargue es un archivo .yar, ojala alguien me pueda ayudar ya que me urge hacer ese prog para poder llenar la base de datos y avanzar en mi proyecto, ojala alguien tenga algun tutorial o algo, por favor :
otra duda que tengo es que al correr un programa que hace una conexion a una pagina web me marca este error:
java.net.SocketException: Connection reset
at java.net.SocketInputStream.read(SocketInputStream. java:168)
at java.io.BufferedInputStream.fill(BufferedInputStre am.java:218)
at java.io.BufferedInputStream.read1(BufferedInputStr eam.java:258)
at java.io.BufferedInputStream.read(BufferedInputStre am.java:317)
at sun.net.www.http.HttpClient.parseHTTPHeader(HttpCl ient.java:687)
at sun.net.www.http.HttpClient.parseHTTP(HttpClient.j ava:632)
at sun.net.www.http.HttpClient.parseHTTP(HttpClient.j ava:652)
at sun.net.www.protocol.http.HttpURLConnection.getInp utStream(HttpURLCon
nection.java:1072)
at ejemplo2.main(ejemplo2.java:16)
ojala alguien me diga como solucionarlo ya que de forma local si lo hace lee la pagina jsp que tengo en mi servidor, el codigo que uso es elsiguiente:
-------------
import java.io.*;
import java.net.*;
public class ejemplo2{
public static void main(String args[]){
URL direccion;
URLConnection cnn;
BufferedReader reader;
try {
System.out.println("accesando a la url");
direccion = new URL("http://www.google.com");
cnn = direccion.openConnection();
String texto = "";
reader = new BufferedReader(new InputStreamReader(cnn.getInputStream()));
String cad;
while ( (cad = reader.readLine()) != null){
texto += cad ;
}
System.out.println("El contenido de la página\n");
System.out.println(texto);
} catch (Exception ex) {
ex.printStackTrace();
}
}
}
ESPERO SU RESPUESTA GRACIAS