Ver Mensaje Individual
  #5 (permalink)  
Antiguo 07/04/2006, 08:19
Avatar de -Defero-
-Defero-
Colaborador
 
Fecha de Ingreso: julio-2004
Ubicación: Guipúzcoa
Mensajes: 4.776
Antigüedad: 20 años, 4 meses
Puntos: 76
Hmmm... probemos con expresiones regulares. Las líneas que contienen un dominio están compuestas por:

- Inicio de la línea (^)
- Una serie de caracteres que comprende letras mayúsculas, letras minúsculas, cifras, y guiones. ([A-Za-z0-9_\-])
- Un punto.
- Una nueva serie de caracteres que comprende letras mayúsculas, minúsculas, cifras y guiones. ([A-Za-z0-9_\-])
- Fin de línea ($)

Montemos una expresión regular con todo eso:

^[A-Za-z0-9_\-][A-Za-z0-9_\-]*\.[A-Za-z0-9_\-][A-Za-z0-9_\-]*$

Usa grep para filtrar todas las líneas que no se correspondan con este patrón, y listo.

De todas maneras necesitaría que me confirmarais que los dominios están formados sólo por esos caracteres. A mí no se me ocurre ningún otro que pueda formar parte de un dominio, pero nunca se sabe.


Ooooops... ahora que me doy cuenta... esto borraría un dominio que se llamara miweb.com.ar, al considerarlo un subdominio. Si en tu lista hay dominios de este tipo (no sé cómo se llaman), mi expresión regular no te sirve para nada.
__________________
abogado en Errenteria + procuradora en San Sebastián = equipo imparable