Lo de las rutas relativas podrías arreglarlo simplemente tomando toda cadena luego de un
href="
o
src="
y agregando la parte faltante. después de todo, se supone que ya sabés la ruta base de la página!
wget y awk son programas de UNIX (y por extensión de Linux), por lo que si estás en Windows deberás descargarlas. Simplemente fijate en la página que vinculé, al final hay un ejemplo. No puedo leer la documentación por vos