Google lo explica todo aquí:
http://support.google.com/webmasters...s&answer=66359
Es una buena práctica usar rel=canonical y como dice glbicego los plugins SEO lo hacen, pero en realidad basta con el sitemap si está bien creado. Ten en cuenta que en categorías y archivos normalmente se muestran extractos del contenido y eso no es contenido duplicado exactamente, ni Google lo considera así.
Lo que sí desaconseja expresamente es bloquear direcciones es robots.txt para evitar contenido duplicado. Es decir, Google quiere rastrear el contenido duplicado, pero también quiere saber cual es la dirección principal.
Solamente penaliza los casos fraudulentos.