A qué te refieres con "documentos con un formato estándar para todos"?
Si son archivos de texto plano (txt, html, etc), yo preferiría la opción 2, hasta donde sé, la mayoría de gestores de noticias y weblogs guardan este tipo de información en la base de datos, te pongo el siguiente ejm: qué pasa si yo quiero buscar un determinado texto en las noticias anteriores? vas a abrir archivo por archivo a buscar el texto en cuestión?.
Si al contrario son documentos los que piensas guardar, creo que deberías considerar algún método de indexación de los mismos (
DotLucene es una buena opción)
Saludos