Si usas ubuntu (o cualquier distro de linux) puedes usar
grep con el paquete
poppler-utils que por supuesto, al igual que el sistema operativo, es totalmente gratuito.
En un directorio del servidor, tendrias una carpeta con documentos de word, pdfs, xml, texto, etc y podrias usar este comando para buscar un texto en estos archivos.
Aqui hay un ejemplo de como usar grep y de como instalar el paquete poppler-utils.
Luego que eso lo tengas funcionando, puedes usar las
Funciones de ejecucion de programas desde php para llamar a grep, realizar la busqueda y retornar los resultados.
Edito: aparentemente se puede hacer tambien con windows con el paquete
xpdf o bien, una extencion de este, llamada
pdfsearch la cual hace exactamente lo que tu quieres.
Esta hecha en phyton no en php, y presenta 3 interfaces, la de la linea de comando (para llamar desde php, pero no hace falta), la de escritorio que tiene una gui simple, y una servidor que te permite acceder por la web. La aplicacion sola indexa busquedas y demas asi que eso ya o tendrias resuelto.