Si sabes inglés, esta es una excelente web donde puedes encontrar ejemplos de multiplataform threading.
http://www.boost.org/doc/libs/1_35_0...ml/thread.html
La otra es que te metas directamente a la pagina de desarrolladores de intel core, y descargues el SDK.
Yo trabajo con GPU's y la programacion CUDA de Nvidia, mi estacion de trabajo es una computadora de 32 GB de RAM, y un procesador con la capacidad de 20 procesadores normales, esta diseñada para hacer cosas 800 o 1000 veces mas rapido que una computadora avanzada, tiene la capacidad de 4 teraflops y en mi experiencia programando con C++, jamás he visto un programa que con un simple for de c++ aproveches o explotes al maximo la capacidad de un procesador multi nucleo.