a ver... podrias permitir que suban la imagen y dividirla (de acuerdo al tamaño de la imagen) en un número limitado de divs, que se ponen sobre la imagen. Entonces permitirles escribir sobre alguno de esos divs y almacenar el número del div - o id sería mejor -, el tamaño de cada uno y el texto escrito.
Al mostrar la imagen se generan los divs de nuevo sobre la imagen con su respectivo tamaño y se pega, sobre el número de div almacenado, la etiqueta correspondiente.
Es bastante trabajo creo XD.
Y es bastante confusa mi explicación :S, pero es lo primero que se me ocurre.