Yo empezaría por un div con el atributo contentEditable
Código HTML:
<div contentEditable="true">
Este texto es editable y se pueden poner tags como el siguiente
<img src="http://static.ajedrezweb.net/app/img/chess/flags/ES.png" />
y mezclarlo con las palabras
</div>
Y con javascript insertas o borras los tags img
Se entiende la idea ?
NOTA: no lo he probado con internet explorer ...