Me gustaría sacar esta duda porque siempre termino con problemas en los acentos o demás caracteres.
Si decido guardar datos en utf8_unicode_ci el string debe ir lo mas limpio posible?
Es conveniente pasar el string por htmlentities() antes de guardar en la DB si decido usar latin1_spanish_ci?
porque cuando remplazo acentos en este formato html (htmlentities) a acentos limpios y guardo en utf8_unicode_ci se vizualizan de este modo á, é, ...,
porque cuando guardo acentos limpios (á,é..) en utf8_unicode_ci y lo visualizo en un documento de word, excel, etc se cortan las palabras? ejemplo "educación escolar" por "educaci".
Lo mismo si guardo los acentos en formato html (htmlentities) en utf8_unicode_ci si intento visualizarlo en un pdf estos se ven asi, á,...