| ||||
Respuesta: Problemas con caracteres acentuados y UTF-8 en scraping Me parecia demasiado obvio decir que ya he estado navegando por el manual en linea de PHP Aparte de eso, no quiero cambiar ni la codificacion de mi web, ni del servidor, ni de php, etc, etc; yo trabajo con UTF-8 unicamente algunas web a las que hago scraping no han seguido las buenas practicas de también usarlo y de ahí el problema, e incluso intentando cambiarles la códificación al vuelo a UTF-8 a esas webs en concreto resulta en una mala visualización, en espacial cuando usan caracteres extraños como comullas diferentes de la comilla simple o la doble, etc.
__________________ JHG |
| ||||
Respuesta: Problemas con caracteres acentuados y UTF-8 en scraping No necesariamente tiene que ser UTF8, debes de siempre hacerlo con el encoding que tengas, si la web ya esta en ISO, no tienes porque cambiar el encoding a UTF8, simplemente guarda los archivos PHP en ISO y no debes de tener problemas. |
| ||||
Respuesta: Problemas con caracteres acentuados y UTF-8 en scraping Cita: UTF-8 se creo precisamente para solucionar problemas, en especial de internacionalización, que no podia resolver ISO, por lo tanto todo deberia usar UTF-8 u otro unicode, practicamente todos los sistemas modernos se han modernizando pasando a codificación UTF-8 y es la recomendada por todos desde las organizaciones de estandares hasta cualquier desarrollador con dos dedos de frente. El problema no esta en mi web, sino en las web a las que hago scraping, unas son modernas y estan en UTF-8 y otras son las tipicas que hace el primo del sobrino del enchufado de turno que en ocasiones incluso estan en HTML estatico con HTML viejo anterior incluso al 4, y que ni sabe que los estandares web han evolucionado mucho desde 1995 hasta hoy en día.De todos modos ya encontre como solucionarlo, como pasar las cadenas ISO a UTF-8 no me daba buen resultado hice la inversa, para trabajar sobre cadenas ISO paso la cadena UTF-8 a ISO, opero de esa forma y luego vuelvo a pasar a UTF-8 el resultado y así si funciona.
__________________ JHG |
| ||||
Respuesta: Problemas con caracteres acentuados y UTF-8 en scraping Claro obviamente UTF-8 es "mejor" en algunos casos, todo depende de para que, si no no existiría ISO. Ahora tú comentaste que no podías hacer cambios por eso mi recomendación de usar ISO, no es para que te pongas en ese plan. Solo demuestra ignorancia si crees que uno es mejor que el otro, cada uno tiene una razón de la cual para que es usado, no puedes asumir directamente como lo estas haciendo. Saludos. |
Etiquetas: |