Foros del Web » Creando para Internet » HTML »

¿Qué caracteres debo escapar al usar UTF-8?

Estas en el tema de ¿Qué caracteres debo escapar al usar UTF-8? en el foro de HTML en Foros del Web. Hola a todos. Estoy en duda con el tema de los caracteres especiales. Como estoy codificando mis archivos en UTF-8 sin BOM y declarando mis ...
  #1 (permalink)  
Antiguo 29/06/2011, 22:06
 
Fecha de Ingreso: julio-2008
Ubicación: Córdoba, Argentina
Mensajes: 266
Antigüedad: 16 años, 5 meses
Puntos: 26
¿Qué caracteres debo escapar al usar UTF-8?

Hola a todos.
Estoy en duda con el tema de los caracteres especiales. Como estoy codificando mis archivos en UTF-8 sin BOM y declarando mis documentos de igual manera, quisiera asegurarme de cuáles son los caracteres que debo escribir de la forma tradicional. Por ejemplo, el validador del W3C marca error si coloco un ampersand en vez de &, pero con otros caracteres no sucede, aunque pienso que puede ser proque el validador no tiene forma de corroborar todo. Por ejemplo, el signo > no sé si puedo escribirlo de esa forma en el código fuente o necesito colocarlo como >, lo mismo con las comillas " que son ". Las letras con acentos y eñes supongo que puedo escribirlos así sin problema.
Un saludo.
  #2 (permalink)  
Antiguo 30/06/2011, 07:39
Avatar de emprear
Colaborador
 
Fecha de Ingreso: junio-2007
Ubicación: me mudé
Mensajes: 8.388
Antigüedad: 17 años, 5 meses
Puntos: 1567
Respuesta: ¿Qué caracteres debo escapar al usar UTF-8?

RabidFish:

En realidad no debería "escapar" ningun caracter en función del charset. Revisá esta página para darte una idea de lo que soporta utf-8
http://www.cl.cam.ac.uk/~mgk25/ucs/e...UTF-8-demo.txt

Ahora, que por lo que planteas del validador, es cierto, hay ciertos caracteres que deberás escribir como entidades, el más común es &, que entre otras cosas es muy comun usarlo como concatenador de las query_strings, se debe pasar como &.

En el caso de < >, la razón tambien es otra, no el juego de caracteres, imaginate que queres representar en tu página un código html de ejemplo, si vos pusieses
Las imágenes se insertan asi
<img src="logo.jpg" alt="" />
deberías escribirlo como
&lt;img src='logo.jpg' alt='' /&gt;
para evitar que el navegador lo interprete como una imagen en si misma.

Seguramente hay otros casos que en la medida de que dearrolles páginas se te van a presentar. Pero te repito los casos que planteaste no tienen que ver con la codificación


Saludos
__________________
La voz de las antenas va, sustituyendo a Dios.
Cuando finalice la mutación, nueva edad media habrá
S.R.
  #3 (permalink)  
Antiguo 30/06/2011, 21:19
 
Fecha de Ingreso: julio-2008
Ubicación: Córdoba, Argentina
Mensajes: 266
Antigüedad: 16 años, 5 meses
Puntos: 26
Respuesta: ¿Qué caracteres debo escapar al usar UTF-8?

emprear, gracias por tu respuesta.
Tenés razón, creo que en realidad no tiene que ver con la codificación, pero claro, el tema es que hay determinados caracteres que son utilizados por el propio HTML, como <, >, " y &. Por lo tanto, creo que lo correcto sería escribir estos caracteres con entidades para no confundir con el código HTML. Pero además de esos, ¿hay otros caracteres que debería escribir con entidades?
Un saludo.
  #4 (permalink)  
Antiguo 30/06/2011, 21:37
Avatar de emprear
Colaborador
 
Fecha de Ingreso: junio-2007
Ubicación: me mudé
Mensajes: 8.388
Antigüedad: 17 años, 5 meses
Puntos: 1567
Respuesta: ¿Qué caracteres debo escapar al usar UTF-8?

RabidFish:

El caso de & es muy comun, ya que algo como esto
index.php?marca=toyota&modelo=corolla puesto en un link, te va a generar errores en el validador hay queponerlo como index.php?marca=toyota&amp;modelo=corolla

Con los caracteres latinos Á a Ñ, etc, si estas con utf-8 no hay problemas, mirá el link del archivo de texto de mi post previo.

Con < >, es muy sencillo, si queres que eso aparezca literalmente usas la entidad html, para evitar que el browser lo interprete como alguna apertura o cierre de etiqueta (aunque tampoco es imprescindible si los estás usando en forma aislada).

Si yo pongo en mi html
4 es < 5 , no pasaría nada, las comillas, simples o dobles, tampoco hay problema,...
Para sacarte de la duda hacete un html, y experimenta a ver que pasa


Saludos
__________________
La voz de las antenas va, sustituyendo a Dios.
Cuando finalice la mutación, nueva edad media habrá
S.R.
  #5 (permalink)  
Antiguo 30/06/2011, 22:21
 
Fecha de Ingreso: julio-2008
Ubicación: Córdoba, Argentina
Mensajes: 266
Antigüedad: 16 años, 5 meses
Puntos: 26
Respuesta: ¿Qué caracteres debo escapar al usar UTF-8?

Gracias de nuevo.
Con el símbolo > el validador no me dio problemas, algo que sí pasaba con el ampersand en las URL como bien mencionaste. Sin embargo me entró la duda de si el validador podría saltearse los símbolos < y > por error y por eso decidí postear. Voy a optar por no usar entidades ya que me es más cómoda la lectura del código fuente porque nunca uso vista de Diseño, cualquier cosa reemplazaré por las entidades correspondientes.
Un saludo.
  #6 (permalink)  
Antiguo 02/07/2011, 10:49
Avatar de zerokilled
Javascripter
 
Fecha de Ingreso: abril-2009
Ubicación: Isla del Encanto, La Borinqueña [+>==]
Mensajes: 8.050
Antigüedad: 15 años, 8 meses
Puntos: 1485
Respuesta: ¿Qué caracteres debo escapar al usar UTF-8?

Cita:
Iniciado por RabidFish Ver Mensaje
Pero además de esos, ¿hay otros caracteres que debería escribir con entidades?
no necesitas utilizar entidades html, al menos no mientras la codificacion que estes utilizando te permita escribir el caracter literalmente, con excepcion de los caracteres <, >, " y & porque estos tienen un significado especial en la sintaxis html.
__________________
la maldad es una virtud humana,
y la espiritualidad es la lucha del hombre contra su maldad.

Etiquetas: caracteres, escapar, utf-8
Atención: Estás leyendo un tema que no tiene actividad desde hace más de 6 MESES, te recomendamos abrir un Nuevo tema en lugar de responder al actual.
Respuesta




La zona horaria es GMT -6. Ahora son las 12:15.