Etiquetas

jueves, 11 de abril de 2013

Metainformación


En general es para añadirle información de más a nuestro documento como: autor, fecha de creación , etc....


El tag META

Ahora vamos a ver una utilísima etiqueta de metainformación de uso general llamada META.
Meta se usa en la sección HEAD del siguiente modo:
<META NAME="nombre" CONTENT="contenido">
Es una etiqueta vacía (es decir, no existe la etiqueta de cierre </META>) que tiene multiples utilidades.
donde pone nombre hemos de colocar el nombre de una información que queramos definir (Luego seré más concreto), y en contenido la información concreta.
En realidad, puedes inventarte tú mismo tanto el nombre como la información a describir (cosa que puede ser muy útil de cara a trabajar con tus propios documentos. Si, por ejemplo, quieres anotar en cada página la fecha en la que la creaste, podrías inventarte una información de nombre, por ejemplo, "CREADO".
También, dado que eres un millonario diseñador de webs y cambias mucho de automovil, quieres anotar el modelo de coche que tenías en esa fecha. Para ello podrías crear otro tipo de información al que llamaremos "MI-AUTO".
De este modo, una página creada el dí 16 de Enero del año 2000, cuando tu todavía usabas tu viejo Rolls, sería algo parecido a esto:

Claro que, si este el único uso de META, no sería tampoco una gran cosa. Pero resulta que existen algunos tipos estandar de información que puedes usar en tus páginas y que pueden ser utilizados, por ejemplo, por los buscadores web (como Lycos, Yahoo o Altavista).
El primero de ellos es DESCRIPTION, que se usa para aportar una descripción de tu página. Los buscadores web u otro tipo de programas pueden obtener de aquí la descripción que les aportas, y usarla, por ejemplo, en los links que apuntan a tu página.
Otro muy importante es KEYWORDS, donde puedes poner una lista de palabras (o frases) ,separadas por comas, relaccionadas con el tema de que se habla en tu página. Cuando un navegante introduzca alguna de esas palabras en un buscador, este le devolverá tu página.
Los buscadores web normalmente usan unos programas, llamados "indexadores", "arañas" o "robots de búsqueda", que van visitando páginas automáticamente y extraen las palabras que aparecen en ellas. cuando un navegante busca una o varias palabras cualquiera en uno de estos buscadores, estos le responden con las URLs de las páginas que contienen esa palabra.
También existe otro tipo bastante popular (aunque menos útil) llamado AUTHOR, donde puedes poner el nombre del autor de la página web (el tuyo). Su utilidad va poco más allá de alimentar el propio ego (que tampoco está tan mal, si se hace con la debida moderación).
De modo que un ejemplo más útil de uso de metainformación sería así:
Una utilidad incluso más dudosa que AUTHOR es la que tiene GENERATOR, que sirve para indicar el programa o editor que se ha usado para escribir la página.
HTML 4.0 dispone de una nueva posibilidad orientada a los robots de busqueda: Se trata de que el diseñador de las páginas pueda controlar hasta cierto punto la forma en que se indexará cada una de ellas. Para ello dispone de la opción ROBOTS, cuyo contenido puede ser uno o más (separados por comas) de los siguientes:
INDEX autoriza a los robots de búsqueda a indexar la página (es la opción por defecto).
NOINDEX, al contrario que la anterior, le dice al robot que no debe indexar la página (ovbiamente, es incompatible con INDEX).
FOLLOW permite que los robots siguan los links contenidos en la página para indexarlas también, a menos que ellas contengan un NOINDEX (también es una opción por defecto).
NOFOLLOW es la opción contraria. Le dice a los robots que no sigan los links.
En caso de que no pongas una cláusula ROBOTS, se considerará que usas las opciones por defecto, es decir, como si hubieras puesto lo soguiente:
<META NAME="robots" CONTENT="index,follow">
¿Está claro?
Existen cientos de cláusulas META, pero estas son, sin duda, las más populares.
Meta tiene otro uso completamente distinto de los anteriores. Usa, en lugar de NAME, el parámetro HTTP-EQUIV, puede servir para obligar al servidor donde se hospeda la página a simular el envío por parte del servidor de ciertas cabeceras HTTP que nos interesen. Este uso es mucho más especializado, restringido, y poco soportado, de modo que, por ahora, no lo veremos muy profundamente.
El servidor Web envía cada página o documento del tipo que sea precedida por una cabecera en la que detalla algunas características de ella. Se trata de algo bastante complejo, de modo que nos limitaremos a ver algunas posibilidades inmediatas sin entrar en profundidad.
La forma de "enviar" cabeceras HTTP al navegador es esta:
<META HTTP-EQUIV="nombre" CONTENT="contenido">
Donde nombre es el nombre de la cabecera, y contenido el contenido de esta.
Por ejemplo, usando la cabecera Content-Type, le podemos informar del tipo MIME del documento (que, en las páginas web, es siempre "text/html"), pero esto es algo que el servidor ya evía por defecto. Pero con esto podemos enviar, además, la codificación de caractersque estamos usando (es decir, si son caracteres occidentales, o chinos, o árabes...). Para el caso del español, el juego de caracteres es el "iso-8859-1", con lo que nuestra etiqueta quedaría así:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
Un navegador moderno debería ser capaz de reconocer esta etiqueta y usar el juego de caracteres correspondientes (y, si no lo tiene, advertir sobre ello o solicitar su instalación). Esto es especialmente útil si tienes que escribir en codificaciones extrañas (como, por ejemplo, el chino), pero tiene otra ventaja: Podrías ahorrarte el uso de las entidades de caracter (como &aacute;, por ejemplo). Lo malo es que hay muchos navegadores que no lo reconocen, de modo que sigue siendo conveniente usarlas.
Otra cabecera útil es la que usamos para advertir de la fecha de expiración (caducidad) de un documento:
<META HTTP-EQUIV="Expires" CONTENT="fecha de expiración">
Donde fecha de expiración es una fecha con el siguiente formato:
Dia de la semana en inglésDia del mesMes en inglesAñoHora de Greenwich
Mon,8Feb199908:21:57 GMT
Con lo que nuestro ejemplo quedaría:
<META HTTP-EQUIV="Expires" CONTENT="Mon, 8 Feb 1999 08:21:57 GMT">
Una cabecera muy usada es Refresh que sirve, en los navegadores que la soportan, para indicarles cuando deben cargar una página que le indicamos. Intentaré explicarme mejor. Si incluimos la siguiente cabecera:
<META HTTP-EQUIV="Refresh" CONTENT="segundos;URL=página">
El navegador esperará el número de segundos indicado en segundos, tras los cuales cargará la página indicada en página. Veamoslo con un ejemplo:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE>Ejemplo de uso de un meta REFRESH</TITLE>

<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://psicobyte.com/html/">
</HEAD>
<BODY>

<H1>P&aacute;gina con un "refresco META"</H1>
<P>Cinco segundos despu&eacute;s de que termine de cargarse esta p&aacute;gina se cargar&aacute; automaticamente la Página principal de Edici&oacute;n Extremadamente Simple de HTML (suponiendo que tu navegador reconozca el Meta REFRESH).</P>
</BODY>
</HTML>


No hay comentarios:

Publicar un comentario