Texto, Formatos y usos

baudot En informática los archivos de texto te diferentes tipos, se han usado a lo largo de toda su historia. El formato de cada archivo dependía originalmente de los formatos que cada equipo daba al mapa de caracteres de su sistema, así pues habían sistemas a partir del código BAUDOT, como el EBCDIC (Extended Binary Coded Decimal Interchange Code) o el ASCII (Código estándar estadounidense para el intercambio de información, American Standard Code for Information Interchange).

ASCII Este ultimo fue que el que se impuso en la mayoría de los PCs, aunque en un comienzo se hablo de ASCII básico y extendido. El ASCII básico lo componían los primeros 128 caracteres de la tabla (0-127), mientras que el extendido lo componían los caracteres 128 al 255. Esta segunda parte servia para elementos particulares de idiomas y equipos. Por ejemplo, encontramos las vocales acentuadas en cualquiera de sus formas, los caracteres especiales franceses y alemanes y algunos elementos como el símbolo del “²” indicando el cuadrado o el circulo “º” que indica grados, el símbolo del copyright “©” o el de Marca Registrada “®”.

codigos oem Se hizo de esta forma para que cualquier carácter se pudiera representar con 8 bits (1 byte) de datos, es decir, con un valor entre 0 y 255 deberían poderse representar todos los caracteres en todos los idiomas. Para poder simplificar y puesto que habían idiomas cuyos caracteres eran totalmente diferentes al resto del mundo, se creó una cosa llamada paginas de códigos OEM del sistema. Con esto se conseguía que simplemente enviando un carácter de 6 bits antes del carácter que queríamos enviar, cambiaba la tabla de códigos del carácter que iba a continuación y así nos servían para cualquier idioma.Editores y procesadores

 Basándose en esta forma de hacer las cosas, todos los editores y procesadores de textos han usado protocolos propios para poder variar cosas en el texto. Desde un editor de texto plano como el Notepad incluido en el propio Windows que muestra el texto tal cual a un procesador de textos como el Word o el Writter del Acrobat en los cuales se usan bytes auxiliares para poder representar tipos de letra, tamaños, formas, posiciones, etc.

 Una variación de este último planteamiento es el que se usa para estandarizar presentaciones e intercambio de datos mediante etiquetas que informan de lo que contiene o de que forma se debe representar cada párrafo escrito. En realidad se trata de archivos de texto plano que un programa se encarga de interpretar. Algunos ejemplos de esto, son el código HTML usado para paginas Web o el XML que se usa para intercambio de datos e incluso las paginas generadas en cualquier “Wiki” que use el estándar de Wikimedia. Wikimedia

 Con esta breve explicación, intento que se comprenda la importancia de los archivos de texto plano, que han sido usados por todos los sistemas operativos y por todas las empresas que se han dedicado y se dedican a la informática.

HTML y W3C

Mosaic Mirando internet desde nuestra perspectiva temporal, nos damos cuenta de la cantidad de problemas y escollos que ha tenido que salvar para llegar a su estado actual. La comunicación de los primeros ordenadores con los antiguos sistemas operativos, que permitía una cantidad muy limitada de funciones en cuanto a comunicación de datos y menos todavía a nivel de visualización “amigable” de los datos comunicados, se vio pronto desbordada por la inclusión en la red de ordenadores diferentes y sistemas operativos de lo mas variado.web 2.0

 La base de la comunicación por paquetes y mediante TCP/IP quedaron definidos casi en el comienzo de la red, pero funcionalidades como las actuales y elementos de uso frecuente como blogs, rss, foros, etc, estaban todavía por venir

 Aunque fue un invento más bien tardío, el elemento que dio el espaldarazo final a internet, fue la creación del navegador. Desde el Incipiente Mosaic, a los ampliamente difundidos Netscape e Internet Explorer o finalmente los reconocidos Firefox, Chrome, Safari u Opera, no han dejado de evolucionar.

html Pero para que todo esto no se desmadrara, han hecho falta dos cosas:

 La primera, un lenguaje que todos estos navegadores consiguieran entender e interpretar de forma coherente. Ese honor le correspondió al HTML (HyperText Markup Language) que junto al HTTP (HyperText Transfer Protocol, Protocolo de Transferencia de HiperTexto) fueron la base para poder usarlos.W3C

 La segunda, alguien que pusiera orden en el caos que se podría producir si cada creador de un navegador, usara su propio “dialecto” del HTML. Los encargados de esto, han sido las personas del W3C (World Wide Web Consortium). Crearon las normas para que la interpretación de los navegadores y la creación de páginas web, fueran lo más homogéneas posible.

 Podemos imaginarnos los problemas que podríamos tener si hubiese que ir convirtiendo un lenguaje a otro al no haber establecido unas normas básicas. A pesar que las normas estén establecidas como una guía, no como una ley. Es por ello que muchas veces veremos que hay partes de páginas o cosas concretas en la web, que no se ajustan a la norma.fuente pagina web

 Un ejemplo de que veríamos si abrimos en formato de texto, lo que hay en una página web lo más básica posible, es:

<html>

<head>

</head>

<body>

Cuerpo de la página.

</body>

</html>

html5 Lo cual nos muestra una serie de marcas incluidas entre los caracteres “<>” que nos indican su comienzo <…> y su final </…> para saber que todo lo que se incluye entre estas dos marcas, pertenece a lo que establece la marca (head=cabecera, body=cuerpo, etc).

 La necesidad de nuevos elementos y funcionalidades en las paginas, ha hecho que el HTML evolucione hasta convertirse en el HTML5 (HTML versión 5), del cual ya comentaré cosas más adelante.