HTML
Formato de archivo HTML (.html): Guía completa
El formato HTML es la base de toda la web moderna. Si alguna vez has abierto un navegador y visitado una página web, ya has interactuado con un archivo HTML, aunque no lo hayas notado. En esta guía explicamos en detalle qué es este formato, cómo funciona, para qué se usa y cómo puedes trabajar con él.
¿Qué es un archivo .HTML?
HTML son las siglas de HyperText Markup Language, es decir, Lenguaje de Marcado de Hipertexto. Un archivo con extensión .html (o .htm en su versión abreviada heredada de sistemas más antiguos) es un documento de texto plano que contiene código escrito en este lenguaje. Los navegadores web interpretan ese código y lo representan visualmente como la página que el usuario ve en pantalla.
El concepto de HTML fue propuesto por Tim Berners-Lee en 1989 mientras trabajaba en el CERN, en Suiza. Su objetivo era crear un sistema que permitiera compartir documentos científicos entre investigadores de diferentes instituciones de forma sencilla. En 1991 se publicó la primera descripción formal del lenguaje, con apenas 18 etiquetas. Desde entonces, HTML ha evolucionado considerablemente a través de varias versiones: HTML 2.0, HTML 3.2, HTML 4.01, XHTML y finalmente HTML5, la versión actual, estandarizada por el W3C y el WHATWG, que introdujo soporte nativo para audio, vídeo, gráficos vectoriales y APIs avanzadas sin necesidad de plugins externos.
Especificaciones técnicas del formato HTML
A diferencia de formatos como JPEG o MP4, HTML no es un formato multimedia sino un formato de marcado basado en texto. Sus características técnicas son las siguientes:
- Tipo de contenido: Texto plano estructurado mediante etiquetas (tags) encerradas entre signos de menor y mayor (
< >). - Codificación de caracteres: Generalmente UTF-8, aunque también admite ISO-8859-1 y otras codificaciones. La declaración de codificación se incluye en la etiqueta
<meta charset>. - Compresión: Los archivos HTML en sí no aplican compresión interna, pero los servidores web suelen transmitirlos comprimidos mediante Gzip o Brotli para reducir el tiempo de carga.
- Profundidad de color y resolución: Al ser un formato textual, HTML no tiene profundidad de color ni resolución propia. Estas propiedades corresponden a los recursos embebidos (imágenes, vídeos) que el documento referencia.
- Tamaño típico: Un archivo HTML estático suele pesar entre unos pocos kilobytes y varios cientos de kilobytes, dependiendo de la cantidad de contenido incrustado directamente en el código.
- Versión actual: HTML5, mantenida como estándar vivo (living standard) por el WHATWG.
- MIME type: text/html, que es el tipo de contenido que los servidores envían al navegador para identificar el archivo.
- Extensiones relacionadas: .htm, .xhtml, .shtml.
Un archivo HTML se estructura en dos grandes secciones: el <head>, que contiene metadatos, títulos, referencias a hojas de estilo CSS y scripts; y el <body>, que incluye el contenido visible de la página como textos, imágenes, tablas y formularios.
Usos comunes de los archivos HTML
Los archivos HTML tienen una presencia enorme en el mundo digital. Estos son algunos de sus usos más habituales:
- Construcción de sitios web y aplicaciones web de todo tipo.
- Creación de correos electrónicos con formato enriquecido (HTML email).
- Documentación técnica y manuales de software distribuidos en formato web.
- Exportación de documentos desde procesadores de texto como Microsoft Word o Google Docs.
- Generación de informes y dashboards por parte de herramientas de análisis de datos.
- Almacenamiento local de páginas web guardadas desde el navegador.
- Desarrollo de interfaces para aplicaciones de escritorio mediante tecnologías como Electron.
Ventajas y desventajas del formato HTML
Como cualquier formato, HTML tiene puntos fuertes y limitaciones que conviene conocer:
| Ventajas | Desventajas |
|---|---|
| Universalmente compatible con todos los navegadores modernos | Sin CSS y JavaScript, el diseño es muy básico |
| Formato de texto plano, fácil de editar con cualquier editor | No es ideal para documentos con maquetación compleja tipo PDF |
| Gratuito y abierto, sin licencias propietarias | El código puede volverse difícil de mantener en proyectos grandes |
| Excelente soporte de accesibilidad e indexación por buscadores | Depende de recursos externos (imágenes, CSS, JS) para funcionar correctamente |
| Ideal para compartir contenido en la web de forma ligera | La seguridad puede verse comprometida si se permite HTML no controlado por el usuario |
Cómo abrir y visualizar archivos HTML
Una de las grandes ventajas del formato HTML es que prácticamente cualquier dispositivo puede abrirlo sin necesidad de software especial. Aquí tienes las opciones más comunes:
- Google Chrome, Mozilla Firefox, Microsoft Edge, Safari: Cualquier navegador web moderno puede abrir y renderizar archivos HTML con solo arrastrar el archivo a la ventana del navegador o usar la opción "Abrir archivo".
- Visual Studio Code: Editor de código gratuito de Microsoft, muy popular entre desarrolladores, que ofrece resaltado de sintaxis y previsualización en vivo.
- Sublime Text y Atom: Editores de texto ligeros con soporte para HTML.
- Notepad++ (Windows): Editor gratuito ideal para visualizar y editar archivos HTML en Windows.
- Adobe Dreamweaver: Herramienta profesional para diseño y edición de páginas web con vista de código y vista de diseño simultáneas.
- Bloc de notas / TextEdit: Los editores de texto básicos del sistema operativo también pueden abrir archivos HTML, aunque solo mostrarán el código en crudo.
Cómo convertir archivos HTML en línea
En ocasiones necesitas transformar un archivo HTML a otro formato, ya sea para compartirlo más fácilmente, imprimirlo o procesarlo con otras herramientas. Las conversiones más frecuentes incluyen HTML a PDF, HTML a imagen (PNG o JPG), o HTML a texto plano.
Para realizar estas conversiones de forma rápida y sin instalar ningún programa, puedes usar Metric Converter (metric-converter.com), una herramienta gratuita en línea que permite convertir archivos HTML a distintos formatos en pocos segundos directamente desde el navegador. Solo tienes que subir tu archivo, elegir el formato de destino y descargar el resultado.
También existen otras herramientas de conversión como CloudConvert, Zamzar o ILovePDF para casos específicos como la conversión a PDF. Sin embargo, para conversiones generales de archivos, Metric Converter ofrece una interfaz sencilla y soporte para múltiples formatos sin necesidad de registrarse.
Preguntas frecuentes sobre el formato HTML
¿Cuál es la diferencia entre un archivo .html y uno .htm?
Prácticamente ninguna desde el punto de vista técnico. La extensión .htm surgió como alternativa en los tiempos de MS-DOS, que limitaba las extensiones de archivo a tres caracteres. Hoy en día ambas extensiones funcionan exactamente igual en todos los navegadores y servidores web modernos. La extensión .html es la más utilizada actualmente.
¿Es lo mismo HTML que un archivo de página web completo?
No exactamente. Un archivo HTML contiene la estructura y el contenido textual de una página, pero una página web completa suele depender de archivos adicionales: hojas de estilo CSS para el diseño visual, archivos JavaScript para la interactividad, e imágenes u otros medios. Cuando guardas una página web completa desde el navegador, este descarga también todos estos recursos asociados.
¿Se puede editar un archivo HTML sin saber programar?
Sí, aunque con limitaciones. Los archivos HTML son texto plano, por lo que cualquier editor de texto básico permite abrirlos y modificar el contenido visible entre las etiquetas. Sin embargo, para cambiar el diseño o la estructura de forma significativa, es recomendable tener nociones básicas de HTML y CSS. Existen también editores visuales como Wix o WordPress que permiten crear y editar páginas HTML sin escribir código directamente.
¿Un archivo HTML puede contener virus o malware?
Aunque HTML en sí mismo es texto, un archivo HTML puede incluir código JavaScript malicioso que se ejecute al abrirlo en el navegador. Por este motivo, es importante no abrir archivos HTML de fuentes desconocidas o no confiables, especialmente si los has recibido por correo electrónico sin esperarlos. Los navegadores modernos incorporan mecanismos de seguridad que bloquean muchos de estos ataques, pero no son infalibles.