IQ
PayloadIQ
Utilidades de PayloadIQ

Limpiador de HTML

Pega HTML recargado y obtén markup limpio, semántico y legible: sin scripts ni estilos, con los atributos depurados y los divs envoltorio aplanados. Todo ocurre en tu navegador.

Cleaned, semantic HTML appears here.

Se ejecuta en tu navegador. Lo que introduces no se sube a PayloadIQ.

El Limpiador de HTML reduce el markup recargado a HTML limpio y semántico directamente en tu navegador, sin subir nada a ningún servidor. Elimina siempre scripts, estilos, comentarios, iframes y manejadores de eventos, y de forma opcional depura los atributos a una pequeña lista permitida (href, src, alt, title…), aplana los `<div>` y `<span>` envoltorio y convierte las etiquetas de presentación en sus equivalentes semánticos. Cada paso es un interruptor, así que tú decides cuán agresiva es la limpieza. El resultado es HTML legible, listo para leer, para publicar o para convertir a Markdown y dárselo a un LLM.

De la sopa de divs al HTML semántico

Cuando copias HTML de una web, un CMS o un correo, sueles arrastrar una maraña de `<div>` envoltorio, estilos en línea, clases de frameworks y atributos de seguimiento. Esta herramienta lo interpreta con el propio motor del navegador y lo reconstruye como markup mínimo y semántico: las etiquetas de presentación pasan a su equivalente real (`<b>` se convierte en `<strong>`), los contenedores de maquetación se aplanan, los atributos se reducen a una breve lista permitida de contenido y lo que queda se formatea de forma legible. Como cada paso es un interruptor independiente, controlas exactamente qué se elimina y qué se conserva.

HTML más limpio, mejor contexto para la IA

Un modelo que lee HTML paga en tokens por cada clase, estilo y envoltorio sobrante que tiene que ignorar, y la estructura suele perderse entre el ruido. El HTML semántico conserva los encabezados, las listas y las tablas que aportan significado y descarta el resto, de modo que el modelo gasta su contexto en el contenido y no en las etiquetas. También es la mejor entrada posible para convertir a Markdown: HTML limpio a la entrada significa Markdown limpio a la salida. Depúralo aquí y luego pásalo por la herramienta de HTML a Markdown para obtener el contexto más compacto que puedas darle a un LLM.

Preguntas frecuentes

¿Qué elimina exactamente el limpiador de HTML?
Siempre quita scripts, estilos, comentarios, iframes y manejadores de eventos. De forma opcional puede quitar todos los atributos salvo una pequeña lista permitida (href, src, alt, title…), las etiquetas `<div>` y `<span>` envoltorio, etiquetas de presentación como `<font>` y `<center>`, la navegación `<nav>` y `<aside>`, y los elementos que queden vacíos. Tú lo decides con los interruptores.
¿Por qué limpiar el HTML antes de dárselo a un LLM?
El HTML web en bruto es sobre todo ruido para un modelo: clases, estilos en línea, atributos de seguimiento y divs envoltorio anidados. Al reducirlo a HTML semántico se conserva el significado (encabezados, listas, tablas, enlaces) y se recorta el markup, así el modelo dedica su contexto al contenido y no a las etiquetas. Además, se convierte a un Markdown mucho más limpio.
¿Se sube mi HTML a algún servidor?
No. La limpieza se ejecuta en tu navegador usando el parser de HTML integrado. Todo lo que pegas se queda en tu dispositivo y nada se envía a ningún servidor.
¿Cómo se combina con el conversor de Markdown?
El HTML limpio es la entrada ideal para la herramienta de HTML a Markdown: un markup ordenado y semántico produce un Markdown ordenado y predecible. Límpialo aquí primero y luego conviértelo; el resultado es el mejor contexto posible para dárselo a una IA.

Utilidades relacionadas

Probador de regexVista previa de MarkdownMarkdown a HTMLGenerador de tablas Markdown
Abrir PayloadIQ Playground