Sopa de etiqueta

Tagsoup es un analizador SAX2 escrito en Java.
Descargar ahora

Sopa de etiqueta Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • GPL
  • Precio:
  • FREE
  • Nombre del editor:
  • John Cowan
  • Sitio web del editor:
  • http://mercury.ccil.org/~cowan/XML/tagsoup/

Sopa de etiqueta Etiquetas


Sopa de etiqueta Descripción

Tagsoup es un analizador SAX2 escrito en Java. Tagsoup es un analizador SAX2 escrito en Java que, en lugar de analizar XML bien formado o válido. Tag Sop Soup Parses HTML Como se encuentra en la naturaleza: desagradable y brutal, aunque muy a menudo lejos de corto de corto. Proporcionar una interfaz SAX, permite que se apliquen las herramientas XML estándar para el peor HTML. Es un analizador, no una aplicación completa; No está destinado a limpiar permanentemente, HTML incorrecto, ya que HTML Tidy hace, solo para analizarlo en la mosca. Las siguientes opciones se entienden: - Se cambian los archivos en archivos individuales, con extensiones HTML cambiadas a XHTML. De lo contrario, toda la salida se envía a la salida estándar. - La salidaHTML está en HTML limpia: la declaración XML se suprime, al igual que las etiquetas final para los elementos vacíos conocidos. - Declaración de la XML-XML La declaración XML se suprime. --MetHod = Las etiquetas terminales HTML para los elementos HTML vacíos conocidos se suprimen. La salida --pyx está en formato PYX. La entrada depyxin está en formato PyXoid (no necesita estar bien formado). --Nons Los espacios de nombres son suprimidos. Normalmente, todos los elementos están en el espacio de nombres XHTML 1.x, y todos los atributos no están en ningún espacio de nombres. - Se suprimen los cocheras denobogones (elementos desconocidos). Normalmente, son tratados como vacíos. --NodeFaults Suppress suprimir los valores de atributos predeterminados :Nocolones Cambie los colones explícitos en el elemento y los nombres de los atributos a los subrayos. Norestart No reinicie ningún elemento normalmente reiniciable para que se administren un modelo de contenido de cualquier modelo en lugar de vacío. - Tiempo pase a través de los comentarios de HTML. No tiene efecto cuando la salida está en formato PYX. --Reuse Reutilice una sola instancia del analizador de etiquetas en todo. Normalmente, uno nuevo es instanciado para cada archivo de entrada. --Nocdata Cambie los modelos de contenido de los elementos de guión y estilo para tratarlos como elementos ordinarios #pcdata (solo texto), como en XHTML, en lugar de con el modelo de contenido de CDATA especial. --Encoding = Codificación Especifique la codificación de entrada. El valor predeterminado es el valor predeterminado de la plataforma Java. --Help Imprimir Ayuda. --version Imprima el número de versión. Requisements: · Java 1.4.2 o más tarde, lo que es nuevo en esta versión: · El problema principal fue con los comentarios de HTML, que estaban muy mal rotos: cualquier personaje finalizaría uno, por lo que comentando los elementos no lo hicieran. Trabaja correctamente. Ahora, ahora debería ser correcto. · Todo el mundo debe actualizar quién puede. · Además, #xnnnn (con Capital X) ahora funciona, se eliminó un código de depuración de Pyxwriter, se omite un BOM de Unicode al comienzo de un documento. , y la nueva versión de Saxon se admite como un procesador XSLT. · La documentación se ha agregado en las funciones de SAX y las propiedades específicas de Tagsoup.


Sopa de etiqueta Software relacionado

escorbuto

Scurvy convierte un formato de texto simple para el formato de guión adecuado. ...

76

Descargar