Jericó HTML analizador

Una biblioteca de Java simple pero poderosa que permite un análisis y manipulación de partes de un documento HTML.
Descargar ahora

Jericó HTML analizador Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • LGPL
  • Precio:
  • FREE
  • Nombre del editor:
  • Martin Jericho
  • Sitio web del editor:

Jericó HTML analizador Etiquetas


Jericó HTML analizador Descripción

Una biblioteca de Java simple pero poderosa que permite el análisis y la manipulación de partes de un documento HTML. Jerich HTML Parser es una biblioteca de Java sencilla pero poderosa que permite un análisis y manipulación de partes de un documento HTML, que incluye algunas etiquetas comunes del lado del servidor, mientras se reproduce verbatim cualquier HTML no reconocido o no válido. También proporciona funciones de manipulación de formulario HTML de alto nivel. El proyecto LERICHO HTML PARSER es una biblioteca de código abierto que se libera en la Licencia Pública General de GNU Menor (LGPL). Por lo tanto, es libre de usarlo en aplicaciones comerciales sujetas a los términos detallados en el documento de la licencia. Aquí hay algunas características clave de "Jericho HTML Parser": · No se genera ningún árbol de análisis de todo el documento. El texto de la fuente de documentos se busca solo para el marcado relevante para la operación actual. Esto permite que la biblioteca analice y modifique los documentos que contengan HTML incorrecto o mal formateado o cualquier otro código de servidor o cliente, script, macro o markup. La mayoría de los otros parsers no pueden manejar el contenido que no están programados explícitamente para aceptar. · Las posiciones de inicio y extremo en el texto de origen de todos los segmentos analizados son accesibles, lo que permite la modificación de solo segmentos seleccionados del documento sin tener que reconstruir todo el documento desde un árbol de parse. Esta característica, en combinación con la anterior, hace que el kit de herramientas sea extremadamente poderoso en su sencillez. · Proporciona una interfaz simple pero completa para el análisis y la manipulación de los controles de forma HTML, incluida la extracción y la población de valores iniciales, y la conversión a los modos de visualización de solo lectura o de datos. El análisis de los controles de la forma también permite que los datos recibidos del formulario se almacenen y se presenten de manera adecuada. · Las etiquetas ASP, JSP, PSP, PHP y Mason Server se pueden registrar para el reconocimiento del analizador, y se reconocen con la misma precisión, ya que es posible sin incorporar analizadores reales para estos idiomas en la biblioteca. Luego, la biblioteca permite que cualquiera de estos segmentos se ignore al analizar el resto del documento para que no interfieran con la sintaxis HTML. (ver segmento.ignorewhenparsing ()) · Los tipos de etiquetas personalizados se pueden definir y registrarse fácilmente para el reconocimiento del analizador. ¿Qué hay de nuevo en este lanzamiento: Corrección de errores: · Bucle infinito en segmento.getallstarttags () · Bucle infinito en segmento.egetallements () · Segmento.getFIRST * MODOS * Los segmentos devueltos fuera del segmento delimitador. · Segmento. MétodosLimentos no devolvieron todos los elementos cerrados en algunas circunstancias. · Errores de documentación fijos en segmentos. MétodosLimentos. · Añadida la clase StreamedSource. Cambios que podrían afectar el comportamiento de los programas existentes: · Se cambió el parsetext de clase a interfaz. · Segmento.getnodeiterator () ahora devuelve las referencias de caracteres como nodos separados. · Métodos de búsqueda de etiquetas agregados basados ​​en las expresiones regulares del valor del atributo. · Se agregaron métodos de búsqueda de etiquetas basados ​​en el atributo de clase HTML. · Se agregó la fuente estática .ElegacynodeiteratorCompatabilityModeErted Propietario temporalmente para restaurar segment.getnodeiterator () funcionalidad a la de las versiones anteriores. · Quitado los métodos de búsqueda de caracteres [] en parsetext. · Método agregado de caracteres.appendcharto (apendible). · Constructor de salida de salida (segmento) agregado. · Añadido programas de muestra de StreamedSourCecopy.


Jericó HTML analizador Software relacionado

metaf2xml

Metaf2xml analiza y decodifica los mensajes MEAR y TAF y los almacena como XML. ...

122

Descargar

PDFTEX

Una versión extendida de Tex que puede crear PDF directamente de los archivos de origen de TEX ...

184

Descargar