Analizador html

para analizar el contenido HTML
Descargar ahora

Analizador html Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • LGPL
  • Precio:
  • FREE
  • Nombre del editor:
  • Derrick Oswald
  • Sitio web del editor:
  • Sistemas operativos:
  • Mac OS X
  • Tamaño del archivo:
  • 323 KB

Analizador html Etiquetas


Analizador html Descripción

Biblioteca para analizar el contenido HTML HTML Parser es una biblioteca de Java de código abierto y gratuita que se usa para analizar HTML en una moda lineal o anidada. Se utiliza principalmente para la transformación o extracción, HTML presenta filtros, visitantes, etiquetas personalizadas y javabeans fáciles de usar. Es un paquete rápido, robusto y bien probado. ExtrayRactionExtraction abarca todos los programas de recuperación de información que no están destinados a preservar la página de origen. Estos cubiertos se usan como: · Extracción de texto, para su uso como entrada para las bases de datos de los motores de búsqueda de texto, por ejemplo, la extracción de enlaces, para rastrear las páginas web o la recolección de direcciones de correo electrónico, para la entrada de datos programáticos de las páginas web · Extracción de recursos, recopilación de imágenes o sonido · Un extremo delantero del navegador, la etapa preliminar de la visualización de la página · Comprobación de enlaces, asegurando los enlaces son válidos · Monitoreo del sitio, verificación de las diferencias de la página más allá de la diferencia simplista. Hay varias instalaciones en la base de código HTMLPARSER para ayudar a la extracción, incluidos los filtros, los visitantes y los javuños. TransformationTransformation incluye todo el procesamiento donde la entrada y la salida son páginas HTML. Algunos ejemplos son: · Reescritura de URL, modificando algunos enlaces o todos los enlaces en una página · Captura del sitio, moviendo el contenido de la web al disco local · censura, eliminando las palabras y frases ofensivas de las páginas · Limpieza HTML, corrigiendo las páginas erróneas · Extracción de anuncios, excitantes URLS Referencias de publicidad · Conversión a XML, moviendo páginas web existentes a los requisitos XML: · Java ¿Qué hay de nuevo en este lanzamiento: · El proyecto HTMLPARSER se ha actualizado con una nueva licencia, un nuevo entorno de compilación, nuevo repositorio y un nuevo sitio web. Para identificar este cambio radical, la versión ha sido revida a 2.0. · En respuesta a las solicitudes de la comunidad de Apache, la licencia HTMLPARSER ha cambiado de la Biblioteca de GNU o la Licencia Pública General Menora, a la Licencia Pública Común 1.0 (http://opensource.org/licenses/cpl1.0.txt). . · El repositorio HTMLPARSER se ha cambiado de CVS a Subversion (http://subversion.tigris.org/). · Para apoyar la integración automática en otros proyectos, el entorno de compilación ha cambiado de ANT a Maven 2 (http://maven.apache.org/). Esto ha brindado la oportunidad de actualizar el sitio web (http://htmlparser.org).


Analizador html Software relacionado

Efivalue

Una biblioteca gratuita para proporcionar un mecanismo de serialización universal para un tipo de datos C ++ ...

44 122 KB

Descargar