pipa de caldera

Una biblioteca de Java para la extracción de eliminación de la placa de calderas y la extracción de texto completo de las páginas HTML
Descargar ahora

pipa de caldera Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Apache
  • Nombre del editor:
  • Christian Kohlschütter
  • Sitio web del editor:
  • http://code.google.com/u/@UBhURFFSDxBAWAV8/
  • Sistemas operativos:
  • Mac OS X
  • Tamaño del archivo:
  • 2 MB

pipa de caldera Etiquetas


pipa de caldera Descripción

BoilerPipe es una biblioteca Java gratuita y de código abierto que proporciona a los algoritmos para detectar y eliminar el superávit "Clutter" (plantilla, plantillas) alrededor del contenido textual principal de una página web.BoilerPipe ya proporciona estrategias específicas para tareas comunes (por ejemplo: Noticias extracción de artículos) y también se puede ampliar fácilmente para la configuración de problemas individuales. El contenido de Extraería es muy rápido (milisegundos), solo necesita el documento de entrada (no se requiere información global o de nivel del sitio) y generalmente es bastante precisa. Instrucciones de correo electrónico sobre cómo instalar. y use la utilidad de la caldera en su Mac están disponibles aquí. BoilerPipe es una utilidad multiplataforma capaz de funcionar en cualquier sistema operativo que viene con el soporte de Java (por ejemplo, Mac OS X, Windows, Linux).


pipa de caldera Software relacionado