Apache tika

Un kit de herramientas de análisis de contenido de código abierto y gratuito distribuido por la Fundación Apache
Descargar ahora

Apache tika Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • tika.apache.org
  • Precio:
  • FREE
  • Nombre del editor:
  • The Apache Software Foundation

Apache tika Etiquetas


Apache tika Descripción

Apache Tika es un kit de herramientas de código abierto diseñado para detectar y extraer metadatos, así como contenido de texto estructurado de varios documentos, no usando nada más que las bibliotecas de parser existentes. Apache Tika admite los siguientes formatos de documentos: Idioma de marcado de hipertexto (HTTP), Formatos XML y Derivados, Formatos de documentos de Microsoft Office, Formato de OpenDocument (ODF), Formato de documento portátil (PDF), Formato de publicación electrónica (EPF), Formato de texto enriquecido (RTF). ), formatos de compresión y embalaje, formatos de texto / audio / imagen / video, el formato Mbox y los archivos y archivos de clase Java. Anteriormente, Apache Tika era un subproyecto de la Biblioteca de Software Apache Lucene. Ahora se distribuye como un paquete independiente por la Fundación Software Apache.


Apache tika Software relacionado

Archweb

Este proyecto proporciona el archivo e instrucciones necesarios para crear un sitio web similar con el utilizado ... ...

103

Descargar

Apache Uimafit

Este proyecto proporciona anotaciones Java para describir los componentes de UIMA en el código de Java ...

56

Descargar

Apache Uima

El proyecto de arquitectura de gestión de información no estructurada de Apache para Oses Linux ...

61

Descargar

Ágiles

El marco de código abierto para el desarrollo ágil con los sitios de Oracle WebCenter (Fatwire Content Server) ...

73

Descargar