Ljparser

Una plataforma en desarrollo para la búsqueda web y la minería.
Descargar ahora

Ljparser Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Freeware
  • Nombre del editor:
  • LING-JOIN Software
  • Sistemas operativos:
  • Windows All
  • Tamaño del archivo:
  • 17.5 MB

Ljparser Etiquetas


Ljparser Descripción

LJPARSER es un conjunto completo de herramientas diseñadas para proporcionarle módulos potentes, incluida la búsqueda precisa de un idioma múltiple, la detección de palabras nuevas, la resumen de texto, la extracción de palabras clave, etc. Principales características: Módulo SDK de segmentación de palabras chinos: El módulo SDK de segmentación de palabras chinos puede ser un idioma chino de los textos, que es el núcleo esencial de los componentes de procesamiento de información chino. Esto utiliza la tecnología de campo aleatorio condicional (consulte como modelo de CRF), y la palabra precisión de segregación cercana al 99%, con la alta precisión, la velocidad, la adaptabilidad y la fuerte ventaja. Las características incluyen: Segmentación de grano grado ajustable de fusión. Más de 20 diccionarios específicos de la industria para apoyar los diccionarios definidos por el usuario. POS Etiquetado Módulo SDK: POS Etiquetado El módulo SDK de idioma chino puede etiquetar automáticamente parte del habla, realmente puede entender el entorno del idioma chino y se pueden laberizar automáticamente palabras como "edificio" etiquetado "sustantivo" o "verbo". Ling-Únete con modelo aleatorio condicional, una precisión de etiquetado de POS cerca del 99%, con alta precisión, velocidad, adaptabilidad y otra ventaja fuerte. Reconocimiento de las entidades nombradas chinas, incluidas las personas, las ubicaciones y las organizaciones Módulo SDK: El reconocimiento de las entidades nombradas chinas, incluidas las personas, las ubicaciones y las organizaciones, el módulo SDK puede descubrir automáticamente los nombres ocultos, los nombres de los lugares, los nombres de la organización en chino, como una comprensión profunda del idioma y la predicción, estas palabras no necesitan ser en el diccionario. Ling-Únase de unión con un modelo de campo aleatorio condicional, que tiene un 97% de precisión de reconocimiento, y la velocidad de 10 m / s, se puede construir sobre esta base, una variedad de estadísticas y una variedad de aplicaciones. Extracción de palabras clave de documentos Módulo SDK: La extracción de palabras clave de documentos Módulo SDK puede comprender completamente la idea central del artículo, en función del contenido semántico extraído del artículo en nombre de una serie de palabras o frases. Los resultados relevantes se pueden utilizar para refinar la lectura, la consulta semántica y la combinación rápida. Este modelo de lenguaje estadístico semántico basado en módulos, los documentos procesados ​​no están restringidos en los campos de la industria, y puede identificar las palabras más recientes. La salida marcará con el peso de las palabras Extracción automática de términos de dominio Módulo SDK: La extracción automática de términos de dominio, el módulo SDK es una poder potente de análisis de literatura profesional. Está en la parte superior de la tecnología de extracción de palabras clave, pero también combina la literatura profesional para el borde máximo del modelo de reconocimiento, que puede aprovechar de manera efectiva la terminología que aparece en la literatura. Análisis léxico inglés Módulo SDK: Inglés Análisis léxico Módulo SDK es el componente principal esencial para el procesamiento de información en inglés, que contiene etiquetado POS, reconocimiento de entidades nombradas, incluidas personas, ubicaciones y organizaciones. Con alta precisión, velocidad, adaptabilidad y ventaja fuerte, este módulo combinó la probabilidad de un modelo de combinación y aprendizaje de máquinas. Análisis léxico japonés Módulo SDK: El módulo de análisis léxico japonés SDK es el componente principal esencial para el procesamiento de información japonés, que contiene etiquetado POS, reconocimiento de entidades nombradas, incluidas personas, ubicaciones y organizaciones. Ling-Únete con el modelo de campo aleatorio condicional, con la alta precisión, la velocidad, la adaptabilidad y la fuerte ventaja, la precisión de la palabra cercana al 99%, y la precisión del etiquetado POS casi 98%. Texto Mining Midwares: El middleware de minería de texto incluye el texto analizado los módulos de minería, los subsistemas y las interfaces API, que se pueden integrar sin problemas en varias aplicaciones de clientes complejas. Este middleware es compatible con Windows, Linux, FreeBSD y otros sistemas operativos diferentes. El middleware de minería de texto de Ling-Join incluye el siguiente módulo SDK Suma de texto Middleware: El texto de resumen de texto puede extraer el contenido de texto, la extracción automática de un artículo largo a la oración clave y el párrafo clave, y constituye un resumen. Ling-Únase al texto Resumen de texto El middleware no solo puede generar un proceso coherente para un resumen del documento, sino también eliminar la redundancia y generar un resumen conciso; Los usuarios pueden establecer libremente la longitud del resumen, el porcentaje y otros parámetros; Este middlewware admite el procesamiento del idioma inglés y chino, y la velocidad de procesamiento hasta 20 textos por segundo. Clasificación de texto MiddleTware: De acuerdo con la literatura por tipo de contenido, clasificación de texto Middlewarecan se utilice para la clasificación de noticias, la categorización de los perfiles, la clasificación de correo, la clasificación de documentos de la oficina, la clasificación de área y muchas otras aplicaciones. Este middleware realiza una clasificación de varios niveles, y la tasa de clasificación es de hasta 100 textos por segundo, la precisión promedio del 90% o más, y también se puede clasificar en la clasificación mixta inglesa y china. Text Rusting Middleware: Grupo de texto Puede considerarse el problema de aprendizaje no supervisado más importante, se ocupa de encontrar una estructura en una colección de datos sin etiquetar. Por lo tanto, un cluster es una colección de objetos que son "similares" entre ellos y son "disímiles" a los objetos que pertenecen a otros grupos. Puede usarse en la generación automática de temas candentes, seguimiento de eventos, análisis visual de datos y muchas otras aplicaciones. Ling-Join usa la tecnología semántica principal, no solo rápido sino precisa. También puede obtener automáticamente la tendencia evolutiva entre agrupaciones. texto filtrante middleware: El texto del filtrado de texto puede identificar rápidamente la información requerida de la gran cantidad de texto, y se puede usar en la información, el filtro y la auditoría de contenido inteligentes u otros campos. Ling-Join combina el método de filtrado basado en reglas y filtrado basado en aprendizaje. La tasa de precisión promedio es más del 90%. Los usuarios tienen la flexibilidad de establecer las reglas para diferentes campos.


Ljparser Software relacionado