Salida Clasificación y resumen
- Nombre del editor:
- Konrad Rieck
- Sistemas operativos:
- Mac OS X
- Tamaño del archivo:
- 513 KB
Salida Etiquetas
Salida Descripción
Una herramienta para incrustar cadenas. Sally es una herramienta simple, fácil de usar, pequeña y abierta para asignar un conjunto de cuerdas a un conjunto de vectores. Este mapeo se conoce como incrusta y permite aplicar técnicas de aprendizaje de máquinas y minería de datos para el análisis de datos de cadena. Sally puede aplicarse a varios tipos de datos de cadena, como documentos de texto, secuencias de ADN o archivos de registro, donde puede manejar formatos comunes, como directorios, archivos y archivos de texto de datos de cadena. Implementa una técnica estándar para un vector de cadenas de mapeo a un vector Espacio que a menudo se conoce como modelo de espacio de espacio o modelo de bolsa de palabras. Las cadenas se caracterizan por un conjunto de características, donde cada característica está asociada con una dimensión del espacio vectorial. Los siguientes tipos de características son compatibles con Sally: Bytes, palabras, n-gramos de bytes y n-gramos de palabras. Nota: Se puede acceder a las instrucciones de instalación detalladas aquí. Requisitos: · Libconfig 1.4 o posterior · Libarchive 2.7 o posterior ¿Qué hay de nuevo en este lanzamiento: · Nota añadida sobre la dimensionalidad. · Configure.in: Versión Cambiar · Corrección de errores menor en el módulo de salida · Gitignore, cambios, compilación, doc / sally.cfg, doc / sally.pod, · SRC / OUTPUT / makeFile.am, SRC / OUTPUT / OUTPUT.C, SRC / OUTPUT / OUTPUT_CLUTO.C, · SRC / OUTPUT / OUTPUT_CLUTO.H: primera versión del módulo de salida para Clutto · CAMBIOS, README, TODO, CONFIGURATE.IN, DOC / Makefile.am, SRC / FVEC / FHASH.C · Añadido archivo de configuración faltante
Salida Software relacionado