Lingua :: en :: resumir

Una herramienta simple para resumir cuerpos de texto en inglés.
Descargar ahora

Lingua :: en :: resumir Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Perl Artistic License
  • Precio:
  • FREE
  • Nombre del editor:
  • Dennis Taylor
  • Sitio web del editor:
  • http://www.funkplanet.com/spellcast/

Lingua :: en :: resumir Etiquetas


Lingua :: en :: resumir Descripción

Una herramienta simple para resumir cuerpos de texto en inglés. Lingua :: en :: Summarice es una herramienta simple de Perl para resumir los organismos de texto en inglés.Synopsis Use Lingua :: en :: resumir; My $ Resumen = resumir ($ texto); # Fácil, no? :-) My $ resumen = resumir ($ texto, maxlength => 500); Resumen # 500-byte My $ Resumen = resumir ($ texto, filtro => 'html'); # Strip HTML Formateo My $ Resumen = Resumir ($ Texto, Wrap => 75); # Envolver salida a 75 col.Este es un módulo simple que hace un esfuerzo no científico al resumir el texto en inglés. Reconoce los patrones simples que parecen afirmaciones, los abrevian y los concatenan en algo vagamente parecido a un resumen. Necesita más trabajo en grandes cuerpos de texto, pero parece tener un efecto decente en pequeñas insumos en el momento.La pluma :: en :: Resumir exporta una función, resumir (), que toma el texto para resumir como su primer argumento y cualquier número de directivas opcionales en nombre => Formulario de valor. Las opciones que tomará son: MAXLLENGE Especifica la longitud máxima, en bytes, de la resumen generada. Sityprints la salida de resumen enviándola al número de columnas que especifique.Filter pasa el texto a través de un filtro antes de entregarlo el resumidor. Actualmente, solo se implementan dos filtros: "HTML", que utiliza HTML :: TreeBuilder y HTML :: FormatTEXT para desnudar todo el formato HTML desde un documento y "EasyHTML", que rápidamente (y menos con precisión) tira todo HTML de un documento Usando una expresión regular simple, si no tiene los módulos mencionados anteriormente. Un filtro de "correo electrónico", para convertir los mensajes de correo y noticias para un texto fácilmente resumido, está en las obras para la próxima versión. Con un módulo HTML :: Sumarizar (que es bastante interesante y vale la pena look), este módulo considera su Entrada para ser un texto en inglés simple, y no intenta recopilar ninguna información del formato. Por lo tanto, sin indicaciones del formato del documento, el esquema que HTML :: Resumir los usos no es aplicable aquí. El esquema actual va algo así: "Filtra el texto de acuerdo con la opción Filtro del usuario. Divida el texto en oraciones discretas con el módulo de texto :: Frase, luego divídalos en cláusulas en comas y semicolones. Mantén solo los que tienen A (sujeto a objeto muy simple-verbo) estructura. Construir el resumen de las primeras oraciones en la lista, permanecer dentro del límite de longitud máxima, o menos del 30% del tamaño del texto original, lo que sea más pequeño. "No hace falta decirlo. , este es un esquema muy simple y no terriblemente universalmente efectivo, pero es lo suficientemente bueno para un primer borrador, y lo golpearé más después. Como dije, no es un enfoque científico para el problema, pero es mejor que nada (y, a menudo, mejor que HTML :: ¡Resumir!), Y realmente no necesito a.i. Salida de calidad de ella. Requisitos: · Perl


Lingua :: en :: resumir Software relacionado