Texto :: Escanear

búsqueda rápida de un número muy grande de llaves en un cuerpo de texto.
Descargar ahora

Texto :: Escanear Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Perl Artistic License
  • Precio:
  • FREE
  • Nombre del editor:
  • Ira Woodhead
  • Sitio web del editor:
  • http://search.cpan.org/~tbusch/

Texto :: Escanear Etiquetas


Texto :: Escanear Descripción

Búsqueda rápida de un número muy grande de llaves en un cuerpo de texto. Texto :: Escanear es un módulo PERL que ofrece una búsqueda rápida de un número muy grande de teclas en un cuerpo de texto.Synopsis Usar Texto :: Escaneo; $ DICT = Nuevo texto :: Escaneo; % Términos = (perro => 'canino', oso => ​​'ursine', cerdo => 'porcine'); # cargar el diccionario con teclas y valores # (los valores pueden ser cualquier escalar, las teclas deben ser cadenas) mientras (($ Tecla, $ Val) = cada Términos%) {$ DICT-> Insertar ($ KEY, $ Val); } # Escanee un documento para coincide con $ Document = 'El perro comió el oso pero el perro tiene indigestión'; % encontrado = $ DICT-> Escaneo ($ Documento); # Ahora el% encontrado es (Dog => Canine, Bear => Ursine) # o, si necesita contar el número de ocurrencias de cualquier tecla #, use una matriz. Esto le dará una lista plana contable # de teclas => pares de valor. @found = $ DICT-> Escanear ($ Documento); # ahora @found es (perro => canino, oso => ​​ursine, perro => canino) # verifique que la membresía ($ val es verdadera) $ val = $ DICT-> tiene ('cerdo'); # Recuperar valor para la clave dada. Devuelve UNDEF si no se encuentra ninguna clave. $ val = $ DICT-> Val (Tecla $); # Recuperar todas las llaves. Esto devuelve todas las teclas insertadas en el orden # de inserción @Keys = $ DICT-> Teclas (); # @Keys es (perro, oso, cerdo) # recuperar todos los valores (en el mismo orden que las claves correspondientes) # (nuevo en v0.10) @vals = $ dict-> valores (); # @vals es (canino, ursine, porcine) # recuperar todo lo que insertó% todo = $ DICT-> DUMP (); # "MENDEX" # como el índice de Perl () pero con múltiples patrones (nuevo en v0.07) # Puede escanear las posiciones iniciales de los términos. @indices = $ DICT-> MINDEX ($ DOCUMENTO); # @indices es (perro => 4, oso => ​​16, perro => 29) # El contexto de hash produce la posición de las últimas ocurrencias # de cada palabra% Índices = $ DICT-> MINDEX ($ DOCUMENTO); #% Índices es (perro => 26, oso => ​​16) # Multisco () (> = v0.23) # recupera todo lo que explica () y Mindex (), en el formulario # de una matriz de referencias. Cada referencia apunta a una lista # de (clave, índice, valor) @Result = $ DICT-> Multiscan ($ documento); # @Result es (, , ) # Encienda el escaneo de comodines. (> = V0.09) # Esto se puede hacer en cualquier momento. Trabaja para escanear () y MINDEX (). Los comodines # abarcan cualquier número de caracteres no equivalentes a un solo espacio. $ DICT-> USOWILD (); # Guardar un diccionario, luego restaurarlo. (Serialize y restaure nuevo en V0.14) # Esto es genial, pero tenga cuidado, todos los valores se convertirán en cadenas. # Nota Restaurar () es mucho más rápido que la inserción original de # Tecla / Valores. Estos devuelven 0 sobre el éxito, errno en el fracaso. $ DICT-> Serialize ("DICT_NAME"); $ DICT-> Restaurar ("Dict_Name"); # Coloque una clase de equivalencia de caracteres globales en vigor. Esto coincide con todos los # estos personajes como si fueran lo mismo. (v0.17) $ DICT-> Charclass (".:;,?"); $ DICT-> Insertar ("¿Qué?", ​​"¿Qué?"); @found = $ DICT-> Scan ("Err ... ¿Qué, algo mal?"); # ahora @found es ("¿Qué," => "¿Qué?"); # Escanear caso de insensibilidad. Esto debe ser llamado antes de cualquier inserción. $ DICT-> Ignorecase (); # Establecer una clase de caracteres para ser los límites de cualquier partido, # de modo que los caracteres inmediatamente antes del principio y después del final de un partido tengan que estar en esta clase. Predeterminado es el espacio # (Inicio y finalización de la cadena siempre cuente como límites) # Esto se puede llamar en cualquier momento, y supere las llamadas anteriores. $ DICT-> Límite (".?"); # Ignorar ciertos caracteres. Puedes definir una clase de caracteres que el # Diccionario debería pretender que no existen. Debe llamar a esto antes # cualquier inserción. $ DICT-> Ignorar (" () "); # Trata a todos los caracteres contiguos de un solo espacio-espacio-equivalente # (tal como se define por Charlass ()) como un carácter. Función más solicitada últimamente, nueva en v0.25 $ DICT-> SQUEESEBLANKS; # similar al límite MÉTODO, excepto que el límite real se considera que ocurre justo antes del carácter del límite. Esto es útil # cuando el carácter de límite en sí debe coincidir en el # inicio de una coincidencia. # Por ejemplo, para buscar '-foo' En 'Bar-Foo' La siguiente clase necesita ser establecida $ DICT-> inclVerraria ('-'); Este módulo proporciona instalaciones para la búsqueda rápida en cadenas con muchas claves de búsqueda. El objeto básico se comporta un poco como un hash perl, Excepto que puede recuperarse basándose en una superversión de cualquier tecla almacenada. Simplemente escanee una cadena como se muestra arriba y recuperará un hash (o lista) Perl de todas las teclas que se encuentran en la cadena (junto con valores y / o posiciones asociados) . Todas las teclas presentes en el texto se devuelven. Hay varias formas de influir en el comportamiento del partido, C Sorprendente mediante el uso de varios tipos de clases de caracteres globales. Estos son diferentes de las clases de caracteres de expresión regular, ya que se aplican a todo el texto y para todas las llaves. Estos consisten en la clase "Ignorar", la clase "Límite", la clase "inclVerraria", y cualquier clase definida por el usuario.Using "ignorar" los caracteres, puede tener la posibilidad de escanear un carácter en el texto simplemente no existe. Esto es útil si desea evitar tokenizar su texto. Así, por ejemplo, si el período ''. Está en su clase de "Ignore", el texto se tratará exactamente como si todos los períodos se hubieran borrado. Para definir qué caracteres pueden contar como delimitador de cualquier coincidencia (espacio único de forma predeterminada) puede usar la clase "Límite". Por ejemplo, de esta manera, puede contar la puntuación como límite, y las frases delimitadas al final por puntuación coincidirán. Se pueden usar clases de caracteres definidas por el usuario para contar diferentes caracteres como los mismos. Por ejemplo, esto se usa internamente para implementar una coincidencia insensible a la caja. Texto :: Escanear actúa a nivel de octeto, por lo que no se da cuenta de cualquier cosa sobre las cadenas codificadas UNICODE / UTF8. Si se ocupa de tales cadenas, se recomienda dar las cadenas de octetos al texto :: Escanear utilizando CODE :: ENCODE_UTF8 (). Texto :: Escaneo le devolverá las cadenas de octetos, UTF8 codificó las teclas encontradas. Requisitos: · Guitone


Texto :: Escanear Software relacionado

sslh

Cambie la conexión entrante entre los servidores SSH y SSL / HTTPS. ...

168

Descargar