Www :: spyder

www :: Spyder es un módulo PERL que actúa como una araña web.
Descargar ahora

Www :: spyder Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Perl Artistic License
  • Precio:
  • FREE
  • Nombre del editor:
  • Ashley Pond V.
  • Sitio web del editor:
  • http://search.cpan.org/~ashley/WWW-Spyder-0.18/Spyder.pm

Www :: spyder Etiquetas


Www :: spyder Descripción

Www :: Spyder es un módulo Perl que actúa como una araña web. Www :: Spyder es un módulo PERL que actúa como una Web Spider.A Spider Web que devuelve texto sin formato, HTML y otra información por página se arrastró y puede determinar qué páginas se obtienen y se anotan en función de los términos suministrados en comparación con el texto en los enlaces así como el contenido de la página. Pethods $ Spyder-> Nuevo () construye un nuevo objeto Spyder. Sin al menos el conjunto de semillas (), o go_to_seed () encendida, el Spyder no está listo para rastrear. $ SPYDER = www :: Spyder-> Nuevo (Shift || Die "gimme una URL! N"); # ... o ... $ SPYDER = www :: Spyder-> Nuevo (% Opciones); Las opciones incluyen: Sleep_Base (en segundos), exit_on (hash de métodos y configuraciones). Ejemplos a continuación. $ Spyder-> Semilla ($ URL) agrega una URL (o URL) a la parte superior de las colas para rastrear. Si el Spyder está construido con un solo argumento escalar, que se considera la semilla_url. $ Spyder-> Bell () Esto imprimirá una campana ("A") a STDERR en cada página de rastreo correctamente. Puede parecer molesto, pero es una excelente manera de saber que su Spyder se está comportando y funcionando. El verdadero valor lo enciende. En este momento no se puede desactivar. $ Spyder-> Spyder_Time () devuelve segundos primos desde que se creó Spyder si se le da un valor booleano, de lo contrario regresa "D día (s) HH :: MM: SS." $ Términos de Spyder-> () Cuantos más términos, más se agarra el Spyder. Si le da una lista directa de cuerdas, se convertirán en regulares muy abiertos. E.G.: "King" coincidiría "Sulking" y "Kinglet", pero no "Rey". Es distingue entre mayúsculas y minúsculas en este momento. Si desea un comportamiento más específico o un comportamiento diferente, pase sus propios regexes en lugar de cadenas. $ SPYDER-> Términos (QR / Bkings? B / I, QR / Bquens? B / I); Los términos () solo se configuran una vez en este momento, entonces es un trato hecho. $ Spyder-> Spyder_Data () un número formateado por comas de kilobytes recuperados hasta ahora. No le dé un argumento. Es un conjunto / obtener rutina. $ Spyder-> Durne () Devuelve el número total de segundos que el Spyder ha dormido mientras se ejecuta. Útil para obtener conteos de página / tiempo precisos (rendimiento de Spyder) con descuento de las NAPTSY NAPTSY agregadas. $ SPYDER-> UA -> ... The LWP :: UserAgent. Puede restablecerlos, creo, llamando los métodos en la UA. Estos son los valores inicializados que quizás desee ajustar (consulte LWP :: Useragent para obtener más información): $ SPYDER-> UA-> Tiempo de espera (30); $ SPYDER-> UA-> MAX_SIZE (250_000); $ Spyder-> UA-> Agente ('Mozilla / 5.0'); Cambiar el nombre del agente puede perjudicar a su Spyder B / C Algunos servidores no devolverán el contenido a menos que se solicite un "navegador" que reconocen. Probablemente deberías agregar su correo electrónico con desde () también. $ Spyder-> UA-> de ('bluefintuna@fish.net '); $ Spyder-> cookie_file () viven en $ env {home} / spydercookie de forma predeterminada, pero puede configurar su propio archivo si lo prefiere O desee guardar diferentes archivos de cookies para diferentes espectadores. Requisiciones: · Perl


Www :: spyder Software relacionado

XML :: Reglas

XML :: Las reglas son un módulo PERL que puede analizar las etiquetas XML y procesar mediante reglas a partir de las hojas. ...

182

Descargar