metadata_parser

Un módulo para analizar los metadatos fuera de los documentos
Descargar ahora

metadata_parser Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • MIT/X Consortium Lic...
  • Precio:
  • FREE
  • Nombre del editor:
  • Jonathan Vanasco
  • Sitio web del editor:
  • http://search.cpan.org/~jvanasco/Authen-PluggableCaptcha-0.05/lib/Authen/PluggableCaptcha/Tutorial.pm

metadata_parser Etiquetas


metadata_parser Descripción

Metadata_Parser es un módulo de Python para extraer metadatos fuera de los documentos web. Requiere BeautifulSoup, y se basó en gran medida en el módulo OpenGraph de Erik River (https://github.com/erikriver/opengraphi). Necesitaba algo más agresivo que el módulo de Erik, por lo que Tuvo que fork.InstallationPip Instale MetAdata_ParserFeatures: tire de la mayor cantidad de metadatos de un documento como sea posible, puede establecer una 'estrategia' para encontrar metadatos (es decir, solo aceptar gráfico abierto o atributos de la página) Esto requiere BeautifulSoup 3 o 4. Si es puede importar BS4 lo hace, de lo contrario, intenta la velocidad (3) para la velocidad, instanciará un analizador de BeautifulSoup con LXML y volverá a 'Ninguno' (el Python Pure Interno) Si no puede cargar LXML, la "estrategia" predeterminada es Para mirar en este orden: OG, DC, META, PAGE OG = APORTHGRAGRA DC = DUBLINGORE META = Página de metadatos = Página ElementsYou Puede especificar una estrategia como una lista separada por comas de lo anterior. Los únicos elementos de 2 páginas se admiten actualmente:


metadata_parser Software relacionado