| metadata_parser Un módulo para analizar los metadatos fuera de los documentos |
Descargar ahora |
metadata_parser Clasificación y resumen
- Licencia:
- MIT/X Consortium Lic...
- Nombre del editor:
- Jonathan Vanasco
- Sitio web del editor:
- http://search.cpan.org/~jvanasco/Authen-PluggableCaptcha-0.05/lib/Authen/PluggableCaptcha/Tutorial.pm
metadata_parser Etiquetas
metadata_parser Descripción
Metadata_Parser es un módulo de Python para extraer metadatos fuera de los documentos web. Requiere BeautifulSoup, y se basó en gran medida en el módulo OpenGraph de Erik River (https://github.com/erikriver/opengraphi). Necesitaba algo más agresivo que el módulo de Erik, por lo que Tuvo que fork.InstallationPip Instale MetAdata_ParserFeatures: tire de la mayor cantidad de metadatos de un documento como sea posible, puede establecer una 'estrategia' para encontrar metadatos (es decir, solo aceptar gráfico abierto o atributos de la página) Esto requiere BeautifulSoup 3 o 4. Si es puede importar BS4 lo hace, de lo contrario, intenta la velocidad (3) para la velocidad, instanciará un analizador de BeautifulSoup con LXML y volverá a 'Ninguno' (el Python Pure Interno) Si no puede cargar LXML, la "estrategia" predeterminada es Para mirar en este orden: OG, DC, META, PAGE OG = APORTHGRAGRA DC = DUBLINGORE META = Página de metadatos = Página ElementsYou Puede especificar una estrategia como una lista separada por comas de lo anterior. Los únicos elementos de 2 páginas se admiten actualmente:
metadata_parser Software relacionado