Hermosa sopa

Hermosa sopa es un analizador HTML / XML de Python, diseñado para proyectos de respuesta rápidos como el raspado de pantalla.
Descargar ahora

Hermosa sopa Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Python License
  • Precio:
  • FREE
  • Nombre del editor:
  • Leonard Richardson
  • Sitio web del editor:
  • http://newsbruiser.tigris.org/

Hermosa sopa Etiquetas


Hermosa sopa Descripción

Hermosa sopa es un analizador HTML / XML de Python, diseñado para proyectos de respuesta rápidos como la pantalla de raspado. Hermoso proyecto de sopa es un analizador HTML / XML de Python, diseñado para proyectos de respuesta rápidos como el raspado de pantalla. Tres características lo hacen poderoso: la sopa hermosa no se ahogará si le das mal marcas. Produce un árbol de análisis que tiene aproximadamente tanto sentido como su documento original. Esto suele ser lo suficientemente bueno como para recopilar los datos que necesita y huir. Hermosa sopa proporciona algunos métodos simples y modificaciones de Pythonic para navegar, buscar y modificar un árbol de análisis: un kit de herramientas para diseccionar un documento y extraer lo que necesita. No tiene que crear un analizador personalizado para cada aplicación. La hermosa sopa convierte automáticamente los documentos entrantes a Unicode y los documentos salientes a UTF-8. No tiene que pensar en las codificaciones, a menos que el documento no especifique una codificación y una sopa hermosa no puede autodetectar uno. Entonces solo tienes que especificar la codificación original. Hermosa sopa analiza cualquier cosa que le das, y hace el árbol Traversal Stufe para ti. Puede decirle "Encuentre todos los enlaces", o "Encuentre todos los enlaces de clase Externallink", o "Busque todos los enlaces cuyas URL coinciden" FOO.com ", o" Encuentre el encabezado de la tabla que tiene texto en negrita, luego dé Yo ese texto ". Los datos valiosos que alguna vez fueron encerrados en sitios web de mal diseño ahora están a tu alcance. Los proyectos que habrían tomado horas tomaron solo minutos con hermosas sopa. Requisements: · Pythonwhat's NUEVO en esta versión: · Hermosa sopa puede ahora convertir HTML o XML no válidos en algo que se aproxima a XHTML o XML válido.


Hermosa sopa Software relacionado

Recordar

Recoll es un paquete de búsqueda de texto completo personal basado en Xapian. ...

353

Descargar

Gnu moe

Un editor de texto potente, limpio de 8 bits para ISO-8859-15 y codificaciones de caracteres ASCII. ...

166

Descargar