| Htmlista Extraiga datos de páginas HTML que tienen algún tipo de patrón repetitivo |
Descargar ahora |
Htmlista Clasificación y resumen
- Nombre del editor:
- Erez Bibi
- Sitio web del editor:
- http://frontiernet.net
Htmlista Etiquetas
Htmlista Descripción
Extraer datos de páginas HTML que tienen algún tipo de patrón repetitivo HTMLIST es una herramienta escrita en Python que intenta encontrar un patrón repetitivo en una página HTML que contiene algún tipo de lista (como las páginas de digestión). Extrae el texto Sub-HTML que crea el patrón y trata de extraer información útil de él. La idea es que en una página de datos html típica que contiene una lista de elementos, habrá un patrón repetitivo para el ojo humano (el Formato de página). Si este patrón será el más frecuente en la página (este será el caso en la mayoría de las páginas), podremos reconocerlo y "raspar" los datos relevantes. Requisitos: · Python
Htmlista Software relacionado