Housefly
El web scraping es una habilidad esencial para los desarrolladores, pero aprenderlo puede ser complicado. Por eso creé Housefly, un proyecto práctico diseñado para enseñar web scraping a través de ejercicios interactivos. Inspirado en Google Gruyere, Housefly proporciona una serie de pequeños tutoriales con sitios web diseñados específicamente para ser scrapeados. ¿El objetivo? Ofrecerte un entorno seguro y estructurado para practicar y perfeccionar tus habilidades de scraping.
¿Por qué hice esto?
He visto innumerables tutoriales que explican el web scraping en teoría, pero muy pocos ofrecen entornos reales y controlados para experimentar. Housefly resuelve esto proporcionando desafíos autocontenidos donde puedes scrapear sitios web proporcionados y verificar tus soluciones contra resultados esperados. Está hecho para aprendices prácticos que quieren hacer en lugar de solo leer.
Cómo empezar
Las instrucciones están en el archivo README.md del repositorio GitHub. Desde allí, puedes seguir los pasos para configurar y ejecutar el proyecto.
Feb 23, 2025
Scraping HTML Básico: Los Primeros Pasos
Mar 8, 2025
Contenido Renderizado con JavaScript
Mar 25, 2025
Rastreo de Múltiples Páginas
Apr 14, 2025
Interacción Avanzada con Sitios Web y APIs
Apr 26, 2025
Medios + Scraping No Textual
May 18, 2025
Manejo de Defensas contra el Rastreo Web
May 20, 2025
Rastreo Web a Gran Escala + No Estructurado