Housefly
Web Scraping ist eine wichtige Fähigkeit für Entwickler, aber das Erlernen kann schwierig sein. Deshalb habe ich Housefly erstellt, ein praktisches Projekt, das Web Scraping durch interaktive Übungen lehrt. Inspiriert von Google Gruyere bietet Housefly eine Reihe kleiner Tutorials mit speziell entwickelten Begleit-Websites, die zum Scrapen gedacht sind. Das Ziel? Dir eine sichere, strukturierte Umgebung zu bieten, um deine Scraping-Fähigkeiten zu üben und zu verfeinern.
Warum habe ich das gemacht?
Ich habe unzählige Tutorials gesehen, die Web Scraping in der Theorie erklären, aber nur sehr wenige bieten echte, kontrollierte Umgebungen zum Experimentieren. Housefly löst das, indem es eigenständige Herausforderungen bietet, bei denen du bereitgestellte Websites scrapst und deine Lösungen gegen erwartete Ausgaben validierst. Es ist für praktische Lerner gemacht, die handeln wollen, anstatt nur zu lesen.
Wie fange ich an
Anweisungen befinden sich in der README.md-Datei des GitHub-Repositorys. Von dort aus kannst du den Schritten folgen, um das Projekt einzurichten und auszuführen.
Feb 23, 2025
Grundlagen des HTML-Scraping: Die ersten Schritte
Mar 8, 2025
JavaScript-gerenderter Inhalt
Mar 25, 2025
Mehrseitiges Crawling
Apr 14, 2025
Erweiterte Website-Interaktion und APIs
Apr 26, 2025
Medien + Nicht-Text-Scraping
May 18, 2025
Umgang mit Web-Crawling-Abwehrmechanismen
May 20, 2025
Großmaßstäbliches + Unstrukturiertes Web-Crawling