Housefly

网络爬虫是开发者的一项必备技能,但学习过程可能会有点棘手。这就是为什么我创建了Housefly,一个通过交互式练习来教授网络爬虫的实践项目。受到Google Gruyere的启发,Housefly提供了一系列小型教程,配备专门构建的用于爬取的配套网站。目标?给你提供一个安全、结构化的环境,让你练习和提升爬虫技能。

我为什么创建这个?

我看过无数解释网络爬虫理论的教程,但很少有教程提供真实、受控的环境进行实验。Housefly通过提供自包含的挑战解决了这一问题,你可以爬取提供的网站并根据预期输出验证你的解决方案。它是为想要动手实践而不仅仅是阅读的学习者设计的。

如何开始

指南在GitHub仓库的README.md文件中。从那里,你可以按照步骤设置和运行项目。