图书推荐

网络爬虫,又被称为网页蜘蛛、网络机器人,是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。很多站点,尤其是搜索引擎,都使用爬虫(它主要用于提供访问页面的一个副本)提供最新的数据,然后,搜索引擎对得到的页面进行索引,以便快速访问。爬虫也可以用来在Web上自动执行一些任务,例如检查链接、确认HTML代码;还可以用来抓取网页上某种特定类型的信息,例如电子邮件地址(通常用于垃圾邮件)。因此,网络爬虫技术对互联网企业具有很大的应用价值。
本书从Python 3.6.4最基础的部分讲起,延伸到Python最流行的应用方向之一     网络爬虫,讲解目前流行的几种Python爬虫框架,并给出详细示例,以帮助读者学习Python并开发出符合自己要求的网络爬虫。