Python 爬虫开发与项目实战

内容简介

随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍 Pthyon 编程语言和 Web 前端基础知识引领读者入门,之后介绍动态爬虫原理以及 Scrapy 爬虫框架,最后介绍大规模数据下分布式爬虫的设计以及 PySpider 爬虫框架等。

主要特点

  • 由浅入深,从 Python 和 Web 前端基础开始讲起,逐步加深难度,层层递进。
  • 内容详实,从静态网站到动态网站,从单机爬虫到分布式爬虫,既包含基础知识点,又讲解了关键问题和难点分析,方便读者完成进阶。
  • 实用性强,本书共有9个爬虫项目,以系统的实战项目为驱动,由浅及深地讲解爬虫开发中所需的知识和技能。
  • 难点详析,对 js 加密的分析、反爬虫措施的突破、去重方案的设计、分布式爬虫的开发进行了细致的讲解。

作者简介

范传辉,网虫,Python 开发者,参与开发了多项网络应用,在实际开发中积累了丰富的实战经验,并善于总结,贡献了多篇技术文章广受好评。研究兴趣是网络安全、爬虫技术、数据分析、驱动开发等技术。

极客书购买须知

  1. 本产品为《Python 爬虫开发与项目实战》一书电子版全本内容,共计 40 万字。
  2. 付费购买用户、会员用户可享受文章永久阅读权限。
  3. 本产品为虚拟产品,一经付费概不退款,敬请谅解。
  4. 本产品内容授权自北京华章图文信息有限公司。
  5. 极客书同时可在 http://gitbook.cn/ 购买与阅读。
推荐电子书查看更多电子书
生命密码:你的第一本基因科普书
尹烨
科普
基因
¥40.831 万字
SQL 进阶教程
MICK
SQL
数据库
¥39.9945.5 万字
Java 高并发编程详解:多线程与架构设计
汪文君
Java
¥4522.1 万字
Python 程序设计(第3版)
John Zelle
Python
¥49.9950.6 万字
深入浅出 RxJS
程墨
RxJS
¥4540 万字
微信扫描登录