精通 Python 网络爬虫:核心技术、框架与项目实战

内容简介

本书从技术、工具与实战3个维度讲解了 Python 网络爬虫:

  • 技术维度:详细讲解了 Python 网络爬虫实现的核心技术,包括网络爬虫的工作原理、如何用 urllib 库编写网络爬虫、爬虫的异常处理、正则表达式、爬虫中 Cookie 的使用、爬虫的浏览器伪装技术、定向爬取技术、反爬虫技术,以及如何自己动手编写网络爬虫;

  • 工具维度:以流行的 Python 网络爬虫框架 Scrapy 为对象,详细讲解了 Scrapy 的功能使用、高级技巧、架构设计、实现原理,以及如何通过 Scrapy 来更便捷、高效地编写网络爬虫;

  • 实战维度:以实战为导向,是本书的主旨,除了完全通过手动编程实现网络爬虫和通过 Scrapy 框架实现网络爬虫的实战案例以外,本书还有博客爬取、图片爬取、模拟登录等多个综合性的网络爬虫实践案例。

作者简介

韦玮,资深网络爬虫技术专家、大数据专家和软件开发工程师,从事大型软件开发与技术服务多年,现任重庆韬翔网络科技有限公司创始人兼 CEO,国家专利发明人。

精通 Python 技术,在 Python 网络爬虫、Python 机器学习、Python 数据分析与挖掘、Python Web 开发等多个领域都有丰富的实战经验。

CSDN、51CTO、天善智能等科技类社区和媒体的特邀专家和讲师,输出了大量的高质量课程和文章,深受用户喜爱。

微博:http://weibo.com/qiansyy

极客书购买须知

  1. 本产品为《精通 Python 网络爬虫:核心技术、框架与项目实战》一书电子版全本内容,共计 23.2 万字。
  2. 付费购买用户、会员用户可享受文章永久阅读权限。
  3. 本产品为虚拟产品,一经付费概不退款,敬请谅解。
  4. 本产品内容授权自北京华章图文信息有限公司。
  5. 极客书同时可在 http://gitbook.cn/ 购买与阅读。
推荐电子书查看更多电子书
生命密码:你的第一本基因科普书
尹烨
科普
基因
¥40.831 万字
SQL 进阶教程
MICK
SQL
数据库
¥39.9945.5 万字
Java 高并发编程详解:多线程与架构设计
汪文君
Java
¥4522.1 万字
Python 程序设计(第3版)
John Zelle
Python
¥49.9950.6 万字
深入浅出 RxJS
程墨
RxJS
¥4540 万字
微信扫描登录