Scrapy+MongoDB 抓取豆瓣 Top250 入门爬虫进阶

作者/分享人:Laugh U At FACE
向 Ta 提问
某电商网站的前端构建,参与多个网站的网络爬虫项目,擅长数据抓取,数据分析。

初步入门 Python 网络爬虫的你,是否想要写一些看上去高大上的项目练练手呢?Request 还是 PyQuery,两者爬虫效率能不能达到预期?然而 Scrapy 这样强大的框架对你有点陌生,那么你一定不要错过本次 GitChat。

这一次 Chat 我想为大家带来 Scrapy+MongoDB 数据库存储,来抓取豆瓣电影 Top250,通过这样一个实战快速上手 Scrapy,本场 Chat 您将学到:

  1. MongoDB 安装以及环境配置;
  2. Scrapy 四大组件初探;
  3. Xpath 快速入门;
  4. 通过 Scrapy 抓取豆瓣点评排行榜 Top250;
  5. 抓取数据保存至 MongoDB 用作后期分析。
已有91人预订
预订达标
文章出炉
     
01月28日
01月31日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Laugh U At FACE的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
给后端程序员看的 Vue 快速入门教程
白宦成
110 道 Python 面试笔试题超强汇总
嘉美伯爵
Redis 实战场景详解
驰骋
轻松搞定机器学习中的概率统计知识
Evan
架构师成长之路之服务治理漫谈
飞狐
Git 扫盲,用命令行优雅的理解 Git 底层机制
叫我闪电
从学生到职场,这位百万爬虫博主都经历了什么?
崔庆才丨静觅
打造高效「Mac 工具栈」,提高工作效率
易水寒
Java 与底层操作系统的交互细节
小强
前端面试指导
程序员-玄魂
Azkaban 分布式任务调度部署实战
火币集团研发中心
架构师成长之路之限流
飞狐
架构师成长之路之服务发现与注册
飞狐
人工智能物联网极简入门
Peter Liu
Java 进阶之路:异常处理的内在原理及优雅的处理方式
应书澜
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!