Scrapy+MongoDB 抓取豆瓣 Top250 入门爬虫进阶

作者/分享人:Laugh U At FACE
向 Ta 提问
某电商网站的前端构建,参与多个网站的网络爬虫项目,擅长数据抓取,数据分析。

初步入门 Python 网络爬虫的你,是否想要写一些看上去高大上的项目练练手呢?Request 还是 PyQuery,两者爬虫效率能不能达到预期?然而 Scrapy 这样强大的框架对你有点陌生,那么你一定不要错过本次 GitChat。

这一次 Chat 我想为大家带来 Scrapy+MongoDB 数据库存储,来抓取豆瓣电影 Top250,通过这样一个实战快速上手 Scrapy,本场 Chat 您将学到:

  1. MongoDB 安装以及环境配置;
  2. Scrapy 四大组件初探;
  3. Xpath 快速入门;
  4. 通过 Scrapy 抓取豆瓣点评排行榜 Top250;
  5. 抓取数据保存至 MongoDB 用作后期分析。
已有105人预订
预订达标
文章出炉
     
01月28日
01月31日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Laugh U At FACE的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
高并发、低 RT 的风控系统架构及技术架构的实现
火币集团研发中心
程序员副业赚钱的 8 种模式
安晓辉
全栈开发入门实战:后台管理系统
鲁鹏
每一个开发人员都应该懂的 UML 规范
码匠笔记
不写代码:程序员最重要的技能 [英文版]
Chat 三人行
“花式吊打”系列之逻辑回归讲透透
天马行空
批量任务处理神器:Spring Batch
天涯阁主
如何打造爆款付费文章
老王
设计模式架构解析
疯狂的架构
理理 Java 开发中常见的设计模式
woodwang
如何快速准备面试中的算法,获得 Offer?
我爱大口吃饭
深度学习卷积神经网络架构设计核心技术
言有三
从本质如何理解机器学习
李韬
BAT + 程序员校招指南
黄小斜
进阶:Dockerfile 高阶使用指南及镜像优化
张晋涛
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
添加小助手微信×