保存成功
保存失败,请重试

Scrapy 爬虫实战与热词分析:爬取腾讯视频评论生成词云图

作者/分享人:灵动的艺术
向 Ta 提问
CSDN博客专家:https://summer.blog.csdn.net/ GitHub开源博主:https://github.com/Jaysong2012 欢迎大家围观。

最近我的腾讯视频会员到期了,一直在纠结要不要续费,恰逢良心国漫《斗罗大陆》的广告打到我这里,再次勾起了我的追漫热情。虽然号称良心国漫,但是对这部动漫能不能值得我的腾讯视频的 VIP 价格,我还是相当怀疑的。所以决定先爬一爬,看看全部人的影评再决定。

本 Chat 我们主要讨论以下要点:

  1. Scrapy 爬虫爬取腾讯视频《斗罗大陆》的全部评论;
  2. 建立 Elasticsearch 映射存储全部评论;
  3. ik_smart 分词器中文热词分析;
  4. pyecharts 绘制 word_cloud(词云图)。

有同类兴趣的同学欢迎一起研究,如果对 Scrapy 爬虫不是很了解,也不用担心,本 Chat 我会用 Scrapy 来演示爬虫,也会给大家演示自己手写一个简单脚本来爬虫。如果 Elasticsearch 不太了解,欢迎先到我的 Elasticsearch 专栏共同学习进步,其他的技术方面都比较简单易懂,完全不用担心学不会。

已有210人预订
预订达标
文章出炉
     
18.12.14
18.12.26
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张灵动的艺术的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
恕我直言,90% 的程序员都扛不住这波 MQ 的面试四连炮!
王码农
被动收入 101 :使用云开发和 Taro 开发一个小程序
白宦成
[动图演示]Redis 持久化 RDB/AOF 详解与实践
韦世东
Apollo 5.0 障碍物行为预测技术
Apollo开发者社区
超高性价比的 MongoDB 零基础快速入门实战教程
韦世东
抢先阅读 Kubernetes 1.15 新特性解读
张晋涛
教了一年少儿编程,说说感想和体验
叶蒙蒙
深入浅出 Stream 模块通往高级 Node.js:后端工程师必经之路
koala
百度 DevOps 实施之道——百度工程能力提升的策略和实践
百度效率云
快速开发 Spring Boot+Elasticsearch
自始自终
非科班前端面试大厂的实操指南
修言
基于 K8S+Spring Cloud 在金融行业的高可用实践
曾小波
使用 OAuth2 保护基于 Spring 的分布式微服务
长风万里
数据结构算法常见的 100 道面试题全解析:2019 版
攻城狮
深入分布式事务
IT云清
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效