保存成功
订阅成功
保存失败,请重试
提交成功

网易云音乐系列:抓取网易评论进行分析

¥5会员免费看
明天依旧可好

网易云音乐评论区几大未解之谜。他和她究竟有没有在一起,考研的究竟考上了没有,努力的人成功了吗,他(她)真的能看到留言吗,那些文艺青年写的究竟是不是抄的。网易评论里还有什么是我们不知道的,本场 Chat 将带大家爬取网易云音乐的评论并生成词云来一探究竟。

主要含以下内容:

  • 对爬虫做一个讲解;
  • 分析网易云音乐的网页结构;
  • 反扒措施分析;
  • 高效编写程序,避免代码中的不规范;
  • 使用 Jieba 进行分词,生成词云。

其中我们会用到的第三方库如下:

  • BeautifulSoup;
  • Selenium;
  • WordCloud;
  • Matplotlib;
  • Jieba;
  • Numpy;
  • PIL。
143 人已订阅
会员免费看
¥5 原价订阅
查看文章评论/提问
快乐伴我行!1 年前
selenium效率太低了,还有没别的优化方案
明天依旧可好(作者)1 年前
目前我这还没有其他方案,selenium自身的效率是可以提高的(比如禁止加载图片、禁止加载插件以及无窗口化),看你怎么用了。
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效
严选标准
知道了
Chat 状态详情
开始预订
预订结果公布19.02.15

预订达标,作者开始写作

审核未达标,本场 Chat 终止

作者文章审核结果公布19.03.05

审核达标,文章发布

审核未达标,本场 Chat 终止

Chat 完结
×
已购列表