保存成功
订阅成功
保存失败,请重试
提交成功

爬虫解析利器 PyQuery 的使用

免费
黄家宝

上一课时我们学习了正则表达式的基本用法,然而一旦你的正则表达式写法有问题,我们就无法获取需要的信息。

你可能会思考:每个网页,都有一定的特殊结构和层级关系,而且很多节点都有 id 或 class 作为区分,我们可以借助它们的结构和属性来提取信息吗?

这的确可行。这个课时我会为你介绍一个更加强大的 HTML 解析库:pyquery。利用它,我们可以直接解析 DOM 节点的结构,并通过 DOM 节点的一些属性快速进行内容提取。

目录:

  1. 准备工作
  2. 初始化
  3. 基本 CSS 选择器
  4. 查找节点
  5. 遍历
  6. 节点操作
  7. 伪类选择器
64 人已订阅
免费订阅
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效
严选标准
知道了
Chat 状态详情
开始预订
预订结果公布

预订达标,作者开始写作

审核未达标,本场 Chat 终止

作者文章审核结果公布

审核达标,文章发布

审核未达标,本场 Chat 终止

Chat 完结
×
已购列表