保存成功
订阅成功
保存失败,请重试
提交成功
AI悦创

AI悦创

爬虫工程师
公众号:AI悦创,百度文库认证作者,51CTO 签约讲师,原网易有道、清华团队答疑老师。博客:www.aiyc.top...更多
创作文章11

03 初识Git : 本地创建一个 Git 仓库

你好,我是悦创。每章一句:宝剑锋从磨砺出,梅花香自苦寒来。——佚名 在上一节内容中,我们已经将 Git 环境安装好,从这一节开始我们开始正式接触 Git 的操作命令,从最简单的开始,循序渐进。在这一节中,我们通过本地创建一个 Git 版本库来初步认识 Git 版本库,以及 Git 的一些必要的配置。 目录: 1. 创建版本库 - 认识 .git 2. 基础配置 - 查看配置信息 - 设置配置信息 - 修改配置信息 3. 小结
免费Git
11 订阅

高效存储 MongoDB 的用法

你好,我是悦创。上篇 Chat 我们学习了如何用 pyquery 提取 HTML 中的信息,但是当我们成功提取了数据之后,该往哪里存放呢?用文本文件当然是可以的,但文本存储不方便检索。有没有既方便存,又方便检索的存储方式呢? 目录: 1. 准备工作 2. 连接 MongoDB 3. 指定数据库 4. 指定集合 5. 插入数据 6. 查询 7. 计数 8. 排序 9. 偏移 10. 更新 11. 删除 12. 其他操作
免费MongoDB
17 订阅

为什么要使用 Git?

1. 版本控制系统 2. 中央版本控制系统 3. 分布式版本控制系统 4. GIT 和 SVN - 功能丰富 - 流行热度 - 学习难度 5. 本章小结
免费Git
24 订阅

02 在各系统中快速安装 Git 环境

1. 安装 Git - Windows 安装 - Mac OS 安装 - Linux 安装 2. 安装 zsh - Mac 安装 zsh - Linux 安装 zsh 3. 安装 oh-my-zsh - 安装 oh-my-zsh - 测试验证 4. 本章小结
免费Git
9 订阅

爬虫解析利器 PyQuery 的使用

上一课时我们学习了正则表达式的基本用法,然而一旦你的正则表达式写法有问题,我们就无法获取需要的信息。 你可能会思考:每个网页,都有一定的特殊结构和层级关系,而且很多节点都有 id 或 class 作为区分,我们可以借助它们的结构和属性来提取信息吗? 这的确可行。这个课时我会为你介绍一个更加强大的 HTML 解析库:pyquery。利用它,我们可以直接解析 DOM 节点的结构,并通过 DOM 节点的一些属性快速进行内容提取。 目录: 1. 准备工作 2. 初始化 3. 基本 CSS 选择器 4. 查找节点 5. 遍历 6. 节点操作 7. 伪类选择器
免费Python爬虫
42 订阅

解析无所不能的正则表达式

你好,我是悦创。这一讲,我讲一些基础的正则表达式,一些爬虫面试官必考题。 目录: 1. 实例引入 2. match 3. search 4. findall 5. sub 6. compile
免费正则表达式
27 订阅

入门首选,Requests 库的基本使用

上一课时我们了解了一些学习爬虫所需要的基本知识。从本课时开始,我们正式步入Python 爬虫的大门。 目录: 1. 安装 2. 实例引入 3. 请求 4. 响应 5. 高级用法
免费Python
43 订阅

多路加速,了解多进程基本原理

本课时我们就来了解下多进程的基本概念和用 Python 实现多进程的方法。 目录: 1. 多进程的含义 2. Python 多进程的优势 3. 多进程的实现 4. 直接使用 Process 类 5. 继承 Process 类 6. 守护进程 7. 进程等待 8. 终止进程 9. 进程互斥锁 10. 信号量 11. 队列 12. 管道 13. 进程池
免费多线程
31 订阅

多线程与多进程

你好,我是悦创。今天,我给大家讲讲多进程与多线程。 1. 全局解释器锁 2. 多线程测试 3. 避免 GIL 4. 多线程与多进程 5. Lock 锁 6. 递归锁 RLOCK 7. 多进程 8. 进程通信 9. 进程池与线程池 10. 作业
免费多线程
106 订阅

Python 之站在高层框架下的 SQLAIchemy 操作 MySQL(关系型数据库)

如今的各种应用中,大多使用关系型数据库用于数据存储(非关系型数据库,多用于缓存)。当数据达到一定的数量级,并发请求增多时,SQL 效率(一般是查询语句)对于系统性能就显得尤为重要。而在关系型数据库中,MySQL 由于体积小、速度快、成本低等优点,尤其是开放源码这一特点,很多企业都使用其作数据存储。 本场 Chat 将介绍 MySQL 数据库的基本语句,如 创建数据库、以及增删查改、Python 操作 MySQL 数据库 在本场 Chat 中,会涉及以下内容: 1. Python 快速入门篇 2. MySQL 的原生操作 - 数据库创建 - 数据库的增删查改(URD) 3. SQLAIchemy 的高层框架操作 MySQL - Python 使用第三方库操作 MySQL - 增加与删除数据 - 根据数据访问特点适当添加索引 适合人群:对数据库有兴趣的技术人员(基础知识,适合小白入门。大神可以支持一下小弟呀!)
Python
103 订阅

快收下这枚 Scrapy Requests 口味的爬虫“回魂丹”

五分钟带您由放弃到深入。爬虫,又名蜘蛛,是一个模拟人类请求网站行为的程序,可以自动请求网页,并将数据抓取下来,然后使用一定的规则提取有价值的数据。学习爬虫的人虽多,但从入门到放弃的人也是不少哒。 他们大都经历以下“磨难”! 入门:爬虫好高大上,我要学会它,我要用它爬vip视频,收费音乐,要钱的软件,统统给我爬一遍。 迷茫:兴致高,想要深入学习,但是网上相关教程的价格较高,免费的视频又千篇一律,知识面较浅,不知如何选择。 放弃:与爬虫斗争了一段时间后,发现,只能拿 Quotes to Scrapy 等简单的网站(软柿子捏),对设有反爬的网站完全没办法,浪费时间和精力,放弃放弃! 童鞋你是否也 pick 到了同款的入门到放弃呢? 在本场 Chat 中,会讲到如下内容: 1. 网页基础 2. 爬虫基础 3. Requests 库的基础操作 4. Scrapy 基础 5. Scrapy 网易新闻实战 短短的 3 万字虽然无法保证让您一下子成为大神,但它能使您对爬虫有更深层次的了解。 适用对象: 1. 正在放弃或已经放弃爬虫的童鞋 2. 对爬虫有一定兴趣的零基础童鞋(本文附带 Python 基础脑图以及 Python IDE安装教程,零基础的童鞋也可以放心食用哦)
104 订阅
微信扫描登录