机器学习面试干货精讲

向作者提问
双985研究生学历软件工程出身,曾从事于Android、Linux嵌入式开发。对人工智能有狂热兴趣,现专注机器学习与深度学习,有丰富机器学习实战经验,希望帮助更多的同学走进人工智能的世界。
查看本场Chat

序言

本文尽可能的不涉及到繁杂的数学公式,把面试中常问的模型核心点,用比较通俗易懂但又不是专业性的语言进行描述。希望可以帮助大家在找工作时提纲挈领的复习最核心的内容,或是在准备的过程中抓住每个模型的重点。作者能力有限,写的不好的地方还望大家多多包涵,指正。

实战环境说明:

  • Python 2.7
  • Sklearn 0.19.0
  • graphviz 0.8.1 决策树可视化

一、决策树

1.1 原理

顾名思义,决策树就是用一棵树来表示我们的整个决策过程。这棵树可以是二叉树(比如CART只能是二叉树),也可以是多叉树(比如ID3、C4.5可以是多叉树或二叉树)。

根节点包含整个样本集,每个叶节点都对应一个决策结果(注意,不同的叶节点可能对应同一个决策结果),每一个内部节点都对应一次决策过程或者说是一次属性测试。从根节点到每个叶节点的路径对应一个判定测试序列

举个例子:

就像上面这个例子,训练集由三个特征:outlook(天气),humidity(湿度),windy(是否有风)。那么我们该如何选择特征对训练集进行划分那?连续型特征(比如湿度)划分的阈值又是如何确定的那?

失业的巴拉森
已阅
scruel
进不去微信群啦。。。
失业的巴拉森
李宁老师您好,我是一名大一数学系学生,想要接触现在最热门的机器学习。因为我的专业是数学,而且我自己对凸优化很感兴趣,所以您能否介绍一下凸优化在机器学习里面的简单应用?
微信扫描登录