jack:机器学习的几个经典算法实战解析

向作者提问
北京林业大学硕士研究生,工作三年多,现在某工业互联网公司从事算法研究,参与多个项目和公司产品研发,乐于知识分享,创办机器学习,深度学习相关的系统入门学习之微信公众号《算法channel》。
查看本场Chat

2018年1月3日,周三晚上8点30分,北京林业大学硕士研究生,某工业互联网公司资深算法工程师jack带来了主题为《务实而深入地理解机器学习的几个经典算法》的交流,以下是主持人嘉仔整理的问答实录,记录了作者和读者间问答的精彩时刻。


内容提要:

  • feed 到机器学习训练模型中的数据,该如何高效利用?
  • 最小二乘法做线性回归,数据满足什么分布,会取得最佳拟合结果?
  • 如何通俗易懂地理解最大似然估计?
  • 最大似然估计可以解决哪一类问题?
  • 逻辑回归面试经常会问到:逻辑回归的模型是怎么推导出来的?
  • 逻辑回归算法代码实现中,为什么有2个特征,1个标签值,共3列,为什么最后出现了4列?
  • 收敛是不是值误差在一定的阈值内?
  • 有什么好的记录公式的工具可以推荐吗?每次在纸上推的公式过段时间就忘了,又得重推怎么办?

问:feed 到机器学习训练模型中的数据,该如何高效利用?

答:先谈一谈如何高效地利用这些数据(一般地训练样本数比较大)。比如在线性回归任务,利用梯度下降求解目标函数的最小值时,利用训练集的策略通常有3种:

微信扫描登录