保存成功
订阅成功
保存失败,请重试
提交成功
张雨萌

张雨萌

清华大学硕士/机器学习书籍作者
1.清华大学计算机科学与技术系硕士毕业,研究方向:数据分析、自然语言处理; 2.受欢迎的知乎科技专栏作家,专栏关注量15000; 3.个人已出版机器学习算法类技术书籍。...更多
创作文章3
开设专栏3

利用 Python 进行时间序列分析

时间序列分析在数据挖掘与统计分析中具有举足轻重的地位,它帮助人们从已有的时间序列数据中挖掘规律、预测未知,尤其是在金融量化分析领域,这绝对是不可不提、不可不用的利器,他是一切模型和策略的构建基础。 在 Python 中,时间序列通常使用 0 Pandas 中的 Series 或 Dataframe 结构来表示,与一般数值型的 Series 或 Dataframe 结构本质上是一样的,但是有一个重要的不同之处就在于他的索引数据是时间类型的。 基于上述需求和特点,全文内容分为三大部分: 1. 首先学习如何利用 Python 有效的表示日期类型数据; 2. 然后聚焦日期型索引的表示和操作方法; 3. 最后详细探讨利用 Pandas 处理时间序列的核心技巧。
严选Python
312 订阅

矩阵的奇异值分解与数据降维(Python 实现)

在前面一篇 Chat 中,我们利用矩阵的特征值分解对数据进行主成分分析。这种方法有一定的局限性:即要求矩阵必须是方阵且能够被对角化。那么如果拓展到一般情况,对于任意形状的矩阵我们该如何处理呢? 这篇 Chat 将介绍一个更通用的利器:奇异值分解。他可以对任意形状的矩阵进行分解,适用性更广。我们可以将特征值分解看作是奇异值分解的特殊情况,先从特征值分解的几何意义入手,然后从特殊到一般,在空间的背景下引导大家一步一步探索奇异值分解方法的推导过程,从头摸索一遍方法的来龙去脉,并具体运用他对数据进行降维处理。 全文主要内容如下: 1. 回顾特征值分解的几何意义 2. 探讨奇异值分解的具体实施细节 3. 从行和列两个维度进行数据压缩和矩阵近似 4. 利用 Python 进行奇异值分解
严选Python
215 订阅

矩阵特征值分解与主成分分析(Python 实现)

在数据分析的过程中,我们会通过观察一系列的特征属性来对我们感兴趣的对象进行分析研究,一方面特征属性越多,越有利于我们细致刻画事物,但另一方面也会增加后续数据处理的运算量,带来较大的处理负担,我们应该如何平衡好这个问题?利用矩阵的特征值分解进行主成分分析就是一个很好的解决途径。 主成分分析是机器学习中的核心算法之一,本文将基于 Python 语言,为读者深入浅出的分析他的来龙去脉和本质内涵,相信读完此文,将扫清你心中的所有疑虑,今后在应用他解决实际问题的时候也能更加得心应手。 本文主要内容有: 1. 对称矩阵的基本性质 2. 对称矩阵的对角化与特征值 3. 数据降维的需求背景与主要目标 4. 主成分分析法降维的核心思路 5. 主成分分析的细节实现过程 6. 推广到 N 个特征的降维实现
严选Python
352 订阅
微信扫描登录