NLP 中文文本聚类之无监督学习

作者/分享人:Soyoger
向 Ta 提问
90后,热爱技术,倡导科学技术改变生活,CSDN博客专家,GitChat平台分享者,在GitChat开设《中文自然语言处理入门实战》达人课,参与过知名互联网公司大数据、数据挖掘、用户画像、流量预测等项目,现在致力于中文自然语言处理的研究开发。

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。
已有276人预订
预订达标
文章出炉
     
18.06.06
18.06.20
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Soyoger的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
人生若只如初见
认真细心,继续努力。
张清兰
这个源码可以发一下吗?
Soyoger: 可以的呢。
童话里都是骗人的
我是NLP小白,请问源码能发给我看下吗?我在评论里看到别人要源码,你只说了可以发,但具体地址没给出。。。我的邮箱是ssyyhwg@163.com
董小姐
老师,请问下源代码能发下吗?
木子
请问源码可以发一下吗,邮箱1049991353@qq.com
听说
有源码分享吗?
什么都不是
请问源码能发一下吗,1473194946@qq.com
王瑞
求一份源码,2911525399@qq.com
詹姆斯·哈登
1049476961@qq.com麻烦您发下
yuyo
老师可以分享一下源码吗? yuyo0802@163.com
芒果咩宝宝🐼
第一次知识付费,求源码哈哈哈 904961737@qq.com
romao
请问老师:k-means默认的相似度不是欧根距离吗?欧根距离适合衡量句子之间的相似性吗?
ck
老师,求问源码和数据集 可以吗?邮箱是:1107820023@qq.com 万分感谢!
Red hat
求一份源码,2270496262@qq.com
嘟嘟
老师,您好,我是NLP小白,刚入门学习NLP,想深入学习,我在评论里看到别人要源码,您只说了可以发,但具体地址没给出请问源码能发给我看下吗?我的邮箱是845817425@qq.com
雪夜归人
请问‘实战 Word2Vec 的中文文本 K-means 聚类’这个效果如何呢?
善书
求一份源码752948170@qq.com
雪隠
老师,能麻烦发一份源码吗?邮箱:2738549713@qq.com,谢谢
世世
求一份源码,jiassheng@163.com
你可能还喜欢
高并发、低 RT 的风控系统架构及技术架构的实现
火币集团研发中心
全栈开发入门实战:后台管理系统
鲁鹏
程序员副业赚钱的 8 种模式
安晓辉
每一个开发人员都应该懂的 UML 规范
码匠笔记
“花式吊打”系列之逻辑回归讲透透
天马行空
带你全面了解高级 Java 面试中需要掌握的 JVM 知识点
当年明月
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
添加小助手微信×