NLP 中文文本聚类之无监督学习

作者/分享人:Soyoger
向 Ta 提问
90后,热爱技术,倡导科学技术改变生活,CSDN博客专家,GitChat平台分享者,在GitChat开设《中文自然语言处理入门实战》达人课,参与过知名互联网公司大数据、数据挖掘、用户画像、流量预测等项目,现在致力于中文自然语言处理的研究开发。

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。
已有182人预订
预订达标
文章出炉
     
06月06日
06月20日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Soyoger的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
人生若只如初见
认真细心,继续努力。
张清兰
这个源码可以发一下吗?
Soyoger: 可以的呢。
童话里都是骗人的
我是NLP小白,请问源码能发给我看下吗?我在评论里看到别人要源码,你只说了可以发,但具体地址没给出。。。我的邮箱是ssyyhwg@163.com
董小姐
老师,请问下源代码能发下吗?
木子
请问源码可以发一下吗,邮箱1049991353@qq.com
听说
有源码分享吗?
什么都不是
请问源码能发一下吗,1473194946@qq.com
王瑞
求一份源码,2911525399@qq.com
詹姆斯·哈登
1049476961@qq.com麻烦您发下
yuyo
老师可以分享一下源码吗? yuyo0802@163.com
你可能还喜欢
如何设计一个灵活的 MySQL 数据表,应对灵活多变的需求
李岩
Jenkins 自动化构建部署实战
火币集团研发中心
Java 程序员应掌握的 Nginx 实战应用
JPM
带你玩转 JSON
能量架构师
实战剖析 Java 秒杀系统的实现
虎口脱险
小程序从入门到进阶
loonglong
微信扫描登录