NLP 中文文本聚类之无监督学习

作者/分享人:Soyoger
向 Ta 提问
90后,热爱AI,倡导AI技术改变生活,CSDN博客专家,GitChat平台分享者,在GitChat开设《中文自然语言处理入门实战》达人课,参与过知名互联网公司大数据项目、用户画像、流量预测,现在致力于中文自然语言处理的研发。

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。
已有168人预订
预订达标
文章出炉
     
06月06日
06月20日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Soyoger的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
人生若只如初见
认真细心,继续努力。
张清兰
这个源码可以发一下吗?
Soyoger: 可以的呢。
童话里都是骗人的
我是NLP小白,请问源码能发给我看下吗?我在评论里看到别人要源码,你只说了可以发,但具体地址没给出。。。我的邮箱是ssyyhwg@163.com
董小姐
老师,请问下源代码能发下吗?
木子
请问源码可以发一下吗,邮箱1049991353@qq.com
你可能还喜欢
如何成为一名合格的 C/C++ 开发者?
范蠡
从新一期技术雷达看技术领域最新趋势
徐昊
微服务中的短信服务如何设计?
猿天地
亿级 QQ 会员活动运营系统的设计之道
廖声茂
详解 Java 常用的四种锁机制优缺点
安爷
数据科学 Kaggle 比赛项目实战:Titanic
刘明
微信扫描登录