NLP 中文文本聚类之无监督学习

作者/分享人:Soyoger
向 Ta 提问
90后,热爱AI,倡导AI技术改变生活,CSDN博客专家,GitChat平台分享者,在GitChat开设《中文自然语言处理入门实战》达人课,参与过知名互联网公司大数据项目、用户画像、流量预测,现在致力于中文自然语言处理的研发。

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。
已有129人预订
预订达标
文章出炉
     
06月06日
06月20日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Soyoger的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
人生若只如初见
认真细心,继续努力。
张清兰
这个源码可以发一下吗?
Soyoger: 可以的呢。
你可能还喜欢
Docker+K8S 集群环境搭建及分布式应用部署
李熠lynn
JVM 精华知识点汇总
胡玉洋
前端游戏框架哪个好
cba
MySQL 数据同步双机互备
小闲丶
Docker 入门之个人博客搭建教程
一念成魔
美团客户端响应式框架 EasyReact 开源
美团技术团队
微信扫描登录