NLP 中文文本聚类之无监督学习

作者/分享人:Soyoger
向 Ta 提问
90后,对技术狂热,热爱AI,倡导AI技术改变生活,CSDN博客专家,参与过知名互联网公司大数据项目、用户画像、流量预测,现在致力于中文自然语言处理的研发。

在有监督学习方面,笔者已经讲述了基于 ML 和 DL 的中文文本分类。本场 Chat 笔者将在文本相似性度量(聚类重点会用到上一篇中各种距离的度量)的基础上,趁热打铁,在无监督学习方面,完成中文文本的聚类实战。

你将主要学习到如下内容:

  1. 无监督学习的研究现状。
  2. K-means 方法原理。
  3. DBSCAN 方法原理。
  4. NMF 方法原理。
  5. PCA 降维的原理及步骤。
  6. 实战 TF-IDF 的中文文本 K-means 聚类。
  7. 实战 Word2Vec 的中文文本 K-means 聚类。
  8. 聚类结果的可视化。
已有84人预订
预订达标
文章出炉
     
06月06日
06月20日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张Soyoger的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
人生若只如初见
认真细心,继续努力。
张清兰
这个源码可以发一下吗?
Soyoger: 可以的呢。
退款保证:
• 06月11日前,预订人数未达标,您将获得全额退款。
• 作者未按时完成文章,您将获得全额退款。
你可能还喜欢
二叉树的原理推敲与动手种树
浅浅
谈谈 Java NIO
应书澜
程序员炒股:算法交易策略与建模思想
chen_h
MySQL 性能优化实战
奋斗
DevOps 工具链:在线报障的流程、系统设计和自改进体系的建设
常新居士
RabbitMQ 消息服务总结心得分享
IT小香猪
微信扫描登录