用 NumPy 创造深度学习用的数据集

作者/分享人:林奇思妙想
向 Ta 提问
前新思科技嵌入式软件工程师, 前开立图像算法工程师; 喜欢在开源世界里行走的感觉; 天性喜欢折腾; 目前正在某医疗大数据公司做GPU高性能优化项目.

网上有很多的深度学习训练集, 他们很优秀,但是也具有如下几种缺点:

  1. 数据集一般很巨大, 下载带宽是限制
  2. 数据并不是很形象,很难去窥探为什么使用这个数据
  3. 数据质量不是那么可控
  4. 用来训练非常耗时,耗资源,比方只有 GPU 机器才能跑等等

基于以上的事实,我在平时的工作中,就不得不写一些数据集生成代码。 写的过程中,我也觉得非常有启发, 下面我们分享这一过程的心得。

包括以下内容:

  1. 生成数据
  2. 如何加杂噪声,如何控制生成数据的质量
  3. 怎么可视化生成的数据集
  4. 如何在训练过程中使用自己造的数据
已有88人预订
预订达标
文章出炉
     
08月27日
09月11日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张林奇思妙想的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
Q.IAN
作者你好,我想问你点本chat之外的问题。看到你之前在开立做图像处理工程师,想问一下,开立对于这块的一个要求和形象点的描述。如果可以,求前辈传授点经验
林奇思妙想: 开立那边有很多部门,我就讲一讲我所在的部门,看你图像算法部门,需要了解: 1 声学成像 2 传统的图像处理算法 3 多线程
你可能还喜欢
如何成为一名合格的 C/C++ 开发者?
范蠡
微服务中的短信服务如何设计?
猿天地
亿级 QQ 会员活动运营系统的设计之道
廖声茂
详解 Java 常用的四种锁机制优缺点
安爷
数据科学 Kaggle 比赛项目实战:Titanic
刘明
微服务架构的演进、融合与选型
老顽童
微信扫描登录