保存成功
保存失败,请重试
提交成功

用 NumPy 创造深度学习用的数据集

作者/分享人:林奇思妙想
前新思科技(Synopsys) 软件工程师, 前开立图像算法工程师; 常常在开源世界里行走。 爱好广泛,天性喜欢折腾; 目前正在某医疗大数据公司做 GPU 高性能优化项目.

网上有很多的深度学习训练集, 他们很优秀,但是也具有如下几种缺点:

  1. 数据集一般很巨大, 下载带宽是限制
  2. 数据并不是很形象,很难去窥探为什么使用这个数据
  3. 数据质量不是那么可控
  4. 用来训练非常耗时,耗资源,比方只有 GPU 机器才能跑等等

基于以上的事实,我在平时的工作中,就不得不写一些数据集生成代码。 写的过程中,我也觉得非常有启发, 下面我们分享这一过程的心得。

包括以下内容:

  1. 生成数据
  2. 如何加杂噪声,如何控制生成数据的质量
  3. 怎么可视化生成的数据集
  4. 如何在训练过程中使用自己造的数据
已有114人预订
预订达标
文章出炉
     
18.08.27
18.09.11
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张林奇思妙想的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
你可能还喜欢
被动收入 101 :使用云开发和 Taro 开发一个小程序
白宦成
史上最全 Redis 面试题及答案,搞懂这套题征服面试官
ilomilo
10 个代码细节助你培养大牛思维
zaqweb
支付宝支付流程与服务端实现
江水
不把握好这 3 个原则,你的简历就是废纸
白朔天
快速成长:大学期间 0 到 100000 + 、拿到阿里 offer,我都做了什么?
latent
Zookeeper 详解与实践,你面试工作都绕不开的必考题!
latent
Java 编程(程序可靠性的 30 点建议)
OverWrite
深入浅出华为鸿蒙操作系统
闪客sun
轻松 TDD 之旅 2.0
张晓龙
进击的 Java ,云原生时代的蜕变
阿里巴巴云原生
Vue 实操指南
Fengy
基于爬取的 GitChat 平台数据进行分析
大数据和远方
Redis 数据库详解
小天空
如何雅致地处理代码中的异常
Fearless
微信扫描登录
关注提示×
扫码关注公众号,获得 Chat 最新进展通知!
入群与作者交流×
扫码后回复关键字 入群
Chat·作者交流群
入群码
该二维码永久有效