用 NumPy 创造深度学习用的数据集

作者/分享人:林奇思妙想
向 Ta 提问
前新思科技嵌入式软件工程师, 前开立图像算法工程师; 喜欢在开源世界里行走的感觉; 天性喜欢折腾; 目前正在某医疗大数据公司做GPU高性能优化项目.

网上有很多的深度学习训练集, 他们很优秀,但是也具有如下几种缺点:

  1. 数据集一般很巨大, 下载带宽是限制
  2. 数据并不是很形象,很难去窥探为什么使用这个数据
  3. 数据质量不是那么可控
  4. 用来训练非常耗时,耗资源,比方只有 GPU 机器才能跑等等

基于以上的事实,我在平时的工作中,就不得不写一些数据集生成代码。 写的过程中,我也觉得非常有启发, 下面我们分享这一过程的心得。

包括以下内容:

  1. 生成数据
  2. 如何加杂噪声,如何控制生成数据的质量
  3. 怎么可视化生成的数据集
  4. 如何在训练过程中使用自己造的数据
已有84人预订
预订达标
文章出炉
     
08月27日
09月11日
本场 Chat 文章已出炉,购买后即可阅读文章并获得一张林奇思妙想的读者圈Pass
请务必添加GitChat服务号以查看活动进度及获取活动通知。
查看文章评论/提问
Q.IAN
作者你好,我想问你点本chat之外的问题。看到你之前在开立做图像处理工程师,想问一下,开立对于这块的一个要求和形象点的描述。如果可以,求前辈传授点经验
你可能还喜欢
使用 Spring Boot 开发邮件系统
纯洁的微笑
基于深度学习的计算机视觉技术在无人驾驶中的应用
美团技术团队
Elasticsearch 搜索引擎应用实战
图南
百亿流量 API 网关设计与实践
kimmking
Java 性能瓶颈分析工具
蓬蒿
RabbitMQ 典型应用场景实战
SteadyHeart
微信扫描登录