分布式深度学习优化工程师(J10266)
职位类别:社会招聘
职能类型:
江苏省-南京市-江宁区
岗位职责:
1. 维护及搭建大规模深度学习集群,进行主流分布式模型的性能测试及优化;
2. 负责通信库的开发与测试;
3. 追踪业界最新的深度学习性能优化方法及实现,主流性能排行等;
任职要求:
1. 熟悉计算机体系结构,了解现代计算机体系
2. 熟悉linux系统
3. 大规模集群使用经验或测试经验
4. 熟悉使用深度学习框架,例如TensorFlow/PyTorch/MxNet等等
5. 了解常用的深度学习性能分析工具
6. 了解深度学习框架的分布式通信策略及优化
7. 熟悉至少一种并行编程模型,例如NCCL/MPI/pthread/CUDA等
8. 熟悉至少一种常用深度学习领域,如目标检测、自然语言处理等
9. 阅读及实现英文文献能力
10. 对深度学习性能优化有浓厚的兴趣,有很强的学习能力