岗位职责:
工作职责:
1、负责深度学习算法的开发与性能提升、产品落地,负责芯片上训推算法的底层工具的性能提升,研究方向包括但不限于: 多模态、transformer小模型、大模型、模型压缩、目标检测、关键点检测、目标追踪、视频生成、推荐系统等;
2、推动前沿深度学习技术在芯片加速领域的优化、应用和产品落地;
3、紧跟学术前沿,开展高水平和创新性的研究,保持算法和对应的芯片性能在工业界和学术界的领先;
4、熟悉deepspeed、megatron、LMflow等大模型训推工具,熟悉模型压缩工具;
任职要求:
任职要求:
1、本科以上学历(名校研究生优先),熟悉深度学习算法CV、NLP、REC、ASR之中至少其一,有很好的机器学习基础;
2、有独立分析和解决问题的能力,熟悉python、C++;
3、有较强的算法设计、实现、优化能力,有良好的编程习惯,熟悉PyTorch/TensorFlow等主流框架;
4、在相关领域顶刊或会议发表过论文且提出过效果明显的创新优先;
4、具备一定的大中型开源项目或商业项目产品落地经验(编程方面);
5、做过类似机器学习平台项目 (如阿里云PAI、华为ModelArts、腾讯TI平台)优先;