长期招聘,需要有相关经验,有意请站内联系或邮件到
[email protected]职位描述:
1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责 LLM 大模型推理/训练优化
职位要求:
1. 熟悉 linux 环境,熟悉 C/C++和 Python ,熟悉 GPU 体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如 TensorRT/OpenPPL/TVM/AITemplate 等
3. 熟悉 Pytorch 等常用训练平台,熟悉 OpenMMLab/HuggingFace 等算法模型池,有实际应用经验
加分项:
1. 有 CUDA 编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先