[北京]推理优化相关职位招聘（关键词 CUDA/Triton/trt/量化/压缩/蒸馏）

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

• 外包信息请发到 /go/outsourcing 节点。

• 不要把相同的信息发到不同的节点

这是一个创建于 440 天前的主题，其中的信息可能已经有所发展或是发生改变。

长期招聘，需要有相关经验，有意请站内联系或邮件到 [email protected]

职位描述：
1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
2. 方向一：负责深度模型性能优化，提升大规模在线推理集群的吞吐，降低时延，保证在线服务可用性；
3. 方向二：负责分布式模型训练框架的开发和优化，提升整体训练流程的效率
4. 方向三：负责 LLM 大模型推理/训练优化

职位要求：
1. 熟悉 linux 环境，熟悉 C/C++和 Python ，熟悉 GPU 体系结构
2. 熟悉至少一种推理引擎，有引擎/算子开发部署经验，如 TensorRT/OpenPPL/TVM/AITemplate 等
3. 熟悉 Pytorch 等常用训练平台，熟悉 OpenMMLab/HuggingFace 等算法模型池，有实际应用经验

加分项：
1. 有 CUDA 编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法，有相关应用经验者优先

推理

模型

熟悉

优化

3 条回复 • 2023-08-10 11:15:07 +08:00

israinbow

2023-08-08 20:18:00 +08:00 via Android

招聘时请尽量给出薪酬范围

1oscar

2023-08-10 00:15:22 +08:00

还有公司也不说，这是猎头吧

tsubin

2023-08-10 11:15:07 +08:00

而且工作技术方向和技术要求写得太全面了