大模型推理框架开发工程师
收藏
¥20000元以上/月
职位详情
珠海
硕士
横琴产业园区线上专场招聘会
2026-04-13 00:00 ~ 2026-04-13 00:00
网络招聘(不设置场地)
职位描述
岗位职责:
1.基于壁仞GPU软件栈,开发大模型和多模态大模型推理服务框架
2.围绕并行策略、GPU通信、算子融合、量化压缩等方面,持续优化大语言模型推理性能,降低模型推理延迟,提升线上模型服务吞吐
任职要求:
1.硕士及以上学历,计算机、数学、软件工程、自动化、通信、微电子等相关专业,三年及以上相关工作经历
2.扎实编程能力,熟练使用C/C++或者Python
3.熟悉大模型推理技术栈,有vLLM、SGLang、LMDeploy、TensorRT-LLM等大模型推理框架适配开发经验者优先,有CUDA编程经验者优先
4.热爱技术、追求卓越、具备良好的学习能力和团队协作能力、自驱力强、逻辑思维强
1.基于壁仞GPU软件栈,开发大模型和多模态大模型推理服务框架
2.围绕并行策略、GPU通信、算子融合、量化压缩等方面,持续优化大语言模型推理性能,降低模型推理延迟,提升线上模型服务吞吐
任职要求:
1.硕士及以上学历,计算机、数学、软件工程、自动化、通信、微电子等相关专业,三年及以上相关工作经历
2.扎实编程能力,熟练使用C/C++或者Python
3.熟悉大模型推理技术栈,有vLLM、SGLang、LMDeploy、TensorRT-LLM等大模型推理框架适配开发经验者优先,有CUDA编程经验者优先
4.热爱技术、追求卓越、具备良好的学习能力和团队协作能力、自驱力强、逻辑思维强