返回
职位详情
AI研发工程师(2026届)
收藏
¥15000~19999元/月
职位详情
上海
本科
横琴产业园区线上专场招聘会
2026-04-13 00:00 ~ 2026-04-13 00:00
网络招聘(不设置场地)
职位描述
1、负责ONNX等格式的模型在NPU硬件平台的部署与落地,完成模型格式转换、适配调试,确保模型稳定高效运行,满足业务吞吐量、延迟等核心需求。;
2、对NPU特性有一定了解,通过学习,能负责对模型部署过程中的性能瓶颈,算子融合、图优化、量化(INT4/INT8/FP16)、内存规划等优化工作,;
3、基于嵌入式系统,能使用ONNXRuntime、TensorRT、TVM、CANN等部署工具链,完成模型从PyTorch/TensorFlow框架到NPU平台的移植的经验;
4、跟踪NPU模型部署前沿技术及行业动态,将新技术、新方法应用于实际工作,优化部署流程与工具链;
5、与算法应用、硬件、测试团队深度协作,提供部署技术支持