首页
推荐
搜索
单位
简历
APP
双选会
2026海优 网页头部-理聘AI图标
理聘AI

理聘网-职位详情页,大模型推理引擎优化工程师

大模型推理引擎优化工程师
20-50K/月
投简历
聊一聊
地点图标 深圳
工作经验图标 3-5年
教育经历图标 硕士
职位描述
C++,Python精通
底层算子开发
熟悉CPU架构
大模型部署推理经验
岗位职责: 1.算子开发与优化:针对大模型(以Transformer架构为主,包括稠密及MoE模型)的核心计算模块(如Attention、MLP/FFN、专家路由、RotaryEmbedding等),设计并实现面向AMDCPU的高性能定制算子。 2.推理引擎深度优化:深度参与或主导公司内部推理引擎在AMDCPU平台上的性能优化工作,包括计算内核重写、内存子系统优化、针对MoE等稀疏激活模型的负载均衡与调度优化、多线程与NUMA调度优化等。 3.底层指令集优化:精通使用AMD平台的低延迟编程技术,包括利用AVX2/AVX-512等SIMD指令集进行手工向量化,以及针对Zen架构进行微架构级别的性能调优。 4.性能分析与瓶颈定位:熟练使用性能剖析工具(如perf,AMDuProf,VTune等)进行全栈性能分析,精准定位从算法到硬件指令级别的瓶颈,并提出有效的优化方案。 5.技术预研与落地:持续跟踪业界先进的CPU推理加速技术(如新量化方案、算子融合策略、MoE模型高效推理、先进指令集应用等),并负责其技术验证与产品化落地。 6.协作与集成:与算法团队及框架团队紧密协作,将优化成果高效集成至公司的推理服务中,并编写清晰的核心技术文档。 任职要求: 1.计算机科学、电子工程或相关专业本科及以上学历,3年以上高性能计算、深度学习推理优化或底层计算库开发经验。 2.拥有在AMDCPU平台上进行算子开发或深度性能优化的实际项目经验。 3.精通C/C++语言,具备出色的系统编程能力、内存管理及调试技能。 4.扎实的CPU体系结构知识,尤其是对AMDZen微架构有深入理解。 5.拥有底层CPU算子的开发经验:熟练掌握使用x86intrinsics(如SSE,AVX2,AVX-512)进行手工向量化编程;精通多线程优化(如OpenMP,pthreads)及缓存友好型代码设计。 6.熟悉Transformer类模型的基本计算流程与性能热点。 7.熟悉常见的模型量化技术(如INT8,INT4)及其在CPU上的实现原理。
工作地点
深圳市大数据研究院
深圳市大数据研究院
地点图标地点圆形图片
单位简介
深圳市大数据研究院(Shenzhen Research Institute of Big Data),是在深圳市委、市政府的支持下于2016年3月组建成立的市属二类事业单位,其前身是香港中文大学(深圳)副校长罗智泉教授领衔的大数据信息处理及应用创新团队。2019年,研究院被正式授牌成为深圳市基础研究机构之一。 研究院以数学为基础,以数据为驱动,以重大应用为导向,聚焦网络系统优化、人工智能大模...
查看更多
福利待遇
五险一金
大牛带队
定期体检
子女教育
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
深圳市大数据研究院
其他事业单位
热招 27 个职位
单位主页
Ai入口图
猜你喜欢
更多