工作年限要求:3年以上
是否能接受应届生:否
岗位职责:
1.核心算子开发与优化:负责大模型(涵盖不同架构与规模)中关键计算算子(如Attention、Linear、LayerNorm等)在昇腾910B、V100等异构计算平台上的高性能实现、定制化优化与持续迭代。
2.模型部署与性能调优:主导将多个国产及开源大模型高效部署到目标硬件平台,进行端到端的性能剖析、瓶颈定位与系统级优化,确保模型在训练与推理场景下的最佳性能表现。
3.应用系统底层支撑:为上层AI应用系统(如RAG、智能体、图像/视频智能处理、智能客服、文档智能分析等)提供稳定、高效的底层算子与计算内核支持,解决其在规模化应用中遇到的计算性能挑战。
4.技术攻关与前瞻探索:针对新兴模型架构与算法,进行前瞻性的算子设计与适配;攻坚在特定硬件平台上的疑难性能问题,探索并实现创新的优化技术。
5.协作与赋能:与算法研究、框架开发及产品团队紧密协作,理解业务需求,将优化成果产品化,并编写高质量的技术文档,赋能团队。
任职要求:
1.深厚的技术功底:精通C++/CUDA,熟悉Python,对计算机体系结构、并行计算有深刻理解。2.丰富的优化经验:具有丰富的深度学习算子开发与优化经验,熟悉常见大模型的计算模式。有在昇腾(CANN)、NVIDIA(CUDA/cuDNN/TensorRT)等平台上实际开发优化经验者优先。3.模型部署实践:熟悉PyTorch、TensorFlow等至少一种主流深度学习框架的底层机制,有大规模模型训练或推理部署实战经验。4.问题解决能力:优秀的性能分析、定位和调优能力,能使用NsightCompute、Profiling等工具进行深度性能分析。
福利待遇:
1.提供具有竞争力的薪酬待遇和福利,特别优秀者可一人一议。
2.提供覆盖全城的免费班车,员工通勤无忧。
3.年度体检、佳节礼包、生日惊喜等福利拉满。
4.子女入学、提供香港中文大学(深圳)附属幼儿园、小学、初中。