任职要求:
负责大模型预训练、微调、强化学习及性能优化,通过数据迭代提升模型逻辑分析能力。优化大模型推理服务部署与吞吐性能,支持跨团队完成推理服务部署。跟踪业内前沿技术,优化生成方案,评测推理效果,提升垂直领域应用能力。设计开发大模型软件栈数据工具方案,推动行业客户场景落地。对接外部需求,开展技术交流,设计定制化模型方案,编写技术文档与专利。任职资格:博士学历,熟悉大语言模型、多模态模型结构与基础算法,精通Python及PyTorch框架。具备服务器使用、容器化部署、Linux操作及并行计算基础,了解CUDA、多进程/多线程编程。掌握大模型分布式并行策略,包括张量并行、流水并行、专家并行等算法。熟练使用vllm、sglang等推理框架,具备框架优化能力;熟悉C++、Cutlass、Triton,具备算子性能优化能力。
研究方向:
大语言模型、多模态模型结构与基础算法