首页
推荐
搜索
单位
简历
APP
双选会
海优 热门图标
理聘AI

理聘网-职位详情页,昇腾大模型部署工程师(项目制)

昇腾大模型部署工程师(项目制)
8-20K/月
投简历
聊一聊
地点图标 深圳
工作经验图标 经验不限
教育经历图标 本科
职位描述
大模型部署
灵活办公
职位描述: 实现DeepSeek等开源大模型在华为昇腾(Ascend 910B等)上的迁移、优化及服务化封装,支持智能体对底层基座大模型的调用。 工作职责: 1.模型迁移与适配:负责 DeepSeek 等开源大模型在华为昇腾(Ascend 910B等)硬件环境下的环境搭建、权重转换及模型跑通,完成大模型接口与现有系统的对接及流式输出优化。 2.RAG 系统开发优化:负责检索增强生成全链路开发,包括文档多格式解析、向量化嵌入、向量数据库维护及召回重排序策略的调优。 3.提示词工程与调优:针对复杂业务逻辑进行 Prompt 设计、测试与迭代,通过结构化提示词与思维链设计,提升模型输出的准确性、稳定性并有效遏制幻觉。 4.Agent智能体实现:设计并实现基于Function Calling或ReAct框架的智能代理系统,完成工具调用、任务分解及多Agent协同工作流的开发。 5.系统性能与成本管控:监控并优化大模型应用的响应延迟,通过缓存机制、Token 消耗管控及模型并发处理,提升用户体验并降低运行成本。 6.稳定性保障:解决国产硬件环境下的算子兼容性报错、显存溢出(OOM)等技术难题。 任职要求: 1.技术功底:计算机相关专业本科及以上学历,精通 Python 编程,熟悉异步编程及常用后端框架,具备良好的代码规范。 2.核心经验:熟悉DeepSeek、Llama3、Qwen等开源大模型架构,了解OpenAI、Claude及国内主流大模型的能力边界与技术特性。 3.工具链掌握:熟练掌握向量数据库的使用,熟悉常用词嵌入模型及语义检索技术。 4.工程能力:深刻理解 LLM 应用开发的痛点(如上下文长度限制、数据隐私、输出不一致等),并具备成熟的工程化解决方案。 5.快速学习:对 AI 领域前沿技术(如长文本处理、多模态应用、Agentic Workflow)有高度敏感性,能快速阅读并转化最新的开源技术文档。 6.交付意识:具备强烈的项目交付导向,能在规定周期内高质量完成代码交付与技术文档编写,适应敏捷开发节奏。
发布时间:2026.02.10
工作地点
深圳市大数据研究院
深圳市大数据研究院
地点图标地点圆形图片
单位简介
深圳市大数据研究院(Shenzhen Research Institute of Big Data),是在深圳市委、市政府的支持下于2016年3月组建成立的市属二类事业单位,其前身是香港中文大学(深圳)副校长罗智泉教授领衔的大数据信息处理及应用创新团队。2019年,研究院被正式授牌成为深圳市基础研究机构之一。 研究院以数学为基础,以数据为驱动,以重大应用为导向,聚焦网络系统优化、人工智能大模...
查看更多
福利待遇
五险一金
大牛带队
定期体检
子女教育
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
深圳市大数据研究院
其他事业单位
热招 54 个职位
单位主页
Ai入口图
猜你喜欢
更多