首页
推荐
搜索
单位
简历
APP
双选会
2026海优 网页头部-理聘AI图标
理聘AI

理聘网-职位详情页,强化学习研究员

强化学习研究员
30-60W/年
投简历
聊一聊
地点图标 北京
工作经验图标 经验不限
教育经历图标 硕士
职位描述
自动驾驶
岗位职责: 1. 以E2E自驾为应用背景, 研究基于VLM的因果链和符号规划器的强化学习框架; 2.设计提升VLM过程推理能力的总体方案; 3.负责方案的训练评测工程实施,包括RMs,Verifiers,生成合成数据等; 任职资格: 1.计算机科学、应用数学等相关专业,硕士及以上学历; 2.NLP、RL领域有扎实的研究基础,熟悉主流多模态大模型; 3.较强的工程实现能力:熟练掌握Python,熟悉Linux开发环境,精通主流深度学习框架,了解分布式训练框架并有一定的多机多卡训练经验; 4.有高质量论文发表者优先;有高质量开源项目经验者优先; 5.具备极强的学习能力和学术追求,良好的团队沟通合作能力。 注:工作地点为北京朝阳区兆维工业园
工作地点
朝阳区
经纬恒润科技有限公司
地点图标地点圆形图片
单位简介
恒润科技(HiRain Technologies)是一家持续快速发展的高新技术企业,现有员工5000余人,65%以上的员工拥有硕士及博士学历,公司专业从事汽车、车联网、先进装备、轨道交通领域的电子产品研发生产、解决方案咨询服务、研发工具代理以及专业培训等,总部位于北京,设有上海、成都、深圳、美国底特律、德国慕尼黑分公司,长春、武汉、重庆、广州、南昌办事处,并在上海、天津、南通建立现代化的生产工厂,...
查看更多
福利待遇
五险一金
年终奖
定期体检
绩效待遇
公积金12%
工商信息
工商信息图标 企业名称
天津经纬恒润科技有限公司
工商信息图标 法定代表人
吉英存
工商信息图标 成立日期
2016-01-06
工商信息图标 企业类型
有限责任公司(法人独资)
工商信息图标 经营状态
存续(在营、开业、在册)
工商信息图标 注册资本
20000万元人民币
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
经纬恒润科技有限公司
企业
10000人以上
热招 21 个职位
单位主页
Ai入口图
猜你喜欢
更多