北京理想汽车有限公司招聘强化学习算法研究员
招聘职位:
强化学习算法研究员 搜索同类职位招聘信息
强化学习算法研究员
2026-02-1409:58:40
职位描述
职位描述:
1.负责面向自动驾驶与具身智能的强化学习算法研究与开发,包括Model-based/FreeRL、Online/OfflineRL等;
2.构建大规模分布式强化学习训练系统,推动RL算法在真实场景的规模化应用;
3.研究数据合成与评测技术,建立数据引擎与评测基准,实现realsimreal快速迭代闭环;
4.探索模仿学习、逆强化学习、ScalableOversight等技术,提升策略学习效率与泛化能力;
5.与世界模型团队协作,利用学习式仿真环境进行策略训练与验证,推动sim2real迁移;
6.参与前沿研究,发表顶会论文,推动强化学习在自动驾驶与具身智能领域的技术进步。
职位要求:
1.硕士及以上学历,机器学习、强化学习、计算机科学、自动化等相关专业;
2.扎实的强化学习理论基础,熟悉主流RL算法(PPO、SAC、TD3、IQL等)及其应用;
3.熟练掌握Python、C++编程语言,熟悉PyTorch等深度学习框架,有分布式训练经验;
4.对大规模强化学习、策略优化、模仿学习等有深入理解和实践经验;
5.具有优秀的分析和解决问题能力,自驱性强,能够独立推进研究项目。
【具备以下条件优先】
1.在NeurIPS/ICLR/ICML/ICRA/CoRL/RSS等顶级会议发表论文者优先;
2.有自动驾驶、机器人、游戏AI等领域的强化学习应用经验者优先;
3.有仿真平台(CARLA、NVIDIAIsaac、MuJoCo等)开发或使用经验者优先;
4.有Model-basedRL、WorldModel、OfflineRL、Sim2real等研究经验者优先;
5.有大规模分布式训练系统开发经验,熟悉Ray、Kubernetes等工具者优先;
6.维护过重量级开源项目或在RL相关竞赛中获奖者优先;
7.有实车/实机调试经验,了解传感器栈、控制闭环者优先。
职位类别:学术/科研
专业要求:不限
单位简介
理想汽车是中国领先的新能源智能汽车制造商,设计、研发、制造和销售豪华智能电动汽车。我们坚持自建智能制造基地,并自建供应链体系,保障核心零部件供应。创造移动的家,创造幸福的家是我们的品牌使命,我们致力于为家庭打造更安全、更便捷、更舒适的智能电动车。
联系方式
公司地址
免责声明:
此信息由浙江大学 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“浙江大学”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!