美团招聘基础大模型 Post-training算法研究员
招聘职位:
基础大模型 Post-training算法研究员 搜索同类职位【LongCat大模型人才校招】基础大模型 Post-training 算法研究员
更新时间:2026-06-03
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责
我们在探索通过数据优化及大规模RL的方式,持续提升模型的核心基础能力和复杂生产力场景解决困难问题的能力。让模型具备深度思考与可靠行动的特性,推动模型在真实复杂任务中实现从“会说”到“会做”的跨越。团队在以下方向上进行探索,若你对以下一个或者多个课题感兴趣均欢迎投递:
1)大模型核心基础能力优化
1.围绕指令遵循、幻觉缓解、复杂推理、智能体规划等关键能力,研究并开发高效的后训练与对齐方案。
2.深入分析模型行为,通过数据策略、奖励建模、训练范式创新等,系统性提升模型的可靠性与实用性。
2)大规模强化学习与多目标RL训练
1.研究大规模强化学习(RL)及多目标强化学习的训练方案,突破RL在超大模型上的训练稳定性与扩展性问题。
2.构建可长期演进、稳定高效的RL Scaling训练管线,从算法、系统、数据等多维度推动模型能力持续提升。
3)长周期场景下的复杂推理与工具调用
1.聚焦Long Horizon任务中的多步推理、工具使用与自主智能体能力,设计并实现前沿优化方案。
2.探索包括高质量数据合成、长上下文管理、长上下文强化学习、过程监督、搜索与规划结合等关键技术,提升模型在复杂真实场景下的表现。
【为什么是我们】
1.团队扁平,人才密度高,近年团队在ICLR、NeurIPS、ICML、ACL等顶会累计发表论文数十篇,团队员工获EMNLP/ACL等Outstanding Paper;
2.参与大语言模型核心技术研发,接触大规模RL、超长上下文、分布式训练和推理优化等前沿技术;
3.充足算力保障,拥有大规模分布式训练环境和丰富数据资源。
岗位基本要求
1.全球Top高校计算机科学、人工智能、数学、物理或相关领域应届博士/顶尖硕士毕业生;
2.在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文;
3.具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,对技术开发及应用有热情;
加分项:
1.目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间;
2.条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标;
3.在程序设计竞赛,如ACM/ICPC、Topcoder和Codeforces等,取得优异成绩者优先。
立即申请:zh***com[点击查看]
免责声明:
此信息由美团 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!