美团招聘【大模型北斗实习】大规模 Post-training 算法架构前沿研究

招聘职位:

【大模型北斗实习】大规模 Post-training 算法架构前沿研究 搜索同类职位
发布日期:
2025-05-23
工作地点:
职位类型:
兼职
来源:
美团官网
岗位职责:
Post-training 是提升大模型专项能力的核心技术方向之一,包括不限于复杂推理(Reasoning)、价值观对齐(Alignment)、业务Agent应用等研究方向。
本课题研究方向包括但不限于:
1)实现高效灵活的多模型强化学习训练架构。
2)通过合理灵活动态配置资源,提升PPO及各变种算法运行效率。
3)研究低精度在 Post-training 中的应用方式。
4)研究不同的算法+数据对效果的影响。
5)在复杂框架下,研究如何高效的追踪记录训练过程,提升算法探索效率。
任职要求:
1)熟悉大规模分布式训练、推理、量化等技术之一。
2)熟悉常用的训练推理框架,vLLM、SGLang、Megatron、Deepspeed等。
3)熟悉强化学习算法。
加分项:相关领域开源项目或发表高水平论文。
免责声明:

此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 美团招聘常见问答

美团招聘工作地点:
北京市,上海市