美团招聘【大模型北斗实习】Post-training 前沿算法研究

招聘职位:

【大模型北斗实习】Post-training 前沿算法研究 搜索同类职位
发布日期:
2025-05-23
工作地点:
职位类型:
兼职
来源:
美团官网
岗位职责:
Post-training是联结大模型通用知识和人类偏好的桥梁,在规范知识输出、提升推理能力、对齐人类偏好等方面起到了关键作用。本课题专注于大模型Post-training相关前沿算法研究,包括但不限于:
1)训练机制设计和优化:包括数据建设、指令微调,人类偏好和安全对齐,奖励模型、强化学习及效果评估等方向,优化模型文本创作、逻辑推理、指令遵循、代码生成、工具调用等能力,提升模型可控性和安全性。
2)Post-training前沿研究:面向下一代推理基座的架构设计,test-time compute训练范式,思维链学习,多智能体和自博弈强化学习,提升模型的复杂任务处理能力和智能水平。
任职要求:
1)熟悉NLP、LLM、RL等领域,在一个或多个相关领域有深入研究经历并有实际论文产出或项目经验。
2)熟悉大模型算法研究所需的相关编程语言、工具、算法等,如Python、C++等编程语言、Megatron等训练框架、DPO、PPO等相关算法。
3)具备独立开展科学研究和实验的能力,对大模型相关技术有浓厚兴趣,具备强烈的进取心、求知欲,热衷于追求行业顶尖的技术创新。
加分项:
1)有大模型一线研究和实践经验,在大模型领域发表过高影响力论文或主导/参与过知名开源项目者优先。
2)发表过高影响力论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。
免责声明:

此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 美团招聘常见问答

美团招聘工作地点:
北京市,上海市