美团招聘【大模型北斗实习】大模型复杂推理前沿研究
招聘职位:
【大模型北斗实习】大模型复杂推理前沿研究 搜索同类职位
岗位职责:
Reasoning(推理)是大模型理解和处理信息的核心能力,是通用智能水平逼近的重要观测维度。课题聚焦于探究生成式模型的高级推理发生机制,提升大模型在复杂任务上的推理表现。
研究内容包括但不限于:
1)复杂任务推理应用效果优化,诸如逻辑推理、数学推理、代码推理、跨模态推理、多模型决策等。
2) RL scaling,通过大规模强化学习持续提升模型推理能力。
3)Test time scaling,通过增加inference时消费的算力持续提升模型推理能力。
任职要求:
1)熟悉NLP、LLM、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2)熟悉Python、C++等至少一门编程语言,熟悉LINUX环境。
3)熟悉 Megatron、DeepSpeed 等开源训练框架。
4)熟悉PPO、DPO、GRPO等常用RL算法。
加分项:
1)有影响力的开源项目中做出过核心贡献。
2)发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。
Reasoning(推理)是大模型理解和处理信息的核心能力,是通用智能水平逼近的重要观测维度。课题聚焦于探究生成式模型的高级推理发生机制,提升大模型在复杂任务上的推理表现。
研究内容包括但不限于:
1)复杂任务推理应用效果优化,诸如逻辑推理、数学推理、代码推理、跨模态推理、多模型决策等。
2) RL scaling,通过大规模强化学习持续提升模型推理能力。
3)Test time scaling,通过增加inference时消费的算力持续提升模型推理能力。
任职要求:
1)熟悉NLP、LLM、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2)熟悉Python、C++等至少一门编程语言,熟悉LINUX环境。
3)熟悉 Megatron、DeepSpeed 等开源训练框架。
4)熟悉PPO、DPO、GRPO等常用RL算法。
加分项:
1)有影响力的开源项目中做出过核心贡献。
2)发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!