美团招聘【大模型北斗实习】Operator 智能体方向算法研究
招聘职位:
【大模型北斗实习】Operator 智能体方向算法研究 搜索同类职位
岗位职责:
随着大模型与生成式 AI 技术的快速发展,在多模态和复杂场景下让 Agent 具备更强大的决策和执行能力成为未来的重要趋势。OpenAI Operator 通过结合强化学习的多步决策机制与大模型的理解、推理优势,可在多种任务场景(如 Computer Use、网页浏览等)中实现高效且灵活的自动化决策和任务执行。本课题将聚焦多样化业务场景和复杂环境下的自适应策略设计、规划与推理,进一步提升 Agent 在真实应用中的表现。
主要研究内容包括但不限于:
1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务。
2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力。
3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法;研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现。
任职要求:
1)熟悉强化学习领域常用算法及理论基础(如 DQN、Policy Gradient、PPO、GRPO 等。
2)熟练掌握至少一门编程语言(如 Python、Java),熟悉 Linux 环境。
3)具备深度学习框架(如 PyTorch、TensorFlow)实际项目经验;了解大模型或分布式训练框架(Megatron、DeepSpeed 等)者优先。
4)对大模型在 Agent 规划、推理中的作用有浓厚兴趣,对 LLM + RL 的前沿研究有基本认识。
5)具备良好的问题分析和解决能力,对新技术保持学习和探索的热情。
加分项:
1)在 NeurIPS、ICLR、ICML、ACL、EMNLP 等相关领域高水平期刊/会议发表论文或在有影响力的开源项目中做出核心贡献。
2)在多 Agent、层级强化学习或多模态融合等领域有深入研究或项目经验者优先。
3)具备 General Agent 使用经验(如 OpenAI Operator、Manus AI 等)者优先。
随着大模型与生成式 AI 技术的快速发展,在多模态和复杂场景下让 Agent 具备更强大的决策和执行能力成为未来的重要趋势。OpenAI Operator 通过结合强化学习的多步决策机制与大模型的理解、推理优势,可在多种任务场景(如 Computer Use、网页浏览等)中实现高效且灵活的自动化决策和任务执行。本课题将聚焦多样化业务场景和复杂环境下的自适应策略设计、规划与推理,进一步提升 Agent 在真实应用中的表现。
主要研究内容包括但不限于:
1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务。
2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力。
3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法;研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现。
任职要求:
1)熟悉强化学习领域常用算法及理论基础(如 DQN、Policy Gradient、PPO、GRPO 等。
2)熟练掌握至少一门编程语言(如 Python、Java),熟悉 Linux 环境。
3)具备深度学习框架(如 PyTorch、TensorFlow)实际项目经验;了解大模型或分布式训练框架(Megatron、DeepSpeed 等)者优先。
4)对大模型在 Agent 规划、推理中的作用有浓厚兴趣,对 LLM + RL 的前沿研究有基本认识。
5)具备良好的问题分析和解决能力,对新技术保持学习和探索的热情。
加分项:
1)在 NeurIPS、ICLR、ICML、ACL、EMNLP 等相关领域高水平期刊/会议发表论文或在有影响力的开源项目中做出核心贡献。
2)在多 Agent、层级强化学习或多模态融合等领域有深入研究或项目经验者优先。
3)具备 General Agent 使用经验(如 OpenAI Operator、Manus AI 等)者优先。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!