美团(meituan)招聘【基座大模型北斗实习】下一代智能体系统与智能体自进化/持续学习能力研究
招聘职位:
【基座大模型北斗实习】下一代智能体系统与智能体自进化/持续学习能力研究 搜索同类职位
岗位职责:
简介:下一代智能体系统的构建作为 2026 年进一步实现 AGI 的发展重点,claw 的火爆也揭示了这里的丰富潜力。我们认为,训练智能体系统的核心在于训练对任意复杂的环境进行合理交互、并在复合guidance 信号下充分进行系统级长程任务解决的能力。对于启发下一代智能体系统构建的任务,我们主要拆解如下特点:
1、长程性 :模型需要具备可靠地进行长周期任务执行的能力,让人不需要频繁 check,i.e.,模型可以自主稳定、目标导向地无人类监管运行 x 小时,且运行时间和任务完成度 / 任务完成量正相关。
2、系统性:模型需要能够原生地对高抽象层级的任务进行执行和拆解,不然模型只是终端工具,依然依赖大量的 human work 制订 workflow / pipeline,i.e.,模型可以通过单次运行解决人类需要工作 y 小时的任务。
3、探索性 & 成长性:可以预期模型具备在合适的时机自发进行有意义的探索,并以恰当的可掌握、高信息密度的形态进行增量信息的提取、构建与维护的能力,并充分利用这样的反复、多次的自监督探索所带来的自进化 / 自迭代 / 持续学习潜力。
4、多样性 & 鲁棒性:模型需要可以在复杂、多样、跨模态的任务域内做功,在高度分化的真实、可能带噪声的全模态环境下处理高度分化的任务。
具体的,我们关注如下研究目标:
1、通过 Large Scale RL Scaling 等手段,训练智能体系统能够在多样化、有噪声的真实、全模态环境下,支持多样化的 Tools、Skills、Subagents 的稳定、正确、综合、可插拔式灵活使用,并能在一定限度内进行环境的修复与可靠改造。
2、探索在易于模型理解使用的前提下,训练智能体系统以更高信息密度的形态构建、维护和利用 memory,使模型能主动在重复性任务或封闭任务域中总结、提炼认知与经验,并进行有效复用,达到不断自进化 / 自迭代 / 持续学习的效果。
3、训练智能体系统的系统性长程任务高效处理能力,可以自主进行合理的任务拆解、分工;探索通过 agent swarm 或其他先进的 multi-agent system 进行系统性长程任务的并行执行和提效。
4、探索多模态推理和多模态环境交互的范式,并基于此进行增强智能体系统在复杂全模态环境下的任务完成能力。
任职要求:
1、本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业在读;
2、在强化学习、文本 / 多模态大模型训练、Agent、世界模型等一个或多个领域有较深入的研究和实践经验者;
3、好奇心驱动,具有出色的分析、解决问题的能力,有自主探索解决方案的能力者;
4、具有良好的沟通协作能力,对追求纯粹的技术有强烈热情,工作积极主动,能够与团队融洽合作,一起探索新技术并快速试验想法,推进技术进步。
简介:下一代智能体系统的构建作为 2026 年进一步实现 AGI 的发展重点,claw 的火爆也揭示了这里的丰富潜力。我们认为,训练智能体系统的核心在于训练对任意复杂的环境进行合理交互、并在复合guidance 信号下充分进行系统级长程任务解决的能力。对于启发下一代智能体系统构建的任务,我们主要拆解如下特点:
1、长程性 :模型需要具备可靠地进行长周期任务执行的能力,让人不需要频繁 check,i.e.,模型可以自主稳定、目标导向地无人类监管运行 x 小时,且运行时间和任务完成度 / 任务完成量正相关。
2、系统性:模型需要能够原生地对高抽象层级的任务进行执行和拆解,不然模型只是终端工具,依然依赖大量的 human work 制订 workflow / pipeline,i.e.,模型可以通过单次运行解决人类需要工作 y 小时的任务。
3、探索性 & 成长性:可以预期模型具备在合适的时机自发进行有意义的探索,并以恰当的可掌握、高信息密度的形态进行增量信息的提取、构建与维护的能力,并充分利用这样的反复、多次的自监督探索所带来的自进化 / 自迭代 / 持续学习潜力。
4、多样性 & 鲁棒性:模型需要可以在复杂、多样、跨模态的任务域内做功,在高度分化的真实、可能带噪声的全模态环境下处理高度分化的任务。
具体的,我们关注如下研究目标:
1、通过 Large Scale RL Scaling 等手段,训练智能体系统能够在多样化、有噪声的真实、全模态环境下,支持多样化的 Tools、Skills、Subagents 的稳定、正确、综合、可插拔式灵活使用,并能在一定限度内进行环境的修复与可靠改造。
2、探索在易于模型理解使用的前提下,训练智能体系统以更高信息密度的形态构建、维护和利用 memory,使模型能主动在重复性任务或封闭任务域中总结、提炼认知与经验,并进行有效复用,达到不断自进化 / 自迭代 / 持续学习的效果。
3、训练智能体系统的系统性长程任务高效处理能力,可以自主进行合理的任务拆解、分工;探索通过 agent swarm 或其他先进的 multi-agent system 进行系统性长程任务的并行执行和提效。
4、探索多模态推理和多模态环境交互的范式,并基于此进行增强智能体系统在复杂全模态环境下的任务完成能力。
任职要求:
1、本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业在读;
2、在强化学习、文本 / 多模态大模型训练、Agent、世界模型等一个或多个领域有较深入的研究和实践经验者;
3、好奇心驱动,具有出色的分析、解决问题的能力,有自主探索解决方案的能力者;
4、具有良好的沟通协作能力,对追求纯粹的技术有强烈热情,工作积极主动,能够与团队融洽合作,一起探索新技术并快速试验想法,推进技术进步。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!