查看更多分享

美团(meituan)招聘【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究

招聘职位：

【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究 搜索同类职位

发布日期：: 2026-04-03
工作地点：: 北京市
上海市
职位类型：: 兼职
职位类别：: 技术类算法
来源：: 美团官网

岗位职责：
简介：随着 OpenClaw、Claude Code 等 Agent 进入实战领域，传统的静态评测已无法衡量 Agent 的长程规划、自主纠错与真实环境交互能力。我们寻找对 Agent 评测范式有独特见解的同学，共同定义下一代 Agent 的考卷。你将参与的工作有：

1、评测范式研究与落地：
①针对 OpenClaw 及 Claude Code 等主流 Agent，构建基于真实生产力场景，如自动化办公、复杂代码重构、多工具协同等的动态评测沙盒环境。
②探索从“单轮对话”转向“长程任务”的评测机制，研究如何量化 Agent 的记忆一致性与环境感知力。
2、高价值方案产出：
①设计并构建能反映用户体感的评测集，不仅关注通过率，更深入拆解用户在交互过程中的使用体验。
②建立 Agent 错误归因体系，针对 Agent 陷入死循环、幻觉指令、工具调用失败等典型场景进行深度诊断。
3、未来形态探索：
①跟踪前沿 Agent 发展，研究在多智能体协同、自主进化等未来形态下的 Agent 形态和相应的评测基准。
②利用 LLM/Agent-as-a-Judge 的方式，提升自动化评测的准确性与效率。
任职要求：
1、硕士及以上学历，计算机或相关专业，博士优先；
2、在 ML / NLP / RL / CV / Speech 等相关方向有扎实的研究基础，在 ACL / EMNLP / NAACL / NeurIPS / ICML / ICLR / CVPR / ICCV / ICASSP 等顶级会议发表论文者优先；
3、优秀的代码和算法功底，具备工匠精神，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；
4、在大模型领域或强化学习领域，主导过大影响力的项目或论文者优先；
5、出色的问题分析和解决能力，有自主探索、深耕一个领域的决心和定力。

前往官网投递

免责声明：

此信息由美团官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团(meituan)【基座大模型北斗实习】基座大模型-Coding方向

下一职位：美团(meituan)内容安全产品经理实习