美团(meituan)招聘【北斗】CodeAgent后训练方向研究员(数据分析与ToSQL方向)
招聘职位:
【北斗】CodeAgent后训练方向研究员(数据分析与ToSQL方向) 搜索同类职位
岗位职责:
我们致力于用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升,依托生活服务领域多样化且复杂的业务场景,聚焦基座技术与公司战略级应用方向的深度融合,持续推动前沿技术的落地,同时积极探索和挑战技术的无人区,不断定义并刷新行业的最先进技术标准。
1、异构数据理解与数值推理:突破大模型在Table+文本混合形态下的信息丢失与幻觉瓶颈
2、Agentic RL与数据环境交互:构建基于代码执行沙盒与真实数据计算结果反馈的强化学习闭环
3、复杂推理与过程奖励(PRM):构建细粒度过程奖励模型,研究Test-Time Compute策略与MCTS搜索
任职要求:
【岗位要求】
1、在Agentic RL、PRM或复杂代码推理等方向有深入研究
2、顶会论文发表(ACL/EMNLP/NeurIPS/ICLR/KDD等)者优先
3、GitHub高Star AI原生项目或向OpenClaw/OpenCode提交过核心PR者优先
【岗位吸引力】
1、行业稀缺数据资产:美团海量真实业务数据+数值推理数据,稀缺性极高,不局限于公开数据集
2、聚焦全链路前沿研究:代码执行沙盒作为强化学习反馈源,从场景构建→Agentic RL训练→沙盒验证→线上部署端到端完整研究,而非孤立模块
3、充足的资源:提供充足的GPU集群与Token,加速你的研究
4、AI-Native研发文化:团队全面拥抱AI工具,用AI加速你自己的研究——本身就是研究对象的一部分,不设条条框框
我们致力于用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升,依托生活服务领域多样化且复杂的业务场景,聚焦基座技术与公司战略级应用方向的深度融合,持续推动前沿技术的落地,同时积极探索和挑战技术的无人区,不断定义并刷新行业的最先进技术标准。
1、异构数据理解与数值推理:突破大模型在Table+文本混合形态下的信息丢失与幻觉瓶颈
2、Agentic RL与数据环境交互:构建基于代码执行沙盒与真实数据计算结果反馈的强化学习闭环
3、复杂推理与过程奖励(PRM):构建细粒度过程奖励模型,研究Test-Time Compute策略与MCTS搜索
任职要求:
【岗位要求】
1、在Agentic RL、PRM或复杂代码推理等方向有深入研究
2、顶会论文发表(ACL/EMNLP/NeurIPS/ICLR/KDD等)者优先
3、GitHub高Star AI原生项目或向OpenClaw/OpenCode提交过核心PR者优先
【岗位吸引力】
1、行业稀缺数据资产:美团海量真实业务数据+数值推理数据,稀缺性极高,不局限于公开数据集
2、聚焦全链路前沿研究:代码执行沙盒作为强化学习反馈源,从场景构建→Agentic RL训练→沙盒验证→线上部署端到端完整研究,而非孤立模块
3、充足的资源:提供充足的GPU集群与Token,加速你的研究
4、AI-Native研发文化:团队全面拥抱AI工具,用AI加速你自己的研究——本身就是研究对象的一部分,不设条条框框
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!