美团(meituan)招聘【基座大模型北斗实习】具身智能前沿技术研究

招聘职位:

【基座大模型北斗实习】具身智能前沿技术研究 搜索同类职位
发布日期:
2026-04-03
工作地点:
职位类型:
兼职
职位类别:
技术类算法
来源:
美团官网
岗位职责:
简介:具身智能是通往通用人工智能(AGI)的“最后一块拼图”,也是将AI从数字世界(Digital World)引入物理世界(Physical World)的关键枢纽。真正的智能不应仅存在于对话框中,而应具备理解物理法则、感知复杂环境并执行精准操作的能力。
本课题致力于打造世界一流的具身智能团队,构建统一的感知-决策-控制底层架构。我们探索将视觉、语言与动作指令深度耦合,赋予机器人像人类一样“看懂世界、预判未来、灵活操作、自然交互”的原生能力,挑战物理世界中的复杂长程任务,推动具身智能从实验室走向千家万户。

具体地,我们关注如下研究方向:
1、具身大模型感知与决策:探索构建端到端(End-to-End)的Vision-Language-Action(VLA)大模型。研究如何将海量互联网多模态数据与机器人异构动作数据进行统一表征预训练,提升模型在开放场景下的零样本任务泛化能力,实现从高层逻辑推理到底层电机控制指令的平滑映射。
2、物理世界模型与因果推理:研究基于生成式架构的物理世界模型,使机器人能够通过视频生成或状态预测“预判”行动后果。探索如何在大模型中建模物理定律(重力、摩擦、刚性/流体等),通过想象进行自监督学习和虚拟进化,解决物理实验数据稀缺与长尾场景模拟的难题。
3、视觉语义导航与长程规划:针对大尺度、动态变化的未知环境,研究结合常识推理的视觉语言导航(VLN)技术。利用大语言模型的逻辑链(CoT)能力,将复杂的模糊指令分解为可执行的动作序列,解决具身智能在复杂物理空间中的定位、语义地图构建及长程任务中的意图保持问题。
4、敏捷运动控制与精细操作:探索强化学习(RL)与大模型结合的全身协同控制方案。包括但不限于:人形机器人的复杂地形敏捷行走、基于触觉-视觉融合的多指灵巧手精细操作。研究如何通过Sim-to-Real技术将大规模仿真学习的策略高效迁移至真实硬件,实现丝滑的物理动作输出。
5、具身人机交互与在线进化:构建自然的自然语言/手势交互界面,使机器人能理解人类的情境、反馈并进行修正。研究基于人类反馈的具身强化学习与示范学习,使智能体能够在与环境、人类互动的过程中实现技能的增量学习与自我迭代。
任职要求:
1、硕士及以上学历,计算机科学、人工智能、机器人、软件工程、计算机视觉、自然语言处理等相关专业,博士优先;
2、具备优秀的编程能力,熟悉PyTorch,有大规模分布式训练和物理仿真引擎(Isaac Gym, Sapien, MuJoCo)使用经验;
3、在CV、NLP、Robotics、RL等领域顶级会议(CVPR, ICCV, ACL, NeurIPS, ICLR, ICRA, IROS等)有高质量论文发表;
4、具有良好的沟通协作能力,对物理世界充满好奇心,有志于解决机器人领域的真实痛点问题。
免责声明:

此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!