美团招聘分布式AI推理|AI-Infra研发工程师
招聘职位:
分布式AI推理|AI-Infra研发工程师 搜索同类职位【北斗】分布式AI推理/AI-Infra研发工程师
更新时间:2026-06-03
岗位职责
为了更好地提升城市即时配送的效率与体验,2017年,美团启动了无人机配送服务的探索,通过科技创新推动履约工具变革,加快建设空地协同的本地即时配送网络。目前,美团已初步完成了自主飞行无人机、智能化调度系统及高效率运营体系的研发建设工作,由此打造了一个服务于多场景、多天候的城市低空物流解决方案。
1、推理框架研发:参与构建与优化高性能分布式 AI 推理引擎,支持大模型在多卡、多机环境下的高效分布式部署与高效通信;
2、分布式任务调度:参与设计与实现面向大模型推理的高效任务调度算法。针对 Prefill与 Decoding阶段的不同资源需求,协助研发 PD 分离架构下的请求流转与精细化调度;
3、全局负载均衡:协助构建多节点、多实例集群的负载均衡策略。基于请求长度预测、全局 KV Cache 缓存命中率以及运行时显存状态,实现智能流量分发,避免集群局部热点与雪崩;
4、弹性伸缩与容错:参与大规模分布式推理集群的健康度监控,协同开发故障自动检测与动态隔离机制,提升高并发在线服务(LLM-as-a-Service)的可用性(SLA);
5、性能剖析与调优:协助排查高并发场景下,由网络延迟、长尾请求(Tail Latency)、线程锁竞争或集合通信(NCCL)瓶颈导致的全局吞吐跌落;
6.主动探索并运用各类AI工具优化日常工作流程,积极推动AI在无人机业务中的落地实践。
岗位基本要求
【岗位要求】
1、2027届获得本科及以上学历,计算机、数学等相关专业优先;
2、具有优秀的基础算法、代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
3、熟悉计算机体系结构,对 CPU/GPU 内存层次、PCIe/NVLink 带宽有清晰概念;理解操作系统核心原理(如进程调度、内存管理);
4、熟悉分布式系统的基本原理(如一致性协议、一致性哈希、负载均衡算法、集合通信 MPI/NCCL),具备良好的分布式思维;
5、具备 CUDA C/C++ 开发或优化经验,或了解 OpenAI Triton 算子编写者优先;
6、熟悉或阅读过主流推理/训练开源项目的源码者优先,如 vLLM、SGLang、TensorRT-LLM、Triton Inference Server、DeepSpeed、Megatron-LM 等
【岗位吸引力】
在这一职位上:
您将有机会参与无人机、机器人领域内大规模的数据处理分析系统的构建,进而为业务的深入发展做出贡献;
您处理的不是实验室的干净数据,而是自动驾驶、多模态智能体等真实物理世界的海量、高频、连续数据。你的代码将实时支撑物理与数字世界的万亿级流转;
您将全流程参与“底层算力 - 集合通信 - 显存调度 - 集群网关”的端到端优化,你的每一次延迟降低,都将直接变成物理实体更快的反应速度。
立即申请:zh***com[点击查看]
免责声明:
此信息由美团 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!