美团招聘基础模型 -预训练
招聘职位:
基础模型 -预训练 搜索同类职位【LongCat大模型人才校招】基础模型 - 预训练
更新时间:2026-06-03
工作地点:北京市
事业群:核心本地商业-基础研发平台
岗位职责
1.探索下一代大模型训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型设计更高效的模型结构,提高给定数据量、计算量、硬件资源、序列长度等约束下的模型能力和潜力,如长序列能力、记忆能力、推理能力等。
2.探索更科学的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知。
3.探索更前沿的训练范式(如diffusion LLM,test-time scaling等具有潜力的技术),发现更高效和稳定的scaling路径。
4.研究模型结构和数据的耦合关系,优化分阶段训练范式。
5.研究模型早期表现和能力上限之间的关系。
6.结合MLsys解决大规模训练和推理中遇到的卡点问题,实现算法和工程联合设计。
【为什么是我们】
1.明确的技术判断:团队在原生多模态方向有非共识的长期投入,已发布 LongCat-Next 技术报告(离散自回归原生多模态),不是跟随式的能力补齐。
2.顶级资源支撑:5~6万卡计算集群,万亿参数文本基座已训练完成,多模态正在进行大规模上推验证——你将直接参与业界最前沿规模的多模态实验。
3.主线与探索并行:既承担多模态基座的核心交付工作,也推进下一代原生多模态架构的前沿探索,覆盖"数据→tokenizer→预训练→后训练→RL"全链路。
岗位基本要求
1.熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验。
2.熟悉主流大模型技术熟悉PyTorch、 Megatron、DeepSpeed 、vLLM、SGLang等主流开源训练和推理框架。
加分项:
1.有影响力的开源项目中做出过核心贡献。
2.发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)。
立即申请:zh***com[点击查看]
免责声明:
此信息由美团 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!