美团(meituan)招聘【LongCat大模型人才校招】基座大模型工程架构专家
招聘职位:
【LongCat大模型人才校招】基座大模型工程架构专家 搜索同类职位
岗位职责:
1.面向多种算力硬件和高性能网络设计分布式训练架构,包括样本IO优化、计算图编译与执行、多维度并行策略、多模型交互流程等,支持万亿参数模型在几万张GPU集群高效稳定训练,实现多种模态的基座和推理模型的高效稳定训练。
2.面向多种算力、网络环境和应用场景,设计并实现高性能的模型推理架构,应用量化、剪枝等模型压缩方法,持续降低推理成本。
3.通过手工优化方法,对特化模型子结构和硬件设备上实现SOTA性能,持续迭代基于编译的优化方案,提升通用优化的适用性、优化效果以及对新硬件的覆盖能力。
4.管理及优化全公司算法团队硬件资源,通过算法预估与启发式策略,对全公司万级别节点的大规模GPU/CPU集群构建精细化调度服务能力,持续提升资源使用效率。
【为什么是我们】
1.业界前列的算力规模,海量数据和丰富的应用场景,挑战与机遇并存。
2.协同算法团队深度参与大模型项目,Codesign设计并训练行业领先的大模型。
3.从数据规模、集群体量、算法和业务复杂度多个维度提供了技术挑战和锻炼发展的机会,个人成长速度快。
4.追求卓越和鼓励创新的团队氛围。
任职要求:
1.具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C++或Python。
2.学习能力强,对机器学习系统优化有技术热情,富有极客精神。
3.熟悉PyTorch框架和TVM/MLIR等编译优化技术的优先。
4.熟悉GPU、NPU硬件架构,熟练使用CUDA,NCCL,RDMA编程的优先。
5.熟悉机器学习、深度学习算法,希望从事工程架构方向的优先。
6.有分布式系统、高性能计算实际项目经验的优先。
7.有开源项目贡献代码者优先。
8.有在OSDI、MLSys、NIPS、KDD、ICML等会议或期刊中有论文发表者优先。
1.面向多种算力硬件和高性能网络设计分布式训练架构,包括样本IO优化、计算图编译与执行、多维度并行策略、多模型交互流程等,支持万亿参数模型在几万张GPU集群高效稳定训练,实现多种模态的基座和推理模型的高效稳定训练。
2.面向多种算力、网络环境和应用场景,设计并实现高性能的模型推理架构,应用量化、剪枝等模型压缩方法,持续降低推理成本。
3.通过手工优化方法,对特化模型子结构和硬件设备上实现SOTA性能,持续迭代基于编译的优化方案,提升通用优化的适用性、优化效果以及对新硬件的覆盖能力。
4.管理及优化全公司算法团队硬件资源,通过算法预估与启发式策略,对全公司万级别节点的大规模GPU/CPU集群构建精细化调度服务能力,持续提升资源使用效率。
【为什么是我们】
1.业界前列的算力规模,海量数据和丰富的应用场景,挑战与机遇并存。
2.协同算法团队深度参与大模型项目,Codesign设计并训练行业领先的大模型。
3.从数据规模、集群体量、算法和业务复杂度多个维度提供了技术挑战和锻炼发展的机会,个人成长速度快。
4.追求卓越和鼓励创新的团队氛围。
任职要求:
1.具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C++或Python。
2.学习能力强,对机器学习系统优化有技术热情,富有极客精神。
3.熟悉PyTorch框架和TVM/MLIR等编译优化技术的优先。
4.熟悉GPU、NPU硬件架构,熟练使用CUDA,NCCL,RDMA编程的优先。
5.熟悉机器学习、深度学习算法,希望从事工程架构方向的优先。
6.有分布式系统、高性能计算实际项目经验的优先。
7.有开源项目贡献代码者优先。
8.有在OSDI、MLSys、NIPS、KDD、ICML等会议或期刊中有论文发表者优先。
免责声明:
此信息由美团官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!