小红书(xiaohongshu)招聘搜广推训练引擎研发实习生
招聘职位:
搜广推训练引擎研发实习生 搜索同类职位
岗位职责:
【业务介绍】
作为公司统一的模型训练引擎团队,支撑公司内所有搜推广类业务的训练工程侧工作,包括模型训练、参数服务器、特征样本流水线等,通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。
你将专注于大规模AI训练系统最核心的性能优化赛道,直面千亿参数模型训练中的效率瓶颈,解决工业级AI系统在性能与规模上面临的真实挑战。
【岗位职责】
1、深入参与GPU异构计算栈的研发与调优,从算子、内存、通信多维度挖掘硬件极限性能;通过CUDA编程、内核融合、混合精度训练、通信与计算重叠等高级优化技术,不断提升训练引擎效率。
2、推动自动化扩展、智能资源调度、跨架构设备兼容(NV GPU、GPGPU、XPU等)、AI系统可观测性等先进技术在公司模型训练平台落地;
3、跟踪并推动AI系统领域的最新技术趋势(如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等),持续保持平台业界领先优势。
任职要求:
1、熟悉Linux开发环境,熟练掌握C++/Python;
2、了解至少一种主流机器学习框架(如PyTorch/TensorFlow)的基本原理和使用;
3、对性能优化、并行计算、计算机体系结构有浓厚兴趣和基本理解;
4、具备扎实的数据结构和算法基础,良好的问题分析与解决能力;
5、积极主动,具备良好的沟通能力和团队协作精神。
【加分项】
1、深入研究过至少一种机器学习框架(Tensorflow / PyTorch / Paddle 或其他自研框架)的底层架构和机制;
2、熟悉至少一种经典深度学习模型及其应用场景,如CTR模型、BERT、Transformers等;
3、熟悉CUDA编程和NV GPU架构或者其他XPU架构以及编程开发;
4、熟悉RDMA通信和NCCL通信等高网通信技术;
【业务介绍】
作为公司统一的模型训练引擎团队,支撑公司内所有搜推广类业务的训练工程侧工作,包括模型训练、参数服务器、特征样本流水线等,通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。
你将专注于大规模AI训练系统最核心的性能优化赛道,直面千亿参数模型训练中的效率瓶颈,解决工业级AI系统在性能与规模上面临的真实挑战。
【岗位职责】
1、深入参与GPU异构计算栈的研发与调优,从算子、内存、通信多维度挖掘硬件极限性能;通过CUDA编程、内核融合、混合精度训练、通信与计算重叠等高级优化技术,不断提升训练引擎效率。
2、推动自动化扩展、智能资源调度、跨架构设备兼容(NV GPU、GPGPU、XPU等)、AI系统可观测性等先进技术在公司模型训练平台落地;
3、跟踪并推动AI系统领域的最新技术趋势(如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等),持续保持平台业界领先优势。
任职要求:
1、熟悉Linux开发环境,熟练掌握C++/Python;
2、了解至少一种主流机器学习框架(如PyTorch/TensorFlow)的基本原理和使用;
3、对性能优化、并行计算、计算机体系结构有浓厚兴趣和基本理解;
4、具备扎实的数据结构和算法基础,良好的问题分析与解决能力;
5、积极主动,具备良好的沟通能力和团队协作精神。
【加分项】
1、深入研究过至少一种机器学习框架(Tensorflow / PyTorch / Paddle 或其他自研框架)的底层架构和机制;
2、熟悉至少一种经典深度学习模型及其应用场景,如CTR模型、BERT、Transformers等;
3、熟悉CUDA编程和NV GPU架构或者其他XPU架构以及编程开发;
4、熟悉RDMA通信和NCCL通信等高网通信技术;
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!