查看更多分享

小红书招聘【实习】大规模GPU集群调度优化工程师

招聘职位:

【实习】大规模GPU集群调度优化工程师 搜索同类职位
发布日期:
2025-06-28
工作地点:
职位类型:
兼职
职位类别:
引擎
来源:
小红书官网
岗位职责:
1、GPU集群效能优化:参与面向大模型训练&推理场景万卡规模GPU集群效能优化,包括但不限于集群调度、在离线混部、GPU虚拟化、故障快速恢复、存储&网络加速,提升大规模GPU集群的整体吞吐与资源利用率
2、LLMOps建设优化:参与大模型训练&推理引擎与下游云原生平台深度融合,构建面向大模型训练、微调、推理、部署全流程LLMOps,支撑大模型在公司内生产链路稳定、高效落地
任职要求:
1、熟悉云原生生态及工具,如Kubernetes、Kubeflow、Volcano等
2、了解GPU虚拟化、GPU集群调度、高速存储/网络等相关知识
3、了解大模型基本概念及训推生命周期,如预训练、微调、对齐、推理、部署等基本概念及流程
4、熟练使用Python、Golang、C++等至少一种编程语言
加分项:
1、有集群负载的数据采集、监控、看板建设经验
2、有GPU负载特点分析及集群调度的经验或论文
3、熟悉至少一种深度学习框架,如PyTorch、TensorFlow、PaddlePaddle等
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!

FAQ 小红书招聘常见问答

小红书招聘工作地点:
北京市
小红书招聘经验要求:
in_school