查看更多分享

哔哩哔哩(bilibili|b站)招聘前端开发实习生（直播方向）【2027届】

招聘职位：

前端开发实习生（直播方向）【2027届】 搜索同类职位

发布日期：: 2026-03-05
工作地点：: 上海
职位类型：: 兼职
职位类别：: 实习
来源：: b站官网

岗位介绍：
职位描述

工作职责:
1. 分布式训练底座 (Training Infra)
架构设计：负责维护和优化基于 Megatron-LM, DeepSpeed, Ray 或 FSDP 的大规模分布式训练框架。
通信优化：深入优化 H/NCCL 通信库，解决 RDMA/RoCE 网络下的通信瓶颈，提升多机多卡并行效率（DP/PP/TP/CP/EP）。
稳定性保障：构建自动容错与快速恢复系统（Checkpoint 优化、故障自动检测与接续），确保千卡集群在数月跨度的训练中保持极高可用性。
2. 推理加速与工程化 (Inference Infra)
高性能引擎：深度定制或调优 vLLM, TensorRT-LLM, Triton Inference Server 等推理框架。
算子开发：针对 Transformer 结构编写高性能 CUDA/Triton kernels（如 FlashAttention, PagedAttention 的底层实现或改进）。
资源调度：优化 K8s 集群下的 GPU 资源调度，实现动态扩缩容、请求批处理（Continuous Batching）以及 Prefix Caching。
3. 存储与算力管理 (Storage & Compute)
I/O 优化：优化超大规模数据集的加载速度，解决训练过程中的存储带宽瓶颈（如利用 GPFS, Lustre 或 JuiceFS）。
监控与观测：建立精细化的 GPU 利用率、显存压力、网络带宽监控体系，定位并消除“长尾效应”和计算气泡。
工作要求:
技术底色：计算机相关专业，具有较强的系统编程能力，精通 Python 和 C/C++。
分布式背景：深入理解分布式协议（如 Raft/Paxos）及分布式计算理论，有大规模集群（128卡以上）运维或开发经验。
计算底层：熟悉 NVIDIA GPU 架构 (Hopper/Ampere/Blackwall)，理解显存层次结构、流处理器（SM）工作原理。
框架经验：至少深入读过一种主流框架（如 PyTorch,Megatron, vLLM, DeepSpeed）的底层核心源代码。
网络与硬件：熟悉 InfiniBand 或 RoCE 网络拓扑，了解 AI 服务器硬件架构（NVLink, NVSwitch）。

网申须知

网申开始日期：2026-03-05 00:00

网申截止日期：2026-06-01 00:00

仅限 2026-09 至 2027-08 毕业的大学生，快来投递吧～

投递简历

前往官网投递

免责声明：

此信息由b站官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“b站官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：小红书(xiaohongshu)商业化项目管理实习生-耐消组 base上海

下一职位：美团(meituan)大模型算法实习生