哔哩哔哩(bilibili|b站)招聘前端开发实习生(直播方向)【2027届】

招聘职位:

前端开发实习生(直播方向)【2027届】 搜索同类职位
发布日期:
2026-03-05
工作地点:
职位类型:
兼职
职位类别:
实习
来源:
b站官网
岗位介绍:
职位描述

工作职责:
1. 分布式训练底座 (Training Infra)
架构设计: 负责维护和优化基于 Megatron-LM, DeepSpeed, Ray 或 FSDP 的大规模分布式训练框架。
通信优化: 深入优化 H/NCCL 通信库,解决 RDMA/RoCE 网络下的通信瓶颈,提升多机多卡并行效率(DP/PP/TP/CP/EP)。
稳定性保障: 构建自动容错与快速恢复系统(Checkpoint 优化、故障自动检测与接续),确保千卡集群在数月跨度的训练中保持极高可用性。
2. 推理加速与工程化 (Inference Infra)
高性能引擎: 深度定制或调优 vLLM, TensorRT-LLM, Triton Inference Server 等推理框架。
算子开发: 针对 Transformer 结构编写高性能 CUDA/Triton kernels(如 FlashAttention, PagedAttention 的底层实现或改进)。
资源调度: 优化 K8s 集群下的 GPU 资源调度,实现动态扩缩容、请求批处理(Continuous Batching)以及 Prefix Caching。
3. 存储与算力管理 (Storage & Compute)
I/O 优化: 优化超大规模数据集的加载速度,解决训练过程中的存储带宽瓶颈(如利用 GPFS, Lustre 或 JuiceFS)。
监控与观测: 建立精细化的 GPU 利用率、显存压力、网络带宽监控体系,定位并消除“长尾效应”和计算气泡。
工作要求:
技术底色: 计算机相关专业,具有较强的系统编程能力,精通 Python 和 C/C++。
分布式背景: 深入理解分布式协议(如 Raft/Paxos)及分布式计算理论,有大规模集群(128卡以上)运维或开发经验。
计算底层: 熟悉 NVIDIA GPU 架构 (Hopper/Ampere/Blackwall),理解显存层次结构、流处理器(SM)工作原理。
框架经验: 至少深入读过一种主流框架(如 PyTorch,Megatron, vLLM, DeepSpeed)的底层核心源代码。
网络与硬件: 熟悉 InfiniBand 或 RoCE 网络拓扑,了解 AI 服务器硬件架构(NVLink, NVSwitch)。

网申须知

网申开始日期:2026-03-05 00:00

网申截止日期:2026-06-01 00:00

仅限 2026-09 至 2027-08 毕业的大学生,快来投递吧~

投递简历
免责声明:

此信息由b站官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“b站官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!