哔哩哔哩(bilibili|b站)招聘游戏算法实习生【2027届】
招聘职位:
游戏算法实习生【2027届】 搜索同类职位
岗位介绍:
职位描述
工作职责:
1.参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析
2.参与RLVR/RLAIF强化学习训练流程:数据构建、reward shaping、训练调优
3.参与多语种机器翻译(MT)方向:语料处理、模型微调、评测
4.参与Long horizon agentic RL(长程智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化
5.编写实验脚本、构建评测工具,支持模型上线前的质量验证
工作要求:
我们希望你:
1. 深度学习基础扎实,熟悉当前主流LLM架构
2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
3. 有LLM相关项目经验:CPT、SFT、RL 任意方向即可
4. 有阅读论文与复现能力,能快速上手实验
5. 良好的自我学习能力和独立思考能力
加分项:
1. 有相关领域顶会论文,或拥有影响力工作
2. 有自己的LLM项目
3. 有机器翻译(MT)经验
4. 有 Agent RL相关的训练经验,或 harness engineering 经验
网申须知
网申开始日期:2026-06-15 00:00
网申截止日期:2027-06-30 00:00
仅限 2026-09 至 2030-06 毕业的大学生,快来投递吧~
投递简历
职位描述
工作职责:
1.参与大规模MoE模型的持续预训练(CPT):数据清洗与混合策略、训练调优与结果分析
2.参与RLVR/RLAIF强化学习训练流程:数据构建、reward shaping、训练调优
3.参与多语种机器翻译(MT)方向:语料处理、模型微调、评测
4.参与Long horizon agentic RL(长程智能体强化学习)方向:搭建复杂交互环境与任务流、多步骤推理轨迹(Trajectory)收集、Reward设计与策略网络优化
5.编写实验脚本、构建评测工具,支持模型上线前的质量验证
工作要求:
我们希望你:
1. 深度学习基础扎实,熟悉当前主流LLM架构
2. 熟悉常见大模型训练框架(Megatron/DeepSpeed/Verl)
3. 有LLM相关项目经验:CPT、SFT、RL 任意方向即可
4. 有阅读论文与复现能力,能快速上手实验
5. 良好的自我学习能力和独立思考能力
加分项:
1. 有相关领域顶会论文,或拥有影响力工作
2. 有自己的LLM项目
3. 有机器翻译(MT)经验
4. 有 Agent RL相关的训练经验,或 harness engineering 经验
网申须知
网申开始日期:2026-06-15 00:00
网申截止日期:2027-06-30 00:00
仅限 2026-09 至 2030-06 毕业的大学生,快来投递吧~
投递简历
免责声明:
此信息由b站官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“b站官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!