查看更多分享

小红书招聘大模型后训练算法研发工程师（实习）

招聘职位：

大模型后训练算法研发工程师（实习） 搜索同类职位

发布日期：: 2025-10-14
工作地点：: 上海市
北京市
职位类型：: 兼职
职位类别：: 机器学习平台
来源：: 小红书官网

岗位职责：
模型训练：参与大型语言模型的训练实验，学习如何通过思维链推理提升模型在复杂任务上的表现
算法探索：学习探索前沿强化学习算法，协助团队进行奖励模型的构建和优化
Reasoning技术探索：参与模型监督、自我提升等训练优化探索
训练框架优化：学习使用LLM训练框架，参与协助优化训练流程，提升团队开发效率
任职要求：
任职资格
具备较好的编程能力和算法开发能力，熟悉常用的机器学习、深度学习算法
熟悉Llama-Factory、veRL、MS-Swift等框架，有相关项目经验更佳
了解分布式训练框架如DeepSpeed、Megatron-LM等
有较强的学习意愿和团队协作精神，能保证每周至少3天实习时间，实习期至少3个月
加分项
对强化学习有基本了解或项目经验
有开源项目贡献经历，尤其是与LLM相关的项目
发表过相关领域的学术论文
对模型对齐、推理、思维链(CoT)等LLM训练技术有了解

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团自然语言理解（大模型）实习生

下一职位：小红书PMO实习生

小红书招聘大模型后训练算法研发工程师（实习）

招聘职位：

FAQ 小红书招聘常见问答

投递进展笔记

求职进度

进展结果

发生时间

求职体验

是否匿名

提示