小红书招聘大模型后训练算法研发工程师(实习)
招聘职位:
大模型后训练算法研发工程师(实习) 搜索同类职位
岗位职责:
模型训练:参与大型语言模型的训练实验,学习如何通过思维链推理提升模型在复杂任务上的表现
算法探索:学习探索前沿强化学习算法,协助团队进行奖励模型的构建和优化
Reasoning技术探索:参与模型监督、自我提升等训练优化探索
训练框架优化:学习使用LLM训练框架,参与协助优化训练流程,提升团队开发效率
任职要求:
任职资格
具备较好的编程能力和算法开发能力,熟悉常用的机器学习、深度学习算法
熟悉Llama-Factory、veRL、MS-Swift等框架,有相关项目经验更佳
了解分布式训练框架如DeepSpeed、Megatron-LM等
有较强的学习意愿和团队协作精神,能保证每周至少3天实习时间,实习期至少3个月
加分项
对强化学习有基本了解或项目经验
有开源项目贡献经历,尤其是与LLM相关的项目
发表过相关领域的学术论文
对模型对齐、推理、思维链(CoT)等LLM训练技术有了解
模型训练:参与大型语言模型的训练实验,学习如何通过思维链推理提升模型在复杂任务上的表现
算法探索:学习探索前沿强化学习算法,协助团队进行奖励模型的构建和优化
Reasoning技术探索:参与模型监督、自我提升等训练优化探索
训练框架优化:学习使用LLM训练框架,参与协助优化训练流程,提升团队开发效率
任职要求:
任职资格
具备较好的编程能力和算法开发能力,熟悉常用的机器学习、深度学习算法
熟悉Llama-Factory、veRL、MS-Swift等框架,有相关项目经验更佳
了解分布式训练框架如DeepSpeed、Megatron-LM等
有较强的学习意愿和团队协作精神,能保证每周至少3天实习时间,实习期至少3个月
加分项
对强化学习有基本了解或项目经验
有开源项目贡献经历,尤其是与LLM相关的项目
发表过相关领域的学术论文
对模型对齐、推理、思维链(CoT)等LLM训练技术有了解
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!