查看更多分享

小红书招聘Dots-【Ace顶尖实习生】可扩展监督的 AI 对齐方法

招聘职位：

Dots-【Ace顶尖实习生】可扩展监督的 AI 对齐方法 搜索同类职位

发布日期：: 2026-06-16
工作地点：: 北京市
上海市
杭州市
职位类型：: 兼职
职位类别：: 大模型
来源：: 小红书官网

岗位职责：
本课题聚焦于一个随模型能力提升而愈发紧迫的根本性问题：当 AI 在越来越多任务上超越人类判断能力时，如何维持有效的对齐监督。传统 RLHF 依赖人类对模型输出的直接评估，但这一前提在模型能力持续增强后逐渐失效——人类既无法高效覆盖海量反馈需求，也难以可靠判断超出自身认知边界的输出质量。研究将围绕以下核心问题展开：如何通过 AI 辅助人类完成超出其独立判断能力的监督任务（弱监督者监督强模型）；如何设计递归自我批评、辩论等机制，使模型输出的质量评估本身可被自动化验证；如何在对齐传递链条中保证价值观的稳定性与一致性，防止逐级放大的偏差；以及如何在产品真实场景中收集高效的人类反馈信号，形成研究与产品协同迭代的闭环。
任职要求：
1、不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先；
2、优秀的代码能力、数据结构和基础算法功底，熟悉Python等至少一门编程语言；
3、熟悉大模型领域尤其是强化学习相关研究工作和算法，有大模型强化学习的研发基础；
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先；
5、良好的沟通协作能力，责任心强，积极主动，能和团队一起探索新技术，推进技术进步。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团自然语言理解（大模型）实习生

下一职位：小红书搜索算法实习生-社区搜索