小红书招聘Dots-【Ace顶尖实习生】可扩展监督的 AI 对齐方法
招聘职位:
Dots-【Ace顶尖实习生】可扩展监督的 AI 对齐方法 搜索同类职位
岗位职责:
本课题聚焦于一个随模型能力提升而愈发紧迫的根本性问题:当 AI 在越来越多任务上超越人类判断能力时,如何维持有效的对齐监督。传统 RLHF 依赖人类对模型输出的直接评估,但这一前提在模型能力持续增强后逐渐失效——人类既无法高效覆盖海量反馈需求,也难以可靠判断超出自身认知边界的输出质量。研究将围绕以下核心问题展开:如何通过 AI 辅助人类完成超出其独立判断能力的监督任务(弱监督者监督强模型);如何设计递归自我批评、辩论等机制,使模型输出的质量评估本身可被自动化验证;如何在对齐传递链条中保证价值观的稳定性与一致性,防止逐级放大的偏差;以及如何在产品真实场景中收集高效的人类反馈信号,形成研究与产品协同迭代的闭环。
任职要求:
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。
本课题聚焦于一个随模型能力提升而愈发紧迫的根本性问题:当 AI 在越来越多任务上超越人类判断能力时,如何维持有效的对齐监督。传统 RLHF 依赖人类对模型输出的直接评估,但这一前提在模型能力持续增强后逐渐失效——人类既无法高效覆盖海量反馈需求,也难以可靠判断超出自身认知边界的输出质量。研究将围绕以下核心问题展开:如何通过 AI 辅助人类完成超出其独立判断能力的监督任务(弱监督者监督强模型);如何设计递归自我批评、辩论等机制,使模型输出的质量评估本身可被自动化验证;如何在对齐传递链条中保证价值观的稳定性与一致性,防止逐级放大的偏差;以及如何在产品真实场景中收集高效的人类反馈信号,形成研究与产品协同迭代的闭环。
任职要求:
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!