查看更多分享

小红书(xiaohongshu)招聘【Ace顶尖实习生】交互式进化审核 Agent 系统研究

招聘职位:

【Ace顶尖实习生】交互式进化审核 Agent 系统研究 搜索同类职位
发布日期:
2026-06-14
工作地点:
职位类型:
兼职
职位类别:
策略算法
来源:
小红书官网
岗位职责:
本课题旨在探索一种基于“教学—纠正”闭环的交互式进化审核 Agent 系统,致力于打破传统审核模型对静态规则与大规模标注样本的依赖,实现“规则—策略”的自动生成优化反馈闭环。

不同于通用 Agent,该系统强调在复杂、多变的国际化内容审核场景中,通过引入 Policy Maker 的实时干预与 Rule Set 的动态反馈,实现从“规则驱动”向“智能进化”的范式迁移。研究核心在于构建一套集成经验进化学习、在线学习及 RLRF(基于反馈的强化学习)的复合技术架构。关键问题包括:如何将抽象的审核政策(Policy)自动化解析为可执行的 Agent 策略链路,如何在跨语言、跨文化背景下构建具备自主学习能力的 Agent 基座,以及如何在极度稀疏的违规样本中利用小样本(Few-shot)实现风险域的“0 人审”冷启动。
任职要求:
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。
免责声明:

此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!