查看更多分享

小红书招聘Dots-【Ace顶尖实习生】AI 安全、评估与价值观对齐研究

招聘职位：

Dots-【Ace顶尖实习生】AI 安全、评估与价值观对齐研究 搜索同类职位

发布日期：: 2026-06-16
工作地点：: 上海市
北京市
杭州市
职位类型：: 兼职
职位类别：: 大模型
来源：: 小红书官网

岗位职责：
本研究方向聚焦于构建兼具强大能力与安全保障的AI系统，确保技术发展与人类价值观保持一致。随着AI能力边界不断扩展，系统性评估其安全性与行为边界变得至关重要。

研究将开发先进的红队测试方法，通过模拟各类攻击场景揭示模型弱点；建立抵御"越狱"尝试的防御机制，使AI在面对误导性指令时维持适当行为；探索价值观对齐技术，使AI能理解并遵循复杂的社会规范与伦理准则。研发量化评估框架，客观衡量AI系统的安全性与符合预期的程度。这一方向旨在构建真正可信赖的人工智能，使其能在发挥最大潜能的同时，始终将人类福祉置于核心位置，为负责任的AI发展提供技术保障。
任职要求：
1、不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先；
2、优秀的代码能力、数据结构和基础算法功底，熟悉Python等至少一门编程语言；
3、熟悉大模型领域相关研究工作和算法，有大模型研发基础；
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先；
5、良好的沟通协作能力，责任心强，积极主动，能和团队一起探索新技术，推进技术进步。

前往官网投递

免责声明：

此信息由小红书官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团自然语言理解（大模型）实习生

下一职位：小红书PMO实习生