小红书(xiaohongshu)招聘Dots-【Ace顶尖实习生】面向大模型预训练的高质量数据筛选研究
招聘职位:
Dots-【Ace顶尖实习生】面向大模型预训练的高质量数据筛选研究 搜索同类职位
岗位职责:
本课题聚焦预训练数据的全链路智能化处理,探索从原始语料到高质量训练集的自动化构建方法。研究方向包括但不限于:面向海量数据的高效筛选与质量评估机制、通用场景下可扩展的数据管线设计,以及端到端、自动化的高性能数据流水线构建。通过构建高质量、高效率的数据基础设施,为预训练模型的能力跃升提供数据底座支撑。
任职要求:
1. 年级不限,本科及以上在读,计算机、人工智能、软件工程或相关交叉学科背景优先, C9院校优先;
2. 拥有卓越的工程实现能力与扎实的算法功底,熟练掌握至少一门主流编程语言及 PyTorch 框架,熟练使用 Code Agent 者优先;
3. 深耕机器学习与深度学习领域,具备大型语言模型(LLM)项目实战或大规模预训练实际经验者优先;
4. 在 NeurIPS、ICML、COLT、ICLR、CVPR 等顶级会议或期刊上发表相关研究成果者优先;
5. 具备出色的沟通与协作能力,自驱力强,敢于担当,乐于与团队共同探索前沿技术,推动技术演进与落地。
本课题聚焦预训练数据的全链路智能化处理,探索从原始语料到高质量训练集的自动化构建方法。研究方向包括但不限于:面向海量数据的高效筛选与质量评估机制、通用场景下可扩展的数据管线设计,以及端到端、自动化的高性能数据流水线构建。通过构建高质量、高效率的数据基础设施,为预训练模型的能力跃升提供数据底座支撑。
任职要求:
1. 年级不限,本科及以上在读,计算机、人工智能、软件工程或相关交叉学科背景优先, C9院校优先;
2. 拥有卓越的工程实现能力与扎实的算法功底,熟练掌握至少一门主流编程语言及 PyTorch 框架,熟练使用 Code Agent 者优先;
3. 深耕机器学习与深度学习领域,具备大型语言模型(LLM)项目实战或大规模预训练实际经验者优先;
4. 在 NeurIPS、ICML、COLT、ICLR、CVPR 等顶级会议或期刊上发表相关研究成果者优先;
5. 具备出色的沟通与协作能力,自驱力强,敢于担当,乐于与团队共同探索前沿技术,推动技术演进与落地。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!