小红书(xiaohongshu)招聘【Ace顶尖实习生】面向多业务场景的“理解-生成-决策”多模态统一大模型基座与智能体应用研究
招聘职位:
【Ace顶尖实习生】面向多业务场景的“理解-生成-决策”多模态统一大模型基座与智能体应用研究 搜索同类职位
岗位职责:
本课题旨在探索构建一套“理解-生成-决策”三位一体的多模态统一大模型基座及智能体应用。
在底层基座构建上,重点构建理解与生成统一的图文交错混合模型:输入端实现多体裁内容(笔记、直播、商品等)的统一融合理解,输出端兼顾高质量表征提取、文本与图像生成。通过底层世界知识共享,消除多领域知识间的壁垒,并利用理解任务促进生成能力的提升。同时探索基于Multi-Head与MoE的轻量化微调及融合推理技术,在保证多场景下的效果前提下,压低训练和推理成本,实现降本增效。
在上层应用落地上,面向内容发布场景打造多模态创作Agent能力,通过基座模型的Agentic能力提升(意图识别、规划与工具调用),将分散的图像处理与创作工具统一封装,用户仅需以多模态方式自然表达需求,Agent即可自动完成任务拆解与执行,大幅降低使用门槛,全面重塑内容创作体系。
任职要求:
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。
本课题旨在探索构建一套“理解-生成-决策”三位一体的多模态统一大模型基座及智能体应用。
在底层基座构建上,重点构建理解与生成统一的图文交错混合模型:输入端实现多体裁内容(笔记、直播、商品等)的统一融合理解,输出端兼顾高质量表征提取、文本与图像生成。通过底层世界知识共享,消除多领域知识间的壁垒,并利用理解任务促进生成能力的提升。同时探索基于Multi-Head与MoE的轻量化微调及融合推理技术,在保证多场景下的效果前提下,压低训练和推理成本,实现降本增效。
在上层应用落地上,面向内容发布场景打造多模态创作Agent能力,通过基座模型的Agentic能力提升(意图识别、规划与工具调用),将分散的图像处理与创作工具统一封装,用户仅需以多模态方式自然表达需求,Agent即可自动完成任务拆解与执行,大幅降低使用门槛,全面重塑内容创作体系。
任职要求:
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。
免责声明:
此信息由小红书官网 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“小红书官网”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!