查看更多分享

美团招聘【大模型北斗实习】大模型预训练数据构建理论与算法研究

招聘职位：

【大模型北斗实习】大模型预训练数据构建理论与算法研究 搜索同类职位

发布日期：: 2025-05-23
工作地点：: 北京市
上海市
职位类型：: 兼职
职位类别：: 技术类算法,硬件,软件
来源：: 美团官网

岗位职责：
本课题研究方向包括但不限于：
1）构建端到端的网页文本内容提取系统，针对网络数据的复杂性，从系统效率和模型效果角度持续优化内容提取算法，迭代生产标准。
2）设计预训练数据的全局质量优化和治理方案，优化全局采样策略、隐私保护和安全合规，提升基座模型训练效率和最终效果。
3）建设多模态交错数据处理链路，通过数据分析和配比实验等手段优化多模态数据质量和多样性，支撑多模态大模型数据需求。
4）推动数据驱动的模型性能突破。
5）负责千亿级网页的大规模处理和万亿级token数据生产，通过分布式计算、模型量化及显存优化的方式提升数据处理和生产效率。
任职要求：
1）计算机科学、数据科学、自然语言处理等相关专业，具备大模型相关背景，在相关领域有深入研究经历并有实际论文产出或项目经验。
2）扎实的编程功底，熟练掌握TensorFlow/PyTorch/Megatron等深度学习框架，熟悉Java/C++等编程语言；熟练掌握大数据处理工具，如Spark、Flink、Ray等。
3）熟悉大模型训练流程，熟悉Transformer模型结构，对GPT/LLAMA/MoE等模型架构有深入了解。
加分项：
1）有大模型预训练相关数据构建和处理项目经验者优先。
2）发表过高水平论文优先（如NeurIPS,ICLR,ICML,ACL,EMNLP等）。

前往官网投递

免责声明：

此信息由美团官网 (查看来源)审核并发布，我们转载该信息，仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“美团官网”负责。我们作为信息转载平台，不构成求职建议，不涉及任何职业中介服务，不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎，自行判断并承担相应风险，求职请认准企业官方渠道！

上一职位：美团【大模型北斗实习】Operator 智能体方向算法研究

下一职位：美团(meituan)大模型数据生产实习生-math&code

美团招聘【大模型北斗实习】大模型预训练数据构建理论与算法研究

招聘职位：

FAQ 美团招聘常见问答

投递进展笔记

求职进度

进展结果

发生时间

求职体验

是否匿名

提示