艾氪互联智能科技(深圳)有限公司2026招聘强化学习算法工程师
招聘职位:
2026招聘强化学习算法工程师 搜索同类职位艾氪互联智能科技(深圳)有限公司
发布时间:2026-02-25
福利:"五险一金","带薪年假","午餐补助","节日礼物","扁平管理","岗位晋升","提供住宿"
职位名称:强化学习算法工程师(AgentReinforcementLearningEngineer)
学历:本科,硕士,博士,外国留学生
需求人数:10
需求专业:数学与应用数学(华罗庚数学班),工科试验班类(中外合作办学,中法未来科技试验班),理科试验班类
|||需求专业:理科试验班类,工科试验班类(中外合作办学,中法未来科技试验班),数学与应用数学(华罗庚数学班)
工作地点:广东省深圳市
职位描述:理想经验:
?有强化学习/Agent/决策系统经验
?能将现实问题抽象为状态、动作、奖励
?熟悉PyTorch/Python
?有系统工程意识
?对真实商业系统有好奇心
加分项:
?多智能体系统
?运筹优化/博弈
?供应链/定价/资源调度经验
?LLMAgent框架
你将面对的典型问题:
?一个渠道价格策略在不同区域表现完全不同,Agent如何通过强化学习自动适配?
?库存与履约冲突时,如何让Agent学会权衡利润、时效与风险?
?新增一个业务模块,如何快速构建可学习环境?
?真实业务数据噪声极大,如何设计鲁棒reward?
?企业偏好变化时,如何让Agent快速重新对齐目标?
技术栈:
Python/PyTorch
分布式RL
Agent框架
Typescript/React(内部工具)
职位联系人:蒙先生
手机:17727442725
简历接收邮箱:guipi@
部门:AI智能体研究中心
地点:香港,深圳
工作经验:实习生、应届生
招聘人数:10人
关于echOS(艾氪智能)艾氪智能集团是全球产业级AgenticOS的开创者与定义者。自主研发echOS全球首个打破产业三级壁垒、实现跨业务/跨企业/跨行业分布式多智能体集群的操作系统。
基于产业级AgenticStudio开发平台JovaAI、硅基人才市场WtreeAI、AI产业云脑ICB,构建6000+产业级专业AI工具及skills,支撑多智能体强化学习、分布式感知、跨组织商业博弈与实时决策。该技术体系已在中国多个产业带完成规模化验证,正在更多传统产业带规模化进行跨企业智能体集群的推广,形成AI时代的企业互联标准与产业AI原生底座。
研发中心覆盖香港、深圳、北京、上海、重庆,多次荣获千峰奖、中国人工智能领军企业等荣誉。
?
关于岗位:我们正在招聘AI智能体强化学习工程师,加入echOSAgent核心团队。
你将直接参与构建在真实产业环境中运行的智能体系统,让Agent:
?与复杂业务环境持续交互?学习定价、库存、调度等决策策略
?具备长程规划能力?基于真实反馈持续自我进化
?根据企业偏好动态调整行为这是强化学习+大模型+多智能体协同在真实商业系统中的落地,而不是模拟世界里的benchmark。
?
工作重点(Focus):
?为产业级AIAgent构建环境交互系统(业务状态/行为空间/奖励建模)
?将强化学习引入真实场景,如渠道定价优化、库存分配、履约调度
?构建Agent长程规划与复杂任务拆解能力
?实现偏好学习与反馈优化(企业目标、风险约束、利润权衡)
?设计仿真环境与离线评估体系,用于训练与回放真实业务策略?构建Agent学习闭环:感知→决策→执行→反馈→进化
?搭建自动化训练、评估与部署流水线
?提升大规模RL任务的稳定性与可观测性?重构Agent/数据/训练框架,使研究成果快速进入生产系统
","shortContent":"部门:AI智能体研究中心地点:香港,深圳工作经验:实习生、应届生招聘人数:10人关于echOS(艾氪智能)艾氪智能集团是全球产业级AgenticOS的开创者与定义者。自主研发echOS全球首个打破产业三级壁垒、实现跨业务/跨企业/跨行业分布式多智能体集群的操作系统。基于产业级AgenticStudio开发平台JovaA
免责声明:
此信息由北京航空航天大学 (查看来源)审核并发布,我们转载该信息,仅出于传递更多就业招聘资讯、促进大学生及广大求职者就业之目的。该招聘职位信息的真实性、准确性、时效性及合法性均由原始发布方“北京航空航天大学”负责。我们作为信息转载平台,不构成求职建议,不涉及任何职业中介服务,不对其内容承担任何形式的保证责任。请用户在使用转载信息时保持审慎,自行判断并承担相应风险,求职请认准企业官方渠道!