Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/强化学习专家
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

强化学习算法设计多模态智能体系统分布式训练大模型工程落地奖励模型
💡

核心评价

顶尖平台的前沿AI技术专家岗,成长空间巨大,薪资竞争力强,但对工作生活平衡的预期需适当调整。

强化学习专家

🤖 AI 估测:¥45K-80K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个专注于强化学习前沿研究与工程落地的专家岗位
你将主导大模型强化学习方向的研究,构建大规模训练框架,并推动技术在智能体、多模态理解等业务场景的应用,旨在提升系统的端到端用户体验

✓工作职责

主导大模型强化学习方向的前沿研究,支持各应用方向的基础能力提升,包括但不限于语言、视觉、听觉、传感器信号等多种模态的理解和生成,智能体及多智能体系统
负责构建大规模强化学习训练框架,优化分布式训练效率与资源调度能力
设计并训练奖励模型
开发和改进强化学习数据采集、清洗和难度分级流程和工具
结合业务场景,推动强化学习技术提升系统的端到端用户体验
跟踪国际学术会议成果与工业界动态,指导创新论文方向,并参与人才培养和战略规划

⭐最低要求

本科及以上学历,计算机、人工智能及机器学习等相关专业
3年以上强化学习项目经验,主导过至少1个完整的工业级大规模强化学习项目(如推荐系统优化、自动驾驶决策、智能体交互等),具备从算法设计到工程落地的全流程能力
具备优秀的逻辑分析与问题解决能力,能够快速定位并优化复杂系统瓶颈
协作意识强,能高效沟通并推动跨团队合作

👍优先资格

在人工智能领域国际学术顶会发表论文或参与知名开源项目者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公