Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【转正实习】大模型算法工程师(强化方向)
Meituan logo
M
美团 (Meituan)

职位信息

北京市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

机器学习分布式系统PyTorch强化学习自然语言处理TensorFlow算法优化大语言模型 (Llm)
💡

核心评价

顶尖技术平台的前沿AI实习岗,成长空间巨大,是追求技术深造的优质起点。

【转正实习】大模型算法工程师(强化方向)

🤖 AI 估测:¥12K-20K

发布时间:27 天前

立即应聘

ℹ️关于这个职位

这是一个面向硕士或博士生的转正实习岗位,专注于大语言模型(LLM)的强化学习方向
你将负责优化LLM的强化学习全链路,包括数据、奖励模型和策略,并探索前沿的强化学习技术
同时,你将在美团的核心业务场景(如搜索、推荐、广告)中应用大模型,解决实际问题并实现业务目标

✓工作职责

负责LLM强化学习链路整体优化,包括数据探索与增强、奖励模型优化、RL策略迭代及效果评估等,持续提升算法的效率与效果
强化学习技术前瞻探索,包括但不限于离线强化学习、环境模型学习、约束强化学习等方向
开展大语言模型在搜索、推荐、广告等业务场景中的应用并实现业务目标

⭐最低要求

计算机科学、自动化、数学、统计学或相关领域专业的硕士或博士
扎实的算法基础,熟悉强化学习、自然语言处理和机器学习技术,对技术开发及应用有热情
能够基于实际业务问题优化算法,有RL算法优化和项目实践经验优先
熟悉Python、Java等至少一种编程语言,具有良好的编程能力和扎实的数学理论基础
熟悉Tensorflow、PyTorch等深度学习框架并有实际项目经验
关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我
良好的沟通能力和跨团队协作能力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标

👍优先资格

在ICML、NeurIPS、KDD、SIGIR、WWW、ICLR等顶级会议或期刊上发表过论文者优先
获得过国际或国内顶级赛事奖项者优先
有大语言模型算法优化和大规模分布式RL框架优化经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公