Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【基座大模型北斗实习】大语言模型后训练前沿算法研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

Prompt EngineeringPytorch/Tensorflow大语言模型 (Llm)强化学习 (Rl)自然语言处理 (Nlp)指令微调 (Sft)奖励模型
💡

核心评价

顶级大厂AI前沿研究实习,技术成长性极佳,薪资符合市场,工作地点固定。

【基座大模型北斗实习】大语言模型后训练前沿算法研究

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)后训练前沿算法研究的实习岗位
你将参与对齐算法研发、人类偏好对齐等核心工作,旨在提升模型在指令遵循、逻辑推理、代码生成及安全可控性等方面的能力
这是一个深入AI前沿技术,探索强化学习与NLP结合应用的绝佳机会

✓工作职责

岗位职责 简介:大语言模型后训练前沿算法研究包括但不限于:
对齐算法研发:包括 SFT 数据建设,指令微调等
构建高质量的训练数据,包括自动化数据清洗、合成数据生产、高质量 Prompt Engineering 等
优化模型复杂指令遵循、逻辑推理、创作写作、代码生成以及工具调用等能力,提升模型综合能力和用户体验
人类偏好对齐:包括奖励模型、人类偏好对齐等前沿强化算法的探索和实践,提升模型在包括创意写作、对话风格以及模型内生安全对齐等人类偏好上的可控性,生成更符合人类价值观、逻辑习惯和审美偏好的内容
跟踪并实现最新的后训练技术(如数据领域自动化配比、后训练机制设计和优化等)

⭐最低要求

硕士及以上学历,计算机、人工智能、数学等相关专业,博士优先
熟悉NLP、LLM、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实践经验
有较强的分析和解决问题能力,能够自主探索、设计验证和推进落地

👍优先资格

加分项:
在有影响力的开源项目中做出过核心贡献
发表过高水平论文(如NeurIPS, ICLR, ICML, ACL, EMNLP等)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公