Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/深度求索/Agent深度学习算法研究员
Deepseek logo
D
深度求索 (Deepseek)

职位信息

浙江省-杭州市 / 北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

深度学习PyTorch代码生成强化学习 (Rl)Agent系统大模型 (Llm)Rlhf/Rlaif
💡

核心评价

前沿AI算法研究岗,技术成长性极佳,薪资竞争力强,但工作模式为现场办公且WLB未知。

Agent深度学习算法研究员

🤖 AI 估测:¥35K-60K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型(LLM)前沿研究的算法研究员职位
你将负责探索提升模型在推理、生成、指令遵循等方面能力的新方法与范式,并参与强化学习(RL)在大模型对齐与能力提升中的应用研究
核心工作包括设计实验、构建训练数据、跟踪前沿进展,并与数据、工程团队协作,推动研究成果落地

✓工作职责

针对大模型在推理、生成、指令遵循等方向的核心问题,能够提出创新性的想法并设计实验验证
探索提升模型能力的新方法与新范式
与数据标注团队紧密协作,设计标注方案与质量标准
通过数据分析发现模型能力短板,针对性地构建训练数据,形成"数据-训练-评测"的能力提升闭环
参与强化学习(RL)在大模型对齐与能力提升中的应用研究,探索 RLHF/RLAIF、过程奖励、偏好学习等方法的优化路径
持续跟踪大模型领域的前沿进展,快速复现并评估业界最新方法,推动有价值的研究成果落地

⭐最低要求

面对问题能够独立分析并提出自己的 idea,具备从 0 到 1 推动研究的能力
能够快速将想法转化为可运行的原型,具备高效的实验迭代能力
了解强化学习基本概念与常用算法(如 PPO、DPO、Actor-Critic 等),有相关实践经验者优先
熟练掌握 Python、C/C++,熟悉 PyTorch 等深度学习框架
善于跨团队沟通,能够与数据标注、工程团队高效配合

👍优先资格

有大模型预训练、微调、对齐相关研究或项目经验
在顶会(NeurIPS、ICML、ICLR、ACL 等)发表过论文
有 Agent 系统、工具调用、代码生成相关研究或实践背景
深度使用过 Claude Code、Cursor 等 AI 编程工具,对模型能力边界有实践认知
参与过知名开源项目或有活跃的 GitHub 贡献
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • AI超算集群运维工程师

    深度求索

    杭州市 · 仅现场办公

  • 多模态安全-模型策略产品经理

    深度求索

    北京市 · 仅现场办公

  • 企业文化主管

    深度求索

    杭州市 · 仅现场办公

  • 会计

    深度求索

    杭州市 · 仅现场办公

  • 采购经理

    深度求索

    杭州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公