Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/微信-基座大模型后训练算法专家
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
专家级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorchDeepSpeedHuggingFace大语言模型 (Llm)强化学习 (Rl)MegatronPost-TrainingSft/Dpo/Ppo
💡

核心评价

腾讯微信核心AI岗,专注大模型前沿算法,技术成长性顶尖,薪资竞争力强,工作地点固定。

微信-基座大模型后训练算法专家

🤖 AI 估测:¥55K-90K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于基座大模型(LLM)后训练算法研发的高级技术岗位
你将负责提升大模型在推理、代码、知识、对话等多方面的通用能力,并探索强化学习、自适应思考深度等前沿算法,推动其在微信等复杂业务场景中的落地应用

✓工作职责

基座大模型(LLM)推理能力和通用能力的核心技术研发,包括数学推理、代码、逻辑推理、知识推理、创作、多轮对话、问答、翻译等任务的算法研发、优化,突破模型智力上限
提升基座大模型在复杂场景的高阶处理能力,如多轮交互(复杂指令遵循、多轮对话、角色扮演等)、Agent 能力( 融合“思考模式”与“非思考模式”,实现自主、精准的函数与工具调用)
跟踪前沿技术,参与前沿算法研究,如研发更高效的强化学习(RL)训练算法、探索自适应思考深度的模型优化算法、探索提升思维链的 “智能密度” 的方法等,推动研究成果在业务场景的落地应用
对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力

⭐最低要求

计算机科学、数学、人工智能等相关专业硕士及以上学历
具备良好的数理基础和 NLP 技术基础,能够熟练使用 Megatron,HuggingFace,DeepSpeed,PyTorch 等框架至少一种,深入理解 Transformer、GPT 等模型架构
在 Post-training 方向有一定研究基础,熟悉 SFT/DPO/PPO/GRPO/Reward Model 等
具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用
对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公