Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/微信-WeLM 大模型预训练框架研发工程师(深圳、上海)
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch强化学习TensorFlowJAXCUDA分布式训练大模型DeepSpeedMegatron
💡

核心评价

腾讯大厂核心岗,专注前沿大模型训练框架研发,技术成长性极佳,薪资竞争力强。

微信-WeLM 大模型预训练框架研发工程师(深圳、上海)

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型预训练框架研发的高级技术岗位
你将负责构建和优化支持多模态数据联合学习的大规模预训练框架,并深入优化分布式训练、显存利用以及后训练流程
核心目标是提升模型训练与推理的效率及性能,属于AI基础设施领域的关键研发工作

✓工作职责

负责构建和优化大规模预训练框架,支持文本、语音、图像等多模态数据的联合学习与高效训练
深入优化长序列场景下的分布式训练与显存利用(如context parallel、2D/环形 Attention、混合并行、激活重计算等),在百万级 token 训练中提升吞吐与性价比
负责后训练(Post-training)阶段框架建设,包括强化学习(RL/RLHF)、偏好建模(Reward Model)及人类反馈优化(Alignment)等流程
深入优化分布式训练框架与推理效率,提升算力利用率与模型吞吐性能
跟踪前沿研究趋势,探索高效预训练策略(如Mixture of Experts、Continual Pretraining等)
与算法、数据、平台团队协作,形成从数据处理到训练部署的全流程自动化解决方案

⭐最低要求

计算机科学、人工智能、模式识别、计算语言学等相关专业硕士及以上学历
精通一种或多种主流深度学习框架(PyTorch、JAX、TensorFlow),具备大规模分布式训练经验
熟悉Transformer系列架构,理解其在语言、语音、视觉等方向的模型原理与实现
具备扎实的工程实现能力与代码规范意识,熟悉CUDA优化、参数并行、流水线并行等技术
具备良好的团队协作与沟通能力,热爱探索与创新

👍优先资格

了解 LLM 的训练流程,有 Megatron, DeepSpeed 等大规模训练框架使用经验者优先
对RL/RLHF、偏好学习、奖励建模有实践经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公