Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元大模型训练框架研发工程师-(北京/深圳)
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch性能优化多模态CUDADeepSpeed大模型训练Megatron3D并行Flash-AttnZero
💡

核心评价

腾讯大厂核心AI基建岗,技术前沿且成长性极佳,薪资竞争力强,但需关注工作强度。

混元大模型训练框架研发工程师-(北京/深圳)

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

该职位是腾讯混元大模型训练框架研发工程师,主要负责开发和优化支持万卡以上规模的大模型训练框架
你将参与NLP、多模态大模型的结构设计,并负责文生图、文生视频等业务的训练性能加速与优化工作
这是一个专注于底层训练框架性能与效率的前沿技术岗位

✓工作职责

参与开发优化大模型训练框架,支持单任务万卡以上规模高效稳定训练
参与NLP、多模态大模型结构设计,并联合业务进行模型训练效率和效果验证
参与文生图、文生视频、文生3D等业务的训练性能加速
参与低精度训练性能优化和业务推广、参与大窗口训练性能优化

⭐最低要求

熟练使用PyTorch框架,可对DDP训练的代码进行性能分析和优化
熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向
熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先
良好的沟通能力、解决问题能力

👍优先资格

有ViT、SD、DiT模型训练性能优化经验者优先
对大模型前沿技术比较敏锐者优先
有实际大模型的训练调参和效果评测项目经验的优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公