Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/大模型训练性能优化工程师(训练算子)(深圳/北京/上海/杭州)
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市 / 上海市 / 广东省-深圳市 / 浙江省-杭州市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

性能优化CUDAGPU编程并行计算大模型训练3D并行
💡

核心评价

技术前沿大厂核心岗,薪资竞争力强,成长空间巨大,但工作地点固定且可能需投入较多时间。

大模型训练性能优化工程师(训练算子)(深圳/北京/上海/杭州)

🤖 AI 估测:¥40K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型训练性能优化的核心工程师岗位
你将负责深度学习训练算子的设计、实现与优化,并针对大模型训练场景进行端到端的性能分析与调优,持续提升吞吐、延迟和显存利用率等关键指标
同时,你还需要参与3D并行训练体系下的算子与通信方案设计,与分布式训练、系统、模型算法团队协作,共同提升大规模训练任务的整体效率与稳定性

✓工作职责

负责深度学习训练相关算子的设计、实现与优化( CUDA/CUTLASS/Triton )
面向大模型训练场景,对算子进行端到端性能分析与调优,持续挖掘吞吐、延迟、显存利用率等指标的优化空间
参与或主导 3D 并行(Data / Tensor / Pipeline Parallel 等)训练体系下的算子与通信方案设计与优化
与分布式训练、系统、模型算法团队密切协作,共同提升大规模训练任务的整体效率与稳定性
跟踪业界前沿的硬件架构与系统软件(GPU 架构、网络、编译器、库等),将最新技术转化为实际性能收益

⭐最低要求

计算机、软件工程、数学、电子信息、自动化等相关专业,本科及以上学历
扎实的编程基础,熟练使用 C/C++,对代码质量与工程实践有较高要求
熟练掌握 GPU 编程,有实际 CUDA 开发经验
熟悉 CUTLASS、Triton 等任一或多种算子开发/优化框架
熟悉并行计算原理,对 GPU 体系结构(SM、Warp、Memory Hierarchy、Occupancy 等)有较深入理解
对 3D 并行训练(如数据并行、模型并行、流水并行、混合并行等)有实践经验,能够理解并分析其对算子与通信模式的影响
具备良好的问题定位与性能分析能力,能熟练使用 Nsight、nvprof、perf 等性能分析工具进行瓶颈分析和优化
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公