Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/硬件加速通信算子实现研发工程师-AI芯片
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

CUDARDMA系统优化NCCL高性能网络AI芯片大模型训练分布式并行
💡

核心评价

技术前沿大厂核心岗,高成长高意义,薪资竞争力强,WLB信息不明。

硬件加速通信算子实现研发工程师-AI芯片

🤖 AI 估测:¥45K-80K

发布时间:6 天前

立即应聘

ℹ️关于这个职位

该职位是字节跳动AI芯片团队中的硬件加速通信算子实现研发工程师
你将负责设计、实现和优化高性能网络通信框架,专注于提升大模型分布式并行训练与推理场景下的通信能力
核心工作是与算法、框架、驱动等软硬件团队协作,进行端到端性能优化,并推动自研通信库的架构演进

✓工作职责

负责设计、实现、优化高性能网络通信框架,聚焦大模型分布式并行的通信能力建设
支撑通信库在大模型训练/推理场景下的业务需求,追求极致的性能优化
与算法、框架、驱动等软硬件团队紧密配合,优化业务场景下的端到端性能
洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配

⭐最低要求

熟悉Linux开发环境,掌握Python/C++等语言,有良好的编程基础,系统设计优化能力
熟悉NCCL、DeepEP等集合通信库,有分布式并行优化经验者优先
熟悉高性能网络通信,熟悉RDMA原理,对芯片互联有开发经验者优先
熟悉GPU/AI DSA体系结构和原理,熟悉CUDA及AI芯片编程模型,有相关开发经验者优先
了解主流大模型训练/推理框架,了解大模型分布式原理,有相关开发经验者优先
具备良好的技术热情和责任感,优秀的问题分析解决能力,良好的团队意识及沟通能力

👍优先资格

有分布式并行优化经验者优先
对芯片互联有开发经验者优先
熟悉CUDA及AI芯片编程模型,有相关开发经验者优先
了解主流大模型训练/推理框架,了解大模型分布式原理,有相关开发经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 系统工程师/原型专家

    叠纸游戏

    上海市 · 仅现场办公

  • 系统集成测试(硬件)工程师

    小马智行

    广州市 · 仅现场办公

  • 自动驾驶硬件集成与测试工程师

    小马智行

    上海市 · 仅现场办公

  • 国内出差 - 自动驾驶硬件测试工程师 - 运营&Issue

    小马智行

    北京市 · 仅现场办公

  • 汽车维修技师-实习生-亦庄

    小马智行

    北京市 · 仅现场办公