Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI性能优化专家-火山引擎
立即应聘

AI性能优化专家-火山引擎

发布于 大约 17 小时前

普通员工/个人贡献者

西安市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
性能优化
GO
TensorFlow
LLM
TensorRT
异构计算
国产Ai加速卡

AI 估算 · 35k–60k

高级AI性能优化专家,字节跳动大厂,西安薪资相对一线偏低但竞争力强,技能稀缺,薪资可达3.5-6万/月。

职位详情

关于这个职位

该职位负责火山引擎IaaS层AI性能优化,聚焦大模型训练与推理场景,通过软硬协同优化提升应用性能

工作内容包括构建性能标尺、分析AI Infra、优化深度学习框架及引入国产加速器
适合具备系统性能分析、深度学习框架开发及异构计算背景的高级工程师

最低要求

熟练掌握Linux环境下的C/C++、Python、Go语言,有分布式系统软件开发和调试经验

熟悉LLM/CV/NLP/推荐系统等业务场景的系统和原理
有主流深度学习框架(如TensorFlow、PyTorch等)相关开发经验,掌握框架任一组件的代码实现
掌握异构计算、网络、存储的性能分析工具和相关原理,有软硬协同优化经验

工作职责

负责AI Infra的性能分析,构建性能标尺和竞争力模型

负责基于云上AIGC等业务场景的性能分析以及训练、推理场景的底层优化工作
负责云上IaaS 国产加速器在AI场景的引入、落地和优化工作

优先资格

熟悉主要云厂商的AI Infra解决方案

在LLM训练或推理性能优化方面有实操经验
有模型量化和业务模型精度调优经验
有TensorRT/CUTLASS/Trition等开发经验和性能优化经验
熟悉国产AI加速卡生态,有实际场景的应用经验

AI 洞察

优缺点分析

  • 身处AI风口赛道,大模型性能优化是行业刚需,技术积累价值高
  • 字节跳动平台资源丰富,能接触到顶尖的AI基础设施和业务场景
  • 工作涉及软硬协同,技能壁垒高,竞争力强
  • 技术深度要求高,需要同时掌握系统、框架、硬件等多个层面,学习曲线陡峭
  • 业务压力大,需快速响应客户问题,优化目标明确,加班可能较多
  • 国产加速器生态尚不成熟,适配工作可能遇到较多兼容性问题
  • 适合对AI底层技术有热情、具备系统性能优化经验、愿意深入硬件软件协同的资深工程师

角色解读

  • 可向AI Infra架构师方向发展,主导大规模AI系统的性能优化方案
  • 积累云原生和异构计算经验,转型为云计算平台技术专家
  • 参与前沿AI芯片与框架适配,成为国产加速器生态的核心贡献者
  • 负责火山引擎IaaS层的AI性能分析,构建性能标尺和竞争力模型,评估云上AI场景的效能
  • 针对大模型训练和推理场景,进行底层软件优化,包括框架、算子、通信等方面的调优
  • 引入和落地国产AI加速卡,优化软硬协同方案,提升客户应用表现
  • 精通C/C++、Python、Go,具备分布式系统开发和调试能力
  • 深入理解LLM、CV、NLP等业务场景的原理及主流深度学习框架如TensorFlow、PyTorch
  • 掌握异构计算、网络、存储的性能分析工具,有软硬协同优化经验

申请策略

  • 提前了解火山引擎的产品线,关注其AI Infra解决方案
  • 在面试中展现对性能优化瓶颈的系统性思考能力
  • 突出深度学习框架源码修改或性能优化项目经验,如PyTorch算子优化
  • 强调分布式训练或推理的调优案例,尤其是LLM相关
  • 展示对异构计算(GPU/NPU)性能分析工具的使用经验
  • 补充国产AI加速卡(如华为昇腾、寒武纪)的适配经验
  • 学习TensorRT、CUTLASS等高性能计算库的实际应用

面试指南

  • 对于性能问题,先定界(CPU/GPU/网络/存储),使用profiling工具如nsys、perf定位热点,再针对性优化
  • 优化方案需兼顾通用性和定制化,优先采用社区成熟方案,再结合业务场景二次开发
  • 请描述一次你进行大模型训练性能优化的经历,使用了哪些工具和方法?
  • 如何分析PyTorch训练过程中的性能瓶颈?请给出具体步骤
  • 你理解国产AI加速卡与NVIDIA GPU在架构上的主要差异?如何适配?
  • 在一个分布式训练系统中,网络延迟对整体性能影响多大?如何优化?
  • 你对TensorRT的用法熟悉吗?请举例说明如何用TensorRT加速推理
  • 复习主流深度学习框架的底层算子实现和通信库(NCCL等)

匹配度报告

69
综合匹配度

大厂核心AI性能优化岗,技术前沿,薪资竞争力强,但工作强度大,WLB一般。

适合人群
适合追求技术深度和前沿领域成长、能接受一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

字节跳动薪资具有竞争力,大厂福利完善,但西安城市薪资水平相对一线略低,整体补偿性较好。

薪资信号未披露 (35K-60K/月)

成长发展匹配

90较高

AI性能优化是前沿技术领域,工作涉及大模型、国产加速器等新兴方向,技术成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、TensorFlow、PyTorch、TensorRT、异构计算、国产AI加速卡
业务类型profit_center

工作生活匹配

40较低

职位为仅现场办公,且AI性能优化压力大,可能加班,工作地点西安但科技公司节奏快,生活平衡度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施对国家技术自主有重要意义,但职位本身更偏技术执行,直接社会使命感不强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • Engineer

    友邦保险 · 上海市
    AI 估算 · 12k-18k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • Engineer

    友邦保险 · 上海市
    AI 估算 · 12k-18k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k