Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
高性能计算研发工程师-Seed
立即应聘

高性能计算研发工程师-Seed

发布于 大约 2 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
深度学习
高性能计算
GPU优化
LLM
CUDA
量化
并行计算

AI 估算 · 35k–65k

字节跳动上海高级AI工程师,市场竞争力强,高门槛技术栈对应高薪酬,月薪中位数约50K。

职位详情

关于这个职位

加入字节跳动Seed团队,你将专注于开发语音多模态大模型的高性能推理引擎,深度优化GPU计算性能

工作涉及LLM Model Efficiency前沿技术,支撑豆包、即梦等超过50个应用场景,是AI底层优化与前沿落地的核心角色
这是一份能让你在顶尖技术团队中快速成长、与大模型行业最前沿同步的机会

最低要求

精通C/C++,熟悉Python,熟悉主流的并行编程以及性能优化技术,有相关高性能优化经验以及AI工程化经验优先

熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等
具备丰富的基于CUDA的GPU性能优化经验

工作职责

负责开发语音多模态LLM场景下高性能推理,支撑各业务场景下的推理性能优化需求并推动业务落地

结合LLM Model Efficiency,跟进前沿技术,构建领先的高性能计算能力

优先资格

熟悉深度学习常用算法和模型结构,有LLM/语音/视频场景模型优化经验优先,有量化/稀疏化/高性能优化经验优先

熟悉Triton/Tilelang/CuteDSL相关经验的优先

AI 洞察

优缺点分析

优点

  • 技术前沿:直接接触大模型推理的最核心优化问题,与顶级AI团队共事,技术成长快
  • 业务影响力:优化成果直接影响豆包等亿级用户产品,成就感强
  • 公司平台:字节跳动资源丰富,薪资待遇优厚,技术氛围浓厚
  • 团队氛围:Seed团队新成立,扁平高效,个人贡献容易被看见
  • 技术门槛高:需要C++、CUDA、体系结构等多领域深度知识,学习曲线陡峭
  • 持续学习:技术更新快(如新硬件、新量化方法),要求保持学习状态

缺点 / 挑战

  • 工作强度:大模型迭代快,业务压力大,可能需要应对紧急优化需求
  • 适合对底层系统优化有浓厚兴趣、享受挑战高难度技术问题、追求技术深度的工程师

角色解读

  • 技术纵深发展:从GPU优化专家成长为AI系统架构师,主导下一代推理框架设计
  • 横向拓展:接触多模态、Agent、AI for Science等前沿方向,拓宽技术视野
  • 管理路径:未来可带领高性能计算团队,成为技术Leader或Tech Lead
  • 负责语音多模态LLM推理引擎的开发与性能优化,确保模型在大规模场景下高效运行
  • 深入GPU底层优化,包括并行计算、访存优化、低比特计算等,提升推理吞吐和延迟
  • 跟踪LLM Model Efficiency前沿技术,推动量化、稀疏化等高效推理方案落地
  • 与算法团队紧密合作,将优化后的推理能力集成到豆包、即梦等产品中
  • 精通C/C++和Python,并具备扎实的系统编程能力
  • 深厚的高性能计算及GPU优化经验,尤其熟悉CUDA编程和计算机体系结构
  • 熟悉深度学习模型结构与推理流程,有LLM或语音模型优化经验更佳
  • 了解Triton/Tilelang等DSL工具,具备探索新技术的热情

申请策略

  • 投递前梳理一个你最引以为豪的优化案例,在简历和面试中清晰讲述思路、效果和挑战
  • 关注Seed团队的技术博客或开源项目,面试中展现对该方向的理解和热情
  • 突出GPU性能优化项目:详细描述你基于CUDA的优化案例(如kernel融合、访存优化、算子调优等)
  • 展示C++/Python功底:如有开源项目或性能工具开发经验,务必列举
  • 体现LLM或语音模型优化经验:包括量化、稀疏化、蒸馏等加速方法的具体实践
  • 若有Triton或类似DSL使用经历,单独列出
  • 复习计算机体系结构、并行计算理论,如《Computer Architecture: A Quantitative Approach》
  • 动手练习CUDA编程,尝试实现常用算子(如softmax、attention)的优化版本

面试指南

  • STAR框架:情境(Situation)-任务(Task)-行动(Action)-结果(Result),清晰描述优化全过程
  • 对比分析:在回答策略选择时,比较不同方案的优劣(如FlashAttention vs 传统attention)
  • 量化问题:先说明常见量化方法(PTQ/QAT),再结合LLM特点讨论难点(如异常值处理)
  • 请描述一次你使用CUDA优化GPU算子的经历,是如何分析瓶颈并改进的?
  • LLM推理中,KV Cache优化有哪些常用策略?你如何实现?
  • 如何评估一个CNN模型的推理性能?哪些因素影响并行效率?
  • 你对Triton和CUDA的差异和适用场景有什么理解?
  • 在量化模型中,权重量化和激活量化分别有哪些挑战?

匹配度报告

74
综合匹配度

字节大模型核心优化岗,技术前沿、薪资优厚,但WLB一般、节奏快。

适合人群
最适合以技术成长为导向、能接受高强度工作、追求前沿技术突破的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活40
使命价值80

薪资福利匹配

85较高

字节跳动薪资待遇在行业内极具竞争力,提供高额年终奖、股票期权等,满足度高。但JD未明确列出具体福利,略显低调。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

92较高

该岗位处于AI大模型最前沿,涉及GPU优化、量化等先进技术,Seed团队专注新方法探索,成长空间极大。

技术前沿前沿/新兴技术
技术栈C/C++、CUDA、GPU优化、并行计算、LLM、量化、稀疏化、Triton
业务类型profit_center

工作生活匹配

40较低

字节跳动高强度工作氛围,未提远程或弹性工作,上海办公地点可能位于市区或科技园,但加班预期较高。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

工作内容直接推动AI大模型落地,服务亿级用户,并致力于通用智能研究,社会价值和行业前景均较高。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于通用智能的新方法,追求智能上限,为科技和社会发展作出贡献
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k