Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
软硬件架构探索工程师-AI工具链
立即应聘

软硬件架构探索工程师-AI工具链

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
ASIC
LLM
AI芯片
分布式训练
NPU
AIGC
GPGPU

AI 估算 · 30k–60k

AI芯片方向高级工程师,字节跳动大厂,技术难度高,市场稀缺,薪资竞争力强。

职位详情

关于这个职位

该职位专注于AI芯片软硬件架构设计,重点服务于LLM和AIGC等大模型场景

你将参与硬件参数优化、分布式训练/部署方案设计,并开发硬件仿真建模系统
适合对AI芯片、分布式计算有深入理解的技术专家

最低要求

深入理解深度学习框架和软件栈

熟悉GPGPU、ASIC NPU的硬件架构
熟悉LLM和AIGC分布式部署训练方案,了解多层级卡间互联拓扑结构
有主动学习、快速解决问题的能力和自我驱动力
较强的C++、Python Coding能力

工作职责

参与AI芯片软硬件设计,负责LLM和AIGC等业务模型结构和需求分析,指导硬件参数设计和微架构优化设计

负责根据硬件,设计分布式训练、部署方案,提供硬件硅前验证案例和软件设计方案
参与探索多卡互联拓扑结构和方案,实现多卡之间的协同工作
负责分布式业务模型和Roofline硬件仿真建模系统开发
跟踪行业最新技术动态,为公司的AI芯片多卡互联技术发展提供前瞻性的建议和技术储备

优先资格

有LLM、AIGC类模型的业务对接经验,熟悉多机多卡分布式训练和部署经验

了解硬件多层次存储层级、同构和异构计算单元原理
了解硬件片上NOC和片间互联通信协议等
有MLI、LLVM或者PyTorch开发经验
有GPU、FPGA或AI芯片相关的开发和评测经验

AI 洞察

优缺点分析

优点

  • 处于AI芯片和LLM的前沿赛道,技术成长空间大
  • 字节跳动大平台,资源丰富,能接触到业界顶尖的硬件和算法团队
  • 工作内容兼具软硬件深度,锻炼系统级设计能力
  • 对技术综合能力要求高,需要同时掌握硬件、软件和算法
  • 分布式训练优化复杂,调试困难,需较强的问题定位能力

缺点 / 挑战

  • 芯片领域节奏快,可能需要应对高强度研发和硅前验证压力
  • 适合对AI芯片和分布式计算有浓厚兴趣,具备扎实软硬件背景,喜欢挑战前沿技术问题的工程师

角色解读

  • 向AI芯片架构师方向深入,主导下一代芯片设计
  • 转向分布式系统专家,优化大规模训练/推理系统
  • 可向技术管理方向发展,带领团队攻关核心硬件-软件协同问题
  • 分析LLM和AIGC等大模型的结构和需求,指导AI芯片的硬件参数和微架构设计
  • 设计分布式训练和部署方案,提供硅前验证和软件设计,探索多卡互联拓扑
  • 开发分布式业务模型和Roofline硬件仿真建模系统
  • 跟踪前沿技术,为AI芯片多卡互联技术提供前瞻性建议
  • 深入理解深度学习框架(如PyTorch)和软件栈
  • 熟悉GPGPU、ASIC NPU等硬件架构
  • 精通LLM和AIGC的分布式部署训练,掌握多层级卡间互联拓扑
  • 较强的C++和Python编程能力,能高效解决问题

申请策略

  • 深入了解字节跳动的AI芯片产品线(如火山引擎),在面试中展现对公司技术方向的兴趣
  • 准备一个端到端的分布式训练优化案例,从模型分析到硬件适配
  • 突出分布式训练部署项目经验,尤其是多机多卡场景
  • 展示对硬件架构的理解,如GPGPU、NPU的优化案例
  • 强调C++/Python编程能力,最好有性能调优或编译器开发经验
  • 列出参与的LLM或AIGC相关业务项目,体现业务理解
  • 补充多卡互联拓扑和通信协议知识,如NOC、NVLink等
  • 动手实践GPU/FPGA上的模型部署和性能分析

面试指南

  • 结构化回答:先说明场景和问题,再给出具体方案和效果,最后总结学到的经验
  • 对比分析:当比较不同技术方案时,列出优缺点、适用条件,并结合实际案例
  • 量化优先:用数据说话,如吞吐量、延迟、显存占用等指标
  • 请描述一次你优化LLM分布式训练性能的经历,使用过哪些并行策略?
  • 如何理解Roofline模型?请结合AI芯片举例说明
  • 解释GPU和NPU在架构上的主要差异,以及它们各自适合什么场景?
  • 多卡互联中常见的拓扑结构有哪些?各自的优缺点是什么?
  • 你在PyTorch中做过哪些底层算子优化?如何利用硬件特性加速?

匹配度报告

70
综合匹配度

前沿AI芯片研发,技术成长空间大,薪资竞争力强,但工作灵活性和WLB一般。

适合人群
适合追求技术深度和前沿发展,对薪资和成长有高要求,能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

薪资在行业内具有竞争力,字节跳动大厂福利完善,但具体薪资未在JD中明确。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该职位涉及前沿AI芯片和LLM技术,能极大提升硬核技能,成长路径明确。

技术前沿前沿/新兴技术
技术栈LLM、AIGC、GPGPU、ASIC、NPU、分布式训练、多卡互联
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及灵活工作制或加班情况,北京核心地段办公但通勤可能较长。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片是高速增长赛道,技术创新性强,但社会影响力中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k