
字节跳动
端侧大模型推理优化工程师-豆包手机助手
端侧大模型推理优化工程师-豆包手机助手
发布于 大约 2 个月前普通员工/个人贡献者
深圳市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
团队协作
模型量化
SD
推理加速
编译优化
MTK平台
图优化
稀疏计算
端侧推理引擎
AI 估算 · 30k–50k
端侧大模型优化技术壁垒高,字节跳动薪资竞争力强,结合深圳市场行情,中级工程师月薪约3-5万。
职位详情
关于这个职位
该职位主要负责端侧大模型推理框架的开发和优化,包括模型量化、图优化等推理加速工作,并探索稀疏计算、编译优化等前沿技术
您需要具有Transformers等主流模型原理的知识,并熟悉至少一款端侧推理引擎,同时具备MTK平台部署经验
加入字节跳动豆包手机助手团队,您将参与打造高性能、低功耗的端侧AI体验
最低要求
熟悉Transformers、SD等主流模型原理,至少熟悉一款端侧推理引擎
有过MTK平台部署模型的经验,具备扎实的计算机科学功底和编程能力
有良好的动手实现能力,良好的团队协作能力,对技术有热情
工作职责
负责端侧大模型推理框架开发,包括模型量化、图优化等推理加速工作,使之符合业务对性能和功耗的预期
负责探索和落地AI模型工程部署前沿技术,包括但不限于稀疏计算、编译优化等
AI 洞察
优缺点分析
优点
- 技术前沿:直接参与大模型在端侧的部署和优化,积累稀缺的AI工程化经验
- 薪资竞争力:大模型相关岗位薪资通常高于市场平均水平,且公司福利完善
- 技术难度高:需要同时掌握模型原理和底层硬件优化,学习曲线陡峭
- 工作强度大:互联网大厂节奏快,项目周期紧,可能需要应对高强度研发任务
缺点 / 挑战
- 平台优势:字节跳动提供海量数据和应用场景,技术挑战大,成长快
- 适合对AI模型部署和底层优化有浓厚兴趣,具备扎实编程功底和硬件知识,愿意挑战高难度技术问题且能适应快节奏的求职者
角色解读
- 技术纵深发展:从模型优化进阶到AI芯片架构设计、编译器开发等方向
- 横向扩展:可转向端侧AI产品架构师或AI系统架构师,负责整体推理方案设计
- 团队管理:随着项目扩大,有机会带小型技术团队,负责技术决策和人员培养
- 开发和优化端侧大模型推理框架,通过模型量化、图剪枝等技术加速推理,降低功耗
- 探索并落地稀疏计算、编译优化等前沿部署技术,提升模型在手机等设备上的运行效率
- 与算法和工程团队协作,确保模型在MTK等平台上的性能和稳定性
- 深入理解Transformer、扩散模型等主流模型架构,熟悉至少一种端侧推理引擎(如MNN、TNN、NCNN等)
- 具备MTK平台模型部署经验,熟悉硬件加速和算子优化
- 扎实的计算机科学基础(数据结构、算法、计算机体系结构)和C++/Python编程能力
申请策略
- 提前了解字节跳动端侧AI团队的技术博客和开源项目,面试中展现技术热情
- 准备一个端到端的模型优化案例,展示从模型到部署的完整思路
- 突出端侧推理引擎使用经验(如MNN、TNN),并附上具体优化数据(如推理速度提升百分比)
- 强调MTK平台项目经验,包括部署流程、信号处理或驱动开发经历
- 展示模型量化、蒸馏或图优化相关项目,最好有开源贡献或技术博客
- 深入学习Transformers和扩散模型原理,尝试动手复现小型推理框架
- 熟悉Android NDK开发和汇编级优化,了解NEON指令集
面试指南
- 先阐述基本概念和原理,再结合实际项目经验说明具体做法和效果
- 遇到问题解决类问题,使用STAR法则:情境、任务、行动、结果
- 对于开放性设计问题,提出多种方案并分析优缺点,展示工程决策能力
- 请解释模型量化的原理,如何选择量化位宽?
- 描述你在MTK平台上部署模型的完整流程和遇到的挑战
- 如何优化Transformer模型在端侧的推理速度?
- 稀疏计算在端侧有哪些应用?实现时需要注意什么?
- 复习端侧推理引擎的架构和优化技巧,准备一个自己熟悉的模型优化项目
匹配度报告
71
综合匹配度
大厂核心AI优化岗,技术前沿薪资优,但工作强度中等,灵活性有限。
适合人群
适合追求技术成长和前沿挑战,对薪资有较高期望,能接受现场办公和一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活50
使命价值70
薪资福利匹配
80较高
字节跳动薪资具有竞争力,且该岗位技术稀缺性高,薪资预期偏上乘。JD未提及具体福利,但大厂通常提供五险一金、补充医疗保险等。
薪资信号偏高 (30K-50K/月)
成长发展匹配
85较高
端侧大模型优化是当前AI领域前沿方向,技术挑战大,成长空间广阔。JD中强调了探索前沿技术,但未明确提及晋升或培训体系。
技术前沿前沿/新兴技术
技术栈模型量化、图优化、稀疏计算、编译优化、端侧推理引擎、MTK平台
业务类型ambiguous
工作生活匹配
50较低
JD要求现场办公,未提及弹性工作或远程选项,且互联网大厂通常工作强度较大,WLB一般。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值匹配
70中等
端侧AI是高速增长赛道,技术创新性强,但社会影响力中性,未体现明确使命感。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs