Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
C++端到端语音大模型SDK架构师/专家-Data语音
立即应聘

C++端到端语音大模型SDK架构师/专家-Data语音

发布于 1 天前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
本科
软件工程
架构设计
iOS
多线程
SDK
AIGC
WebRTC
语音大模型

AI 估算 · 40k–60k

字节跳动头部互联网,语音大模型架构师稀缺,薪资竞争力强,按月薪5万中位数,年终3个月。

职位详情

关于这个职位

该职位负责字节跳动下一代端到端语音大模型交互SDK的核心架构设计与工程落地

你将深入对接豆包语音大模型和LLM,极致优化延迟与双工交互,推动AIGC技术落地
需要精通现代C++和跨平台开发,适合追求技术前沿的资深系统工程师

最低要求

本科及以上学历,计算机相关专业,具有扎实的编程功底和优秀的架构设计能力,对设计模式、面向对象与泛型编程有深刻理解

精通现代C++,具备深厚的数据结构、多线程并发编程、异步编程及高性能网络编程(TCP/WebSocket/WebRTC)功底,深入理解操作系统原理
熟练掌握跨平台开发流程、构建系统及工程化工具(如CMake、GitLab CI、JNI、Objective-C/Swift混编等)

工作职责

负责跨平台(iOS、Android、Linux)、跨端(端、云、硬件)的下一代端到端语音大模型交互SDK的核心架构设计与工程落地

深度对接豆包语音大模型、大语言模型(LLM)及前沿语音算法
针对应答延迟、首字延迟进行极致优化,设计并实现支持智能打断、双工交互、多模态协同的高性能状态机与业务逻辑
紧跟全球AIGC与语音大模型系统(如语音Agent、端到端实时音视频交互)的最新工业界进展,持续重构和精炼SDK核心底座

优先资格

音视频基础设施(加分项):

熟悉移动端/嵌入式音频底层API(如OpenSL ES、AAudio、CoreAudio/AudioQueue、AudioUnit等),有Web Audio/Web Assembly(Wasm)跨端落地经验者优先
加分项:
有智能座舱(车载)、智能家居、AI助理等复杂语音交互产品研发经验者优先
熟悉机器学习/信号处理基本概念,或有Llama.cpp/ONNX Runtime/WebRTC等开源库深度定制与优化经验者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台,资源丰富,语音大模型方向技术前沿
  • 薪资和福利优厚,股票激励等
  • 技术栈极深,需同时掌握系统编程、音视频、AI等多领域
  • 工作强度大,需快速迭代和应对复杂问题
  • 行业竞争激烈,需要持续跟进最新工业界进展
  • 适合具有扎实C++和系统架构经验、渴望在语音AI领域深耕并追求高回报的技术专家

缺点 / 挑战

  • 深耕端到端语音交互,技术挑战大,个人成长快

角色解读

  • 成长为语音大模型系统架构师,主导端侧AI SDK技术方向
  • 向技术管理或AI系统总架构师发展,领导核心项目
  • 深度参与AIGC前沿,持续积累端侧实时交互经验
  • 负责跨平台语音大模型SDK的架构设计,整合iOS/Android/Linux端的能力
  • 深度优化首字延迟与智能打断等实时交互性能,实现双工多模态协同
  • 对接豆包语音大模型和LLM,推动端到端语音交互技术的工程落地
  • 精通现代C++,掌握多线程、异步编程、高性能网络编程
  • 熟悉跨平台开发工具链(CMake、JNI、Objective-C/Swift混编)
  • 了解音视频底层API(如OpenSL ES、CoreAudio)和WebRTC优化

申请策略

  • 准备一个端到端语音交互系统设计的案例,包括架构图和性能数据
  • 关注字节跳动语音技术动态,展现对产品的理解
  • 突出跨平台SDK架构设计经验,展示具体优化成果
  • 体现实时音视频或语音交互相关项目经历
  • 强调对C++性能优化、多线程并发控制的理解
  • 如有开源贡献或技术博客,展示技术深度
  • 补充WebRTC底层优化和音频Pipeline知识
  • 学习语音信号处理或机器学习基础概念

面试指南

  • 使用场景分析 -> 瓶颈定位 -> 方案对比 -> 实现细节与量化指标
  • 结合具体项目经验,用数据说话
  • 体现系统思维和代码层次的抽象能力
  • 如何优化语音交互中的首字延迟?
  • 请描述跨平台内存管理和多线程同步策略
  • WebRTC音频Pipeline优化的经验?
  • 如何设计支持智能打断的状态机?
  • 谈谈你对端到端语音大模型系统架构的理解

职位点评

72
综合评分

顶尖大厂前沿语音大模型架构岗,技术挑战极大,薪资优厚,但工作强度高。

更适合这类人
适合追求技术成长和高薪回报、能够承受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利

85较高

字节跳动薪资福利在业内极具竞争力,但JD未明确薪资数额,仍需面议确认。

薪资信号未披露(AI估算:40K-60K/月)

成长发展

95较高

该职位处于语音大模型和AIGC前沿,技术挑战极大,个人成长空间显著。

技术前沿前沿/新兴技术
技术栈C++、语音大模型、SDK、WebRTC、AIGC
业务类型profit_center

工作生活

40较低

仅现场办公,地点北京,未明确提及WLB,互联网大厂通常工作强度大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

语音大模型属于高速增长赛道,技术具有开拓性,但社会影响力中性,缺少明确使命感描述。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k