Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型数据工程师-Data语音
立即应聘

大模型数据工程师-Data语音

发布于 大约 11 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
数据工程
大数据
PyTorch
MLOps
大模型

AI 估算 · 35k–65k

大模型热门赛道,字节薪资竞争力强,要求3年以上大数据经验,月薪3.5-6.5万合理。

职位详情

关于这个职位

该职位负责设计和实现高性能、可扩展的分布式大数据处理平台,支撑字节跳动智能语音业务的算法研发与模型迭代

与算法工程师紧密协作,参与前沿模型的数据解决方案设计,并持续提升数据平台的效率和易用性
适合具有扎实编程基础、熟悉大数据生态(如Hadoop、Spark)并有分布式系统经验的数据工程师

最低要求

计算机及相关专业本科或本科以上学历,良好的沟通和团队协作能力

扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式
年以上工程研发或者基础架构经验,熟练掌握C/C++、Python、Golang等至少一种开发语言
熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapReduce、Spark、Presto、ClickHouse、Ray、数据湖等
具备分布式系统的研发经验,有优化系统性能问题的能力和经验

工作职责

参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型生产,支撑字节跳动智能语音相关业务算法生产与高效迭代

与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护
持续提升平台数据生产效率、易用性、降低算法使用成本,探索业界前沿的多模态数据处理相关技术,设计并实现到数据平台中

优先资格

有前沿模型研发经验,涉及数据、评估、平台相关工作

具有大规模分布式架构设计开发经验
有K8s/Kubeflow/Airflow/MLOps研发或者应用经验
熟悉PyTorch深度学习框架,了解常见的深度学习算法

AI 洞察

优缺点分析

优点

  • 身处AI大模型最前沿,接触字节跳动智能语音核心技术,技术成长空间大
  • 薪资福利优厚,字节跳动提供有竞争力的薪酬和股票期权
  • 对技术广度要求高,需同时掌握大数据、分布式系统、深度学习框架等多个领域
  • 适合具备3年以上大数据/分布式系统经验、对AI技术有热情、希望在大模型时代深度参与基础设施建设的工程师

缺点 / 挑战

  • 公司平台大、资源丰富,数据规模和处理挑战业界顶尖,能快速积累大规模分布式系统经验
  • 业务节奏快、迭代频繁,可能面临较强的工作压力和时间紧迫性
  • 需要与算法团队紧密配合,沟通成本较高,需理解复杂的模型研发需求

角色解读

  • 技术深耕:成为大数据架构专家,主导百PB级数据处理平台的设计与演进
  • 领域扩展:向AI Infra方向发展,结合大模型训练与推理优化,成长为AI基础设施架构师
  • 管理方向:积累经验后带领数据工程团队,负责多条业务线的数据平台建设
  • 设计并实现高性能、可扩展的分布式大数据处理平台,支撑智能语音算法的训练与推理
  • 与算法工程师协作,为前沿模型研究提供数据解决方案,包括数据采集、清洗、标注等
  • 优化数据生产效率与易用性,探索多模态数据处理技术并集成到平台中
  • 扎实的编程能力,熟练掌握C++/Python/Golang中的至少一种,熟悉多线程、分布式、网络通信
  • 精通大数据生态工具,如Hadoop、Spark、Hive、Presto、ClickHouse等,具备分布式系统优化经验
  • 了解机器学习流程,熟悉PyTorch等深度学习框架,有K8s、MLOps等平台开发经验者优先

申请策略

  • 关注字节跳动智能语音业务方向(如语音识别、语音合成),在面试中展现对业务场景的理解
  • 提前了解公司内部的大数据基础设施(如ByteDance的云原生数据平台),思考如何与自身经验结合
  • 突出大数据平台建设经验:详细描述参与过的分布式系统设计、性能优化案例,量化成果(如提速XX%、支撑XX数据量)
  • 强调编程语言和框架熟练度:列出C++/Python/Golang的项目代码量或贡献,尤其涉及多线程、网络编程的部分
  • 展示与算法团队协作的经历:如果做过数据pipeline支撑模型训练,务必写明,体现跨团队合作能力
  • 若经验不足,可系统学习Ray、Spark Streaming等实时大数据处理框架,并练习优化系统性能的方法
  • 补充MLOps知识:了解Kubernetes、Kubeflow、Airflow等工具,可用于简历中的加分项

面试指南

  • 针对系统设计类问题:先明确业务需求和数据规模,然后分层描述(存储层、计算层、调度层),最后给出关键设计决策(如分片策略、容错机制)
  • 针对性能优化类问题:遵循“问题定位→根因分析→方案设计→效果验证”的思路,注重量化前后对比
  • 请描述你设计过的一个分布式数据平台架构,包括组件选型、数据流设计以及如何保证可扩展性
  • 如何优化Spark作业的性能?请举例说明你遇到过的性能瓶颈及解决方案
  • 在大模型训练场景下,数据pipeline需要考虑哪些特殊要求?
  • 你如何使用K8s或Airflow来管理数据管道?
  • 谈一谈你对数据湖和数据仓库的理解,以及它们在AI数据平台中的角色
  • 复习分布式系统经典知识:一致性哈希、CAP理论、MapReduce原理、Spark Shuffle等

职位点评

72
综合评分

大模型前沿技术岗,薪资优厚、发展空间大,但工作强度和WLB一般。

更适合这类人
适合以技术成长和职业发展为首要动机,愿意在快速节奏中挑战自我的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活45
使命价值70

薪资福利

85较高

字节跳动提供具有市场竞争力的薪资和福利,整体薪酬偏高,但具体薪资未在JD中披露,需面议。

薪资信号面议 (35K-65K/月)

成长发展

90较高

职位涉及大模型、分布式系统、AI基础架构等前沿技术,技术成长空间极大,且字节跳动内部有完善的晋升体系。

技术前沿前沿/新兴技术
技术栈大模型、分布式系统、Hadoop、Spark、Ray、PyTorch、K8s、MLOps
业务类型profit_center

工作生活

45较低

职位要求现场办公,未明确提及弹性工作或WLB,字节跳动的互联网文化通常工作强度较大。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

智能语音是AI重要方向,有积极的社会价值(如提升人机交互效率),但职位更偏向技术实现而非直接社会影响力。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k