
普通员工/个人贡献者
AI 估算 · 25k–45k
字节跳动大厂,音频算法方向热门,需要深厚技术背景,薪资竞争力强,中位数参考市场水平。
该职位负责抖音直播中低延迟音频理解与生成模型的技术攻关,包括ASR、TTS、端到端语音大模型等
计算机、人工智能、模式识别等相关专业本科及以上学历
负责抖音直播中低延迟音频理解和生成模型的能力建设,为实时对话智能体提供音频技术支持,包括但不限于ASR、TTS、端到端语音大模型、音频分类等
在语音、人工智能领域的会议和期刊,如ICASSP、Interspeech、NIPS、ICML、ICLR等发表过论文,或在相关竞赛中取得优异成绩者优先
优点
缺点 / 挑战
大厂核心业务,前沿语音技术,高薪高压,技术成长快。
字节跳动薪资竞争力强,但职位未明确薪资范围,且深圳互联网行业加班文化普遍,补偿性满足程度中等偏上。
职位涉及端到端语音大模型等前沿技术,紧跟业界最新方向,成长空间大;但JD未明确提及晋升通道。
仅现场办公且字节跳动通常工作强度较大,未提及WLB政策,生活化满足程度较低。
直播互动场景提升用户社交体验,有较强的行业影响力,但社会价值相对中性,尚未明确使命感导向。