
普通员工/个人贡献者
AI 估算 · 50k–80k
大模型专家岗位,多模态理解属前沿技术,字节跳动大厂薪资竞争力强,通常包含高额年终奖金。
作为大模型算法专家,你将负责中长视频的多模态理解能力建设,让模型能充分理解视频的画面、声音和语音,并基于原子工具规划动作序列完成创作任务
本科及以上学历,计算机视觉、人工智能、大模型等相关专业优先
负责中长视频多模态理解能力建设:创作场景需要对用户素材充分理解,因此大模型需要对输入视频的画面、声音及语音等能充分理解,具备素材剪辑处理的通用理解能力
有图像视频生成与可控编辑、多模态、AIGC、数字人应用项目落地经验者加分
优点
缺点 / 挑战
大厂前沿多模态算法岗,技术成长顶尖、薪资优厚,但工作强度大、WLB较差。
字节跳动大厂薪资处于行业顶尖,且提供丰厚的股票期权,但JD未明确具体数字,存在一定不确定性。
岗位涉及最前沿的多模态大模型技术,拥有海量数据和算力资源,技术成长空间极大,JD虽未直接提及晋升通道,但大厂内部晋升体系完善。
字节跳动通常节奏较快,JD未提及弹性办公或远程,且大厂算法岗加班较多,工作生活平衡挑战大。
多模态AIGC属于高速增长赛道,能创造实际价值(如辅助视频创作),有一定社会影响力,但主要追求商业变现。