
普通员工/个人贡献者
AI 估算 · 25k–50k
大模型赛道热门,字节薪资竞争力强,技术门槛高,月薪较高。
该职位主要负责大模型预训练数据的全流程Pipeline建设,包括数据采集、处理、合成与评估
本科及以上学历,计算机、人工智能、数学或相关专业,具备扎实的编程基础,精通Python,并掌握至少一种编程语言(Java/Go/C++)
主导大模型数据生产的Pipeline建设,涵盖寻源、采集、解析、处理、实验与分析等环节,为各基础模型提供稳定、大规模且高质量的预训练数据
参与过大模型数据准备,或有合成数据训练大模型成功落地经验者优先
优点
缺点 / 挑战
字节大模型预训练核心岗位,技术前沿薪资高,但工作强度大,WLB一般。
该职位薪酬水平偏高,字节福利完善,能满足对经济回报的较高需求。
技术前沿,涉及大模型预训练、数据合成等新方向,成长空间巨大。
仅现场办公,未提及弹性工作制或远程,北京通勤压力大,WLB一般。
大模型是高速增长赛道,对社会和行业有较大影响,但职位本身未强调使命感。