字节跳动的Code大模型算法工程师/研究员-豆包大模型薪资是多少？

该职位薪资范围为 35k–65k（人民币/月）。

Code大模型算法工程师/研究员-豆包大模型的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥35K-65K

发布时间：大约 1 个月前

这是一个专注于大模型代码算法研发的岗位

你将负责代码预训练数据的全流程处理与优化，并深入探索深度推理、强化学习等前沿技术，以提升代码模型的性能和应用效果

核心目标是构建高质量的数据链路和算法模型，支持字节跳动豆包大模型及其生态应用

负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作，持续提高代码预训练、中程训练等阶段的数据质量

负责探究预训练小领域数据的配比和最终效果之间的关系

开发数据合成链路，解决代码模型中的关键问题

负责探究深度推理技术，探究Test-time Compute和模型效果的Scaling laws，参与后训练奖励模型、强化学习算法的一系列优化流程，探究线上代码补全数据到RL过程的数据飞轮

专注于代码强化学习中的奖励模型（Reward Model）的优化和创新

包括和SFT阶段配合解决判别能力较差的场景、探究合成数据进行代码奖励模型的预训练、组织标注人员进行代码奖励模型的标注、Critic的前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充

本科及以上学历，计算机、物理、数学、神经科学或相关专业

具备扎实的计算机科学功底和编程能力，熟悉常见算法和数据结构，具有良好的编程习惯

熟悉语言模型的基本技术、模型结构，对AI的未来有信仰和工作热情

工作认真细致，计划性强，具有刨根问底的探究精神，对研发工作中有很强的实事求是的落地信念，追求最终效果而不是盲目追求新颖的方法，对工作内容要较强责任感

有NOI、ACM竞赛经历者优先

有推荐、搜索领域出色的数据驱动工作者优先

熟悉强化学习相关技术和细节，曾深度参与强化学习项目或语言模型项目

具有较强的工程能力，能迅速熟悉字节跳动内外部平台工具使用，具有主动提升效率的意识