Code大模型算法工程师/研究员-豆包大模型
🤖 AI 估测:¥35K-65K
发布时间:大约 1 个月前
ℹ️关于这个职位
这是一个专注于大模型代码算法研发的岗位
你将负责代码预训练数据的全流程处理与优化,并深入探索深度推理、强化学习等前沿技术,以提升代码模型的性能和应用效果
核心目标是构建高质量的数据链路和算法模型,支持字节跳动豆包大模型及其生态应用
✓工作职责
负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中程训练等阶段的数据质量
负责探究预训练小领域数据的配比和最终效果之间的关系
开发数据合成链路,解决代码模型中的关键问题
负责探究深度推理技术,探究Test-time Compute和模型效果的Scaling laws,参与后训练奖励模型、强化学习算法的一系列优化流程,探究线上代码补全数据到RL过程的数据飞轮
专注于代码强化学习中的奖励模型(Reward Model)的优化和创新
包括和SFT阶段配合解决判别能力较差的场景、探究合成数据进行代码奖励模型的预训练、组织标注人员进行代码奖励模型的标注、Critic的前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充
⭐最低要求
本科及以上学历,计算机、物理、数学、神经科学或相关专业
具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
熟悉语言模型的基本技术、模型结构,对AI的未来有信仰和工作热情
工作认真细致,计划性强,具有刨根问底的探究精神,对研发工作中有很强的实事求是的落地信念,追求最终效果而不是盲目追求新颖的方法,对工作内容要较强责任感
👍优先资格
有NOI、ACM竞赛经历者优先
有推荐、搜索领域出色的数据驱动工作者优先
熟悉强化学习相关技术和细节,曾深度参与强化学习项目或语言模型项目
具有较强的工程能力,能迅速熟悉字节跳动内外部平台工具使用,具有主动提升效率的意识