【核心职责】:
大模型训练与优化
(1)主导百亿级以上参数的预训练模型全流程工作,包括数据清洗、架构设计、分布式训练策略制定(如Data/Pipeline/Tensor Parallelism)及训练稳定性优化
(2)优化模型训练效率,解决显存瓶颈、长序列处理、多模态对齐等问题,降低训练成本并提升模型性能
后训练技术落地
(1)开展有监督微调(SFT)、奖励模型训练(RM)和RLHF/RLAIF,提升模型的指令遵循能力、安全性和业务场景适配性
(2)构建自动化评估体系,针对模型效果、伦理合规性设计多维评测方案
技术突破与工程化
(1)研究MoE、高效注意力机制等前沿技术,推动模型压缩、量化及推理加速,支持云端或边缘设备部署
(2)主导高可用训练平台建设,完善断点续训、故障恢复等机制,保障大规模训练的稳定性
跨领域协同与赋能
(1)与业务团队合作,将模型能力应用于智能客服、行业知识库、流程自动化等场景,通过LangChain等框架实现技术落地
(2)指导团队成员,输出技术文档与专利,构建团队技术壁垒