快手的大模型训练专家（Agent方向）薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

大模型训练专家（Agent方向）的工作地点在哪里？

该职位工作地点位于北京市、上海市、深圳市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：6 天前

该职位是快手公司招聘的大模型训练专家，专注于Agent方向

你将负责参与LLM Agent的预训练与后训练优化，提升模型在任务理解、指令跟随、多轮对话、工具调用等方面的性能

同时，你需要对模型输出进行评测与误差分析，并围绕Agent使用场景设计高质量的对话样本和训练数据

参与 LLM Agent 的预训练与后训练优化，提升模型在任务理解、指令跟随、多轮对话、工具调用等方面的表现

对模型输出进行评测与误差分析，识别在幻觉、漏召回、格式偏差、工具误用、指令偏移、安全风险等方面的问题，并推动改进

围绕Agent使用场景，设计multi-turn conversation、任务流程和工具使用样本，优化Agent 在复杂任务中的完成率与鲁棒性

设计并构建高质量训练数据、评测集和对话样本，覆盖真实业务中的典型场景、边界场景与异常案例

计算机相关专业硕士及以上学历，研究方向为自然语言处理、机器学习、深度学习等相关方向，或者在该领域有相关工作经验，精通Python编程，熟悉Java/C++中至少一门语言

能够针对模型“不 work”的情况，从训练数据质量、任务定义、Prompt 设计、评测标准、奖励机制、工具调用链路、推理参数、模型对齐策略等多个维度进行拆解和诊断

熟悉常见模型问题，包括但不限于幻觉、指令跟随不稳定、格式不一致、任务完成率低、工具误用等，并能结合bad cases进行分析和迭代

了解阅读理解、序列标注、文本生成、文本分类等传统NLP任务，精通PyTorch/TensorFlow等训练框架，可以自己构造小模型验证算法有效性，并具备Qwen、Llama、Deepseek等模型的后训练实操经验

加分项：

在ACL、EMNLP、NeurIPS、ICLR、ICML、KDD 等国内外顶级会议/期刊有相关论文发表者优先

有大模型后训练（Post-training）相关项目经验者优先，尤其是在国内外头部科技公司或知名AI团队的实际工作经历

具有扎实的深度学习算法基础，熟悉深度学习框架和分布式训练推理加速，有实操经验者优先

大模型训练专家（Agent方向）

🤖 AI 估测：¥45K-80K

发布时间：6 天前