京东的多模态算法工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

多模态算法工程师的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：26 天前

这是一个专注于前沿人工智能技术落地的核心算法岗位

你将负责多模态大模型（VLM）的后训练与强化学习对齐，构建工业级的检索增强生成（RAG）系统，并开发基于大模型的智能体（Agent）以解决复杂任务规划问题

职位要求具备扎实的AI算法工程能力，致力于将尖端技术应用于京东的实际业务场景

多模态大模型（VLM）后训练与强化学习攻坚：主导多模态大模型的 SFT 与对齐工作

重点负责构建和优化 RLHF/DPO/PPO 等强化学习训练链路，深入攻克 Reward Model 训练、强化学习训练不稳定性等难题，极致优化模型在复杂图文理解、逻辑推理及指令遵循上的表现

企业级 RAG 系统架构与优化：负责构建工业级的大规模检索增强生成（RAG）系统

针对高并发、复杂业务场景，优化多模态文档解析、百亿级向量检索、Rerank 排序模型微调，以及 Long Context 模型的显存与注意力机制优化

Agent 智能体及具身/复杂任务规划：设计并主导开发基于大模型的复杂 Agent 架构（如多智能体协作、记忆机制管理）

提升模型在使用复杂工具（Tool Use）、长逻辑链规划（Planning）及任务分解方面的自洽能力，并推动其在实际业务或智能系统中的规模化落地

高质量数据流与自动化评测体系构建：从零到一设计 SFT/RL 训练数据的自动化构建、挖掘与清洗 Pipeline

建立贴合业务真实场景的自动化评测集（Benchmark）与 Bad Case 归因体系，驱动模型快速迭代

学历与经验背景：计算机、人工智能、数学等相关专业，硕士及以上学历

具备 3 年左右 AI 算法工作经验，且至少包含 2 年以上的大语言模型（LLM）或多模态大模型（VLM）的一线训练与调优经验

强化学习（RL）核心背景：拥有扎实的强化学习理论基础，有丰富的 RLHF、DPO、PPO 或其他 LLM 强化对齐算法的实际落地经验

技术栈与框架底座：熟练掌握 Python 与 PyTorch

深入理解前沿的大模型基座（如 Qwen, Llama3, DeepSeek 等）及多模态架构（如 LLaVA, Qwen-VL 等）

熟悉 DeepSpeed、Megatron 等分布式训练框架，对显存优化（如 ZeRO 系列）有实际操作经验

工程能力与落地导向：代码基本功扎实，具备优秀的工程实现能力

能够熟练使用 Docker 容器化技术进行算法环境的构建与跨平台部署

优先条件（大流量/高并发）：有亿级用户量产品的大模型落地经验者优先

有具身智能（Embodied AI）、自动驾驶大模型、或复杂系统开源框架贡献经验者优先

多模态算法工程师

🤖 AI 估测：¥35K-60K

发布时间：26 天前