京东的多模态算法研究员薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

多模态算法研究员的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：26 天前

这是一个专注于前沿多模态人工智能研究的岗位

你将参与构建涵盖语言、视觉、语音的基础模型，研发包括视频生成、世界模型在内的核心技术，并探索多模态大语言模型的应用与结合

目标是推动从数字世界到物理世界的深度融合，为京东的业务提供世界一流的模型保障

参与全模态交互世界模型的研发和落地工作（实习生以发论文为主，正式员工技术研究落地为主），包括但不限于t2v/i2v/ti2va等基础模型模态研发（如videovae/audiovae/dit/vsr/pe/caption）、全模态交互视频生成和世界模型等

参与探索多模态大语言模型mllm如deepseek/qwen与世界模型相结合，如理解生成一体化，包括但不限于：全模态理解推理、多轮交互、rl后训练等

参与探索实时可交互全模态视频生成技术，包括但不限于moe/sparse attention模型架构设计，蒸馏加速，模型压缩，长视频生成，工程量化等

参与优化全模态数据管线，包括数据清洗/构建/scale up/线上数据回流分析等数据飞轮

参与制定全模态视频生成质量标准和评测体系，指导模型研发迭代，摸清跟竞品的水位

在顶会顶刊上发表研究成果和开源代码，提升团队在实时全模态交互世界模型领域的学术声望

硕士及以上学历，熟悉视频生成基础模型如Sora、Veo、moviegen、hunyunvideo，wan等

符合京东价值观：客户为先、创新、拼搏、担当、感恩、诚信

熟悉语音驱动视频生成、音画同步视频生成优先

熟悉多模态大语言模型（deepseek/qwen等）、多模态理解生成、世界模型优先

熟悉实时视频生成，推理加速优化优先

熟悉deepspeed/megatron框架和算子优化优先

有多模态大语言模型、图像/视频生成、3D生成大规模训练和数据清洗构建经验者优先

学习能力强、自驱、代码能力强、善于解决问题者优先

有一作顶会或顶刊论文发表经历或相关知名大模型开源项目者优先

多模态算法研究员

🤖 AI 估测：¥35K-60K

发布时间：26 天前