快手的多模态视频生成算法实习生-【可灵团队】薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

多模态视频生成算法实习生-【可灵团队】的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及无经验要求工作经验。

🤖 AI 估测：¥8K-15K

发布时间：18 天前

这是一个专注于前沿多模态视频生成技术的算法实习岗位

你将参与快手Kling模型的研发与落地，探索将大语言模型、语音等技术融入视频生成，旨在提升视频内容的理解、生成与交互能力

核心目标是产出高质量的学术论文，在顶会顶刊上发表研究成果

参与快手kling多模态视频生成的研发和落地工作（实习生以发论文为主），包括但不限于: t2v，i2v等基础模型研发、多模态可控视频生成编辑、世界模型等

探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合，包括但不限于：提升kling视频生成的多模态理解、推理、多轮交互能力等

探索将语音和视频生成相结合，包括但不限于：语音驱动的视频生成，有声视频等

探索实时可拓展的多模态视频生成技术，提升多模态视频生成的质量和效率等

在顶会顶刊上发表研究成果和开源代码，提升团队在多模态视频生成等领域的学术声望

熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等

熟悉多模态大语言模型（deepseek/qwen等）、多模态理解生成、世界模型优先

熟悉语音驱动视频生成、语音生成优先

有多模态大语言模型、图像/视频生成、3D生成大规模训练和数据清洗经验者优先

学习能力强、自驱、代码能力强、善于解决问题者优先

有一作顶会或顶刊论文发表经历或相关知名大模型开源项目者优先

团队大部分实习生是cuhk/hku/hkust，清北浙等高校的优秀博士生，大家合作交流密切

欢迎优秀同学加入！

多模态视频生成算法实习生-【可灵团队】

🤖 AI 估测：¥8K-15K

发布时间：18 天前