
普通员工/个人贡献者
AI 估算 · 30k–60k
多模态AI算法为核心技术,市场稀缺度高,薪资竞争力强,体现技术价值。
作为快手可灵AI的多模态理解算法工程师,你将负责视频Caption、Agentic Prompt Engineering和Reward Model等核心任务,利用多模态技术弥合文本与视频模态差异,提升视频生成模型效果
有音视频理解、多模态Caption、理解生成一体化、理解/生成Benchmark等方向的经验,有大厂实习、顶会论文优先
承担视频Caption和参考生成的Instruction职责,特别是在多分镜、高动态、长视频等场景提供精准、全面的描述,最大化弥合文本模态和视频模态之间的差异
优点
缺点 / 挑战
大厂AI核心岗位,前沿技术栈,薪资优厚,但工作强度可能较大。
薪资竞争力强,大厂福利完善,但具体薪资未披露,需面议。
前沿多模态AI技术,项目挑战大,成长空间显著。
未提及灵活办公,大概率现场办公,互联网大厂工作强度较高。
AI视频生成是高速增长赛道,创新性强,社会影响力中性。