音视频联合生成大模型算法工程师
🤖 AI 估测:¥35K-60K
发布时间:22 天前
ℹ️关于这个职位
这是一个专注于音视频联合生成大模型算法研发的岗位
你将负责核心算法(如VAE、扩散模型)的研发与优化,并为模型提供高质量的数据支持
同时,你需要跟踪前沿技术,推动该技术在快手业务场景中的落地与创新
✓工作职责
负责可灵AI音视频联合生成大模型的关键算法研发和优化
负责音视频数据的筛选,清洗和打标工作,为可灵AI音视频联合生成大模型提供数据支持
负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向
推动音视频联合生成技术在可灵及快手各业务场景中的落地,探索新玩法和业务创新
⭐最低要求
计算机和数学相关专业,硕士及以上学历
对VAE、扩散/AR模型、多模态等技术有深度理解,有较强的代码实现能力
有较丰富的语音/音频/音乐生成大模型相关领域经验
具有独立解决问题的能力,良好的表达能力、沟通能力和团队合作意识
👍优先资格
相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ISMIR,ICML,AAAI,NIPS等)