图像质量评价大模型算法实习生

🤖 AI 估测:¥6K-10K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个专注于视频消费体验优化的算法实习岗位
你将运用强化学习技术,参与构建提升用户长期体验的决策模型
工作内容包括视频播放场景的状态建模、奖励函数设计、策略学习与效果评估,并通过数据分析和AB实验驱动算法迭代

工作职责

参与小红书视频消费链路的策略优化,基于强化学习算法构建用户长期体验最优化的决策模型
负责视频播放场景下的状态建模、奖励函数设计、策略学习与仿真评估,推动强化学习在视频消费场景的落地与迭代
深入业务数据,挖掘用户行为模式,通过AB实验、因果推断等方法科学评估策略效果,持续驱动算法与体验的双重提升

最低要求

本科及以上学历,计算机、人工智能、统计学、自动化等相关专业
熟练掌握强化学习经典算法(如DQN、PPO、SAC等),有相关项目或竞赛经验,具备扎实的机器学习与数据挖掘基础
优秀的编码与工程实现能力,熟练掌握Python,熟悉TensorFlow/PyTorch等框架,具备大规模数据处理和实验分析经验
对用户体验敏感,具备良好的业务洞察和问题拆解能力,能够独立完成从问题定义到模型落地的全流程