在ML/NLP/CV等领域的顶级会议上发表高质量研究成果,推动内容安全领域的技术创新和提高快手的业界影响力,包括但不限于以下研究方向:
对齐:包括fine-tuning、instruction-tuning、reinforcement learning、prompt tuning等
数据:包括pre-training data、alignment data、synthetic data等
评估:包括benchmarks、 simulation environments、scalable oversight等
需要独立或协作完成从算法设计、实验验证到论文撰写的全流程研究,目标在6-12个月内产出具备国际竞争力的顶会论文