计算机或相关专业本科以上学历,具备扎实的数学、统计学以及计算机基础,3年以上推荐/广告/搜索/多模态相关的算法经验均可
精通推荐系统一个或多个算法模块,在其中部分模块有丰富的落地和迭代经验
或者熟悉Agentic RL的方法,了解Agentic RL Infra(例如CodeRL,Reward System),熟悉模型的Post-Training训练技术,能针对特定模型能力问题进行SFT、RL训练优化
对大模型和Agent有较深入的理解,熟悉常见的LLM实施模式、提示工程、评估框架、检索框架等,了解Agent Architectures/Structures(Multi-Agent、Context Engineering/Mangemant、ReAct/PlanAct/CodeAct),了解Agent相关的交互协议(MCP、A2A、FunctionCall)
优秀的分析问题和解决问题的能力,了解从海量用户反馈发生到模型学习的全链路及优化思路,善于定义和建模业务问题
实际工作关心产品用户体验,沟通能力和合作意识强