核心技能(满足1-2项即可) - 有机器学习、数据挖掘、NLP等任一领域理论与实践经验,熟悉用户行为建模(CTR/DTR预估)、多任务学习、因果推断者优先
- 深度了解RAG、Function-Call、Muiti-turn Search、RL等技术方向,有端到端Deepresearch训练经验者优先 - 掌握Agent通用开发架构,例如LangGraph、LangChain、AutoGen、CrewAI等AI Agent开发框架 - 了解Agentic RL相关理论,熟悉MDP建模、策略梯度,有GRPO/PPO等强化学习算法实现、Agent开发或轨迹数据处理经验
- 掌握LLM微调技术(SFT、DPO),熟悉Transformer架构,有使用TRL/OpenRLHF框架微调经验,能处理多模态数据者加分
- 熟悉Gym/RLlib/Tianshou等强化学习框架,或有搜索排序、用户行为预估相关项目经验,能独立完成算法实验与调试者优先