教育背景:计算机、数学或人工智能相关专业研究生及以上学历,五年以上推荐/搜索算法经验
领域经验:深耕推荐、广告或搜索系统,在召回、排序、重排等主流环节有丰富的工程实践
深刻理解 LLM + RecSys/Search 的融合路径,熟悉语义搜索、多模态理解及大模型在长尾分发中的应用趋势
模型与算法:扎实的机器学习理论,精通 Transformer、DeepFM、DIN 等经典架构,具备丰富的 CTR/CVR 预估调优经验
精通主流大模型(如 LLaMA、DeepSeek、Qwen)的架构,掌握 MoE(Mixture of Experts) 原理
熟练应用 PEFT(如 LoRA、AdaLoRA) 微调技术,并对 RLHF(基于人类反馈的强化学习) 或 DPO(直接偏好优化) 有实际操作经验
编程与数据处理:精通 Python、C++ 或 Java,具备高效的 SQL 编写能力及数据结构功底
熟练使用 Spark/Flink 进行大规模特征工程,具备向量数据库的使用与优化经验
掌握 Prompt Engineering 及高质量数据集(SFT/Pretrain)的清洗与合成技术
框架与工具:熟练使用 PyTorch/TensorFlow,精通 Hugging Face 生态及 DeepSpeed、Megatron-LM 等分布式训练框架
具备大模型推理加速经验,熟悉 vLLM、TensorRT-LLM、FlashAttention 或模型量化(GPTQ/AWQ)技术,能有效提升线上吞吐量
数据分析与评估:具备敏锐的数据洞察力,能够构建完善的 LLM 评估体系(如针对幻觉、对齐、多样性的评估)
擅长通过 A/B Test 验证算法收益,利用数据驱动模型迭代