计算机科学、数据科学、应用数学或相关领域的硕士及以上学历,或具备同等实践经验
拥有3-5年构建AI/ML或NLP应用的经验,包括使用大语言模型或序列模型的生产级系统
具备扎实的Python编程技能,并有构建服务和管道的经验(例如FastAPI、LangChain/LlamaIndex或同等框架)
具备提示工程、检索增强生成以及工具/函数调用的经验
能够设计确定性的后处理和验证器
熟悉软件工程最佳实践:版本控制、测试、CI/CD、容器化以及ML应用的可观测性
具备评估生成式系统的经验(人工审查、评估标准设计、离线/在线指标、A/B测试)并实施安全/护栏机制
能够将领域需求转化为模型能力,并在质量、成本、延迟和可解释性之间进行权衡沟通
具备将LLM与代码生成工作流和执行沙箱集成的经验,包括对生成代码的静态分析和自动化测试
接触过受监管环境(GxP, CSV)和符合审计要求的文档实践
理解数据隐私和安全原则
具备向量数据库、嵌入以及知识图谱/RAG技术的经验
模型优化(量化、蒸馏)和提示版本管理
熟悉生成式AI的MLOps(模型注册、特征/知识存储、推理网关)以及成本/性能监控