为生成式和预测模型设计稳健的评估与基准测试(离线指标、在线A/B、安全与鲁棒性测试),并在团队中制度化科学严谨性
将研究转化为生产,与工程合作强化模型和管道(数据准备、优化、推理运行时、可观测性),以实现工业级可靠性
端到端领导应用研究项目——从文献综述和方法选择到消融实验、扩展和产品化,并在不确定性下做出务实权衡
进行技术评审,提高可重复性、文档和实验规范的标杆
倡导负责任AI,包括偏差检测、模型风险管理、护栏和安全关键用例的人机协同控制
主动降低扩展瓶颈(数据质量、延迟/吞吐量、成本、漂移),并用证据影响长期架构决策