AI方法论与标准 (20%):
定义和维护中心的AI工程标准:训练配置、实验可重复性要求、命名约定、检查点管理
策划和记录可复用的训练配方:分布式训练模板、参数高效微调配置、推理优化模式
发布关于方法选择的最佳实践指南(何时使用参数高效方法 vs. 全微调,何时应用对齐技术)
建立可重复性框架:实验配置、种子管理、结果验证标准
基准测试与评估 (15%):
设计和构建中心的模型评估平台:标准化测试工具、指标仪表板、比较工具
与发现团队合作策划领域相关的基准测试套件(生物制剂、计算化学)
定义评估方法:哪些指标重要、如何构建保留测试集、如何避免数据泄露、模型何时“足够好”可以部署
构建排行榜基础设施,以便发现团队可以严格比较模型变体、微调方法和架构选择
建立评估即服务:发现团队提交模型,获得标准化评分卡
数据产品与治理 (20%):
拥有“AI就绪”数据层:将IT的基础数据流水线转换为专为模型训练构建的受治理、版本化、有文档记录的数据集
构建具有清晰来源、质量分数、已知局限性和推荐用例的数据产品目录
实施数据质量框架:自动验证规则、漂移检测、完整性检查、跨数据集一致性
设计和执行数据版本控制标准,以便实验可针对特定数据集快照重现
为跨境数据传输和本地数据操作实施PIPL/DSL合规框架
定义与企业数据赋能FAIR标准一致的数据治理政策
智能体AI与应用 (15%):
为北京中心部署智能体AI能力:多智能体编排、本地智能体开发框架、科学工作流自动化
评估和整合中国特定的LLM(Qwen、DeepSeek、GLM、Moonshot)供中心使用
构建中国云集成(阿里、腾讯、百度)用于LLM推理和智能体托管
为发现团队启用AI生产力工具:编码助手、文献搜索智能体、实验设计副驾驶
定义智能体评估方法:如何衡量智能体的可靠性、安全性和科学准确性
团队领导 (20%):
招聘、管理和发展一支平台全职员工团队(2026年8人,扩展至10人以上)
为所有平台交付成果设定技术方向和质量标准
在北京运行招聘渠道:从顶尖本地大学和北京AI人才市场寻找候选人
创建在竞争激烈的市场中吸引北京顶尖AI人才的团队文化
入职和培养初级员工
与全球平台负责人建立技术导师制
利益相关者协调 (10%):
与IT基础设施负责人合作制定计算政策、调度优先级和容量规划
直接与发现垂直领域负责人合作,了解工作负载需求并确定平台交付优先级
向生态系统合作伙伴(学术机构、AI公司)展示平台能力,以进行技术集成
定期向全球AI领导层提供交付更新
参加所有中心职能部门的每周协调会议