你会负责下述至少一件事情
海量数据的处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,对数据采集和处理流程不断提出新的要求和改进方案
模型的改进:在 Large Scale 上迭代并改进模型使其更加的高效(capacity per flops / improvement per flops),或者提升模型的 scale up 后的稳定性
研究并改进 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等)
多模态:研发多种模态作为输入/输出的 Large Scale 模型