数据增强算法优化,优化预训练/SFT/RLHF阶段的数据合成算法,提升训练数据的准确性、多样性和领域适配性
支持大模型研发,参与Code-LLM与逻辑推理大模型的训练创新,攻克NL2Code、复杂推理链生成等技术难点,推进LLMTest-TimeCompute、Parameter-EfficientFinetuning等技术落地实践
推动大模型应用落地,探索包括RAG-QA机器人、数据洞察机器人、 AICoding等在真实场景的应用价值,并基于评估体系实现应用效果的持续迭代
跟进开源SOTA大模型,探索大模型ScalingLaw并实践开源大模型在数据智能领域的Post-Training,沉淀技术专利