学历背景:计算机科学、人工智能、电子工程等相关专业博士学位或同等工程经验
模型经验:具备大模型(LLM/生成模型)训练经验,熟悉分布式训练与大规模模型优化技术
深入掌握以下至少一个方向:
语音/歌声生成技术(TTS / SVS)
音频生成技术(text2audio)
连续和离散的Audio tokenization技术
音视频联合生成与跨模态时序同步技术
工程能力:精通Python与PyTorch,具备百万小时级数据处理与高效训练经验
协作能力:具备跨时区国际团队协作经验,结果导向,自驱力强,沟通表达能力优秀