
普通员工/个人贡献者
AI 估算 · 35k–60k
快手上市大厂,高性能计算岗位稀缺,需博士或硕士+丰富经验,薪资对标P7-P8,月薪含年终约15薪。
这是一个面向视频大模型的高性能计算与低精度算子优化岗位,工作内容包括设计通算融合算子、优化混合专家网络(MoE)架构、开发低精度/稀疏化算子,并确保扩散模型训练推理一致性
计算机、应用数学、微电子、人工智能等相关专业硕士或博士学位,具备极强的数理逻辑基础与计算机体系结构底蕴
高性能通算融合算子设计与 PTX 底层优化:深度挖掘下一代计算硬件微架构的物理极限,针对大规模通信设计高性能通算融合算子,利用 CuTe DSL 描述复杂的多维 Layout 转换与共享内存流水线,在寄存器与指令级(PTX )对算子进行极致调优,将网络通信与矩阵乘法计算在硬件执行流层面进行极致overlap
著名开源底层库的核心贡献者、Committer 或核心维护者
优点
缺点 / 挑战
顶尖大厂核心研发岗,前沿技术栈,高薪高压,成长迅猛。
快手上市大厂,薪资待遇行业内顶尖,福利完善,但岗位门槛高,竞争激烈。薪资信号偏向偏高。
岗位技术前沿(GPU优化、MoE、低精度),成长空间极大,有机会接触业界最新硬件和框架,并有发表论文和参与开源的机会。
现场办公,且岗位强度大,需要投入大量时间钻研技术,工作生活平衡可能较差。
从事视频大模型底层优化,推动AI技术进步,有一定社会价值,但主要面向商业应用,使命感中等。