快手的大模型全栈开发工程师-AI Infra薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

大模型全栈开发工程师-AI Infra的工作地点在哪里？

该职位工作地点位于北京市、上海市、深圳市、杭州市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：21 天前

该职位是快手AI基础设施团队的大模型全栈开发工程师

你将负责构建和优化支撑公司大模型应用的核心平台，直面高并发、大规模、高可用的工程挑战

工作涵盖从提升推理服务的稳定性与性能，到精细化成本控制，再到打造一流的开发者体验，旨在让大模型能力稳定、高效、低成本地赋能业务

提升AI Infra的稳定性与可靠性：设计、开发并优化大模型推理服务平台，实现服务的高可用、容灾、自动扩缩容与平滑发布

构建和完善监控与可观测性体系，从硬件、驱动、模型服务到业务API，实现全链路追踪、智能告警与根因分析，将MTTR降至最低

开发自动化运维与自愈工具，处理GPU故障、网络异常、依赖服务中断等复杂场景，保障SLA

极致优化性能与效率：深入优化大模型推理性能，应用动态批处理、持续批处理、PagedAttention、量化、模型编译等前沿技术，显著降低响应延迟、提高吞吐量

开发和维护GPU资源调度与管理系统，提升GPU利用率，减少资源碎片

构建模型生命周期管理工具，实现模型的版本控制、A/B测试、蓝绿部署与流量调度，确保性能与效果的平稳迭代

精细化成本控制与优化：构建资源成本核算与分摊体系，精确追踪每个项目、每个团队、每个模型的GPU/算力消耗

开发智能资源调度策略，利用竞价实例、混合部署、弹性计算等手段，在保证SLA的前提下最大化成本效益

实现自适应推理优化，根据请求特征、业务优先级动态调整计算精度与资源分配，实现“好钢用在刀刃上”

全栈开发，打造一流开发者体验：负责或参与开发面向内部AI应用开发者的Web管理平台与API，提供从模型部署、服务监控到成本分析的一站式自助服务

设计和实现稳定、易用的客户端SDK/API，降低业务方接入和使用大模型能力的门槛

有实际的大模型推理/服务经验，熟悉vLLM, TensorRT-LLM, TGI等至少一种推理框架

有开发或深度使用Kubernetes Operator/CRD 来管理有状态应用的经验

熟悉主流云厂商的GPU实例和相关服务

具备AI Infra领域知识，了解模型量化、分布式训练、推理优化等技术

对成本优化有强烈的意识和成功的实践经验

大模型全栈开发工程师-AI Infra

🤖 AI 估测：¥35K-70K

发布时间：21 天前