算法引擎优化工程师-搜广推业务
🤖 AI 估测:¥35K-60K
发布时间:28 天前
ℹ️关于这个职位
这是一个专注于算法模型高效部署与性能优化的技术岗位
你将负责将Diffusion、LLM等前沿AI模型应用于小红书的核心搜广推业务,通过工程化手段提升推理效率、降低成本,并构建稳定可扩展的算法服务框架
✓工作职责
负责算法侧各类模型的高效部署调用和性能优化,包括但不限于Diffusion、LLM、VLLM等,提升推理效率,降低大模型应用成本
负责商业AI算法服务的部署,与投放平台、检索侧的工程化对接,搭建稳定可扩展的算法工程框架,承接所有算法服务
设计和优化推理架构,确保算法服务的高可用性、稳定性和效率,建立完善的监控告警和故障恢复机制
打造具有业界一流水平的大模型推理技术能力,并通过开源共建等各类形式,形成在业界的广泛技术影响力
⭐最低要求
精通Java/Python,对各种AI算法有一定的了解,有丰富的算法工程集成,并有大模型部署、性能优化和落地经验
有搜广推相关场景经验,对搜广推任意架构有一定的了解
深入了解transformers、vllm、sglang、tensorrt框架中的一种或多种,有多类模型的优化经验者优先
有扎实的编程基础、良好的编程风格和工作习惯,实际动手能力强
有良好的沟通表达能力和团队精神,有很好的通过技术解决真实问题创造业务价值的意愿
👍优先资格
熟悉CUDA编程、CUDNN、TensorRT等工具者优先
具有ACMICPC、NOI/IOI比赛获奖者优先