极致推理与底层加速：负责开源大模型（LLM/VLM）的私有化部署。主导基于 VLLM、SGLang、Triton 等框架的底层稳定性与性能调优。
Agent 编排与开放平台构建：打造高弹性、低门槛的 Agent 编排中台，并向内外部提供标准化的开放能力。设计高扩展性的 API/SDK 矩阵与插件（Plugin）系统，支持业务流的无缝接入。
统一网关与路由中枢：搭建企业级异构模型 API 路由层，实现多供应商平滑接入、智能负载均衡、成本管控及全链路可观测性。
核心框架与全栈攻坚：深度定制并扩展 LangChain、OpenClaw 等前沿框架或产品，突破多智能体协同、长上下文处理、高频复杂 Function Calling 及 RAG pipeline等瓶颈。具备前后端全栈视野，打通底层模型到前端交付的数据流。
端到端业务闭环：紧贴真实业务场景，通过上下文工程、检索增强优化及模型选型评估等维度支持业务打通从 PoC 到生产全量上线、甚至系统集成的最后一公里。
前沿追踪与评测体系：建立科学的线上/线下评估基准（Benchmark / A/B Test）；紧跟底层算法演进，指导内部模型的快速迭代与升级。 - 背景经验：计算机或 AI 相关专业本科及以上，3 年以上 AI-Infra、后端架构或大模型核心应用落地经验，具备强烈的全栈技术驱动意识。
Agent 框架与应用开发：精通 LangChain、LlamaIndex、OpenClaw 等主流 Agent 框架或产品的底层源码与二次开发；深刻理解 Function Calling（工具调用）机制，具备复杂多智能体协同（Multi-Agent）的设计与实战经验。
开放生态与中间件：深入理解大模型网关（如 LiteLLM）机制；精通 Dify、n8n 等工作流引擎的底层逻辑。具备设计高扩展性 API 服务、Webhook 及复杂插件（Plugin/Tools）系统的全栈开发能力。
模型与基建底盘：深刻理解 Transformer 架构，熟悉主流微调（SFT / RLHF）；精通至少一种核心加速框架（vLLM / SGLang / Triton），具备 GPU 集群的高并发推理服务部署与调优实战经验。
RAG 全链路构建：熟悉向量数据库，具备海量数据下的 Embedding pipeline 设计、知识切片（Chunking）优化、多路召回与重排（Rerank）等 RAG 调优能力。

加分项： - 在头部 Crypto 交易所、大型互金或科技公司主导过企业级 AI-Infra 或 Agent 中台的 0-1 建设。 - 活跃的开源极客，曾向 vLLM、SGLang、LiteLLM、LangChain 或 Dify 等核心项目贡献过高质量 PR。 - 对开源模型（如 DeepSeek、Qwen）有丰富的微调与私有化落地经验。

资深AI大模型基建工程师

Skills

Description

Similar Jobs

P2P商家运营/负责人

数据产品经理

资深Java开发工程师 / 技术专家 (增长业务方向)

体验设计专家