LBank
- 极致推理与底层加速: 负责开源大模型(LLM/VLM)的私有化部署。主导基于 VLLM、SGLang、Triton 等框架的底层稳定性与性能调优。 - Agent 编排与开放平台构建: 打造高弹性、低门槛的 Agent 编排中台,并向内外部提供标准化的开放能力。设计高扩展性的 API/SDK 矩阵与插件(Plugin)系统,支持业务流的无缝接入。 - 统一网关与路由中枢: 搭建企业级异构模型 API 路由层,实现多供应商平滑接入、智能负载均衡、成本管控及全链路可观测性。 - 核心框架与全栈攻坚: 深度定制并扩展 LangChain、OpenClaw 等前沿框架或产品,突破多智能体协同、长上下文处理、高频复杂 Function Calling 及 RAG pipeline等瓶颈。具备前后端全栈视野,打通底层模型到前端交付的数据流。 - 端到端业务闭环: 紧贴真实业务场景,通过上下文工程、检索增强优化及模型选型评估等维度支持业务打通从 PoC 到生产全量上线、甚至系统集成的最后一公里。 - 前沿追踪与评测体系: 建立科学的线上/线下评估基准(Benchmark / A/B Test);紧跟底层算法演进,指导内部模型的快速迭代与升级。 - 背景经验: 计算机或 AI 相关专业本科及以上,3 年以上 AI-Infra、后端架构或大模型核心应用落地经验,具备强烈的全栈技术驱动意识。 - Agent 框架与应用开发: 精通 LangChain、LlamaIndex、OpenClaw 等主流 Agent 框架或产品的底层源码与二次开发;深刻理解 Function Calling(工具调用)机制,具备复杂多智能体协同(Multi-Agent)的设计与实战经验。 - 开放生态与中间件: 深入理解大模型网关(如 LiteLLM)机制;精通 Dify、n8n 等工作流引擎的底层逻辑。具备设计高扩展性 API 服务、Webhook 及复杂插件(Plugin/Tools)系统的全栈开发能力。 - 模型与基建底盘: 深刻理解 Transformer 架构,熟悉主流微调(SFT / RLHF);精通至少一种核心加速框架(vLLM / SGLang / Triton),具备 GPU 集群的高并发推理服务部署与调优实战经验。 - RAG 全链路构建: 熟悉向量数据库,具备海量数据下的 Embedding pipeline 设计、知识切片(Chunking)优化、多路召回与重排(Rerank)等 RAG 调优能力。 加分项: - 在头部 Crypto 交易所、大型互金或科技公司主导过企业级 AI-Infra 或 Agent 中台的 0-1 建设。 - 活跃的开源极客,曾向 vLLM、SGLang、LiteLLM、LangChain 或 Dify 等核心项目贡献过高质量 PR。 - 对开源模型(如 DeepSeek、Qwen)有丰富的微调与私有化落地经验。