Agent 认知流设计与攻坚: 紧贴核心业务场景,通过ReAct、PE等范式提升模型在长周期、多步骤复杂任务中的任务拆解、状态追踪及自我纠错(Self-Reflection)能力。 动态记忆网络构建与上下文管理: 设计并落地高可用的智能体长短期记忆架构(Short/Long-term Memory)。结合向量检索与图谱架构,研发记忆流(Memory Stream)管理、关键实体提取与记忆自我更新(Memory Pruning/Condensing)机制,确保跨 Session 和长周期任务中的状态保持与高保真召回。 基座模型微调与能力对齐: 针对垂直领域场景,主导开源大模型的 SFT 与 RL 微调,提升模型在特定领域的指令遵循、高频复杂 Function Calling 准确率及行文风格遵循能力。 高阶 RAG 架构调优: 构建面向海量数据的检索增强生成全链路。深度优化 Embedding 策略与动态 Knowledge Chunking,主导多路召回、Query 扩展与 RRF(Reciprocal Rank Fusion)重排算法的工业级落地,极致提升问答效果。 多智能体协同与框架定制: 深度掌握并扩展 LangChain、LangGraph、Hermes 等前沿 Agent 框架。设计 Multi-Agent 交互协议与分布式协同机制,打通从调度中枢到各领域专家 Agent 的工作流。 评测基准与自进化闭环构建: 建立针对 Agent 核心能力的科学评估体系(Benchmark / A/B Test)。构建数据飞轮,通过线上 Bad Case 挖掘与自动化反馈机制,推动 Agent 算法的持续迭代与自进化。 背景经验: 计算机、数学、物理或 AI 相关专业本科及以上学历,3年以上算法或大模型核心应用落地经验,具备“算法+工程”双线作战能力。 大模型与底层功底: 深刻理解 Transformer 底层架构及演进路线,具备独立完成高质量数据集构建与模型训练评估的实战经验。 Agent 理论与实战: 熟悉开源 Agent 框架,具备多智能体系统从 0 到 1 的架构经验。深入理解 Agent 记忆范式(分层记忆、总结记忆等),有 Mem0等记忆框架研究或自研状态管理组件落地经验者优先。 工程与基建底盘: 具备扎实的 Python/Java 编程功底,熟练使用 PyTorch,熟悉主流推理加速框架(如 vLLM、SGLang)的原理,能够配合基建团队进行模型的高并发部署与性能调优。 RAG 落地能力: 熟悉各类向量数据库选型,在企业级知识库构建、混合检索、多模态文档解析方面有扎实的业务落地经验。 加分项: 在头部 Crypto 交易所、大型互金或科技公司主导过企业级 Agent 中台或复杂自动化算法底座的建设。 活跃的开源极客,曾向大模型算法库、推理框架或Langchain/Langgraph/OpenClaw/Hermes 等核心项目贡献过高质量代码。 具备全栈开发能力,能够打通“底层模型训练 - 算法策略封装 - 前端交互 API”的完整链路。
LBank