LBank
资深质效平台开发工程师
Tec R&D Dept21h ago
1:主导公司级可观测平台(监控、告警、日志、APM)全栈设计、技术选型与落地,基于开源组件或云服务构建统一可观测体系,支撑高并发、高可用场景。 2:设计监控指标体系,优化告警策略,搭建集中式日志与APM全链路追踪平台,实现可观测数据联动分析,支撑故障快速定位。 3:制定可观测技术规范,开展团队赋能,跟踪前沿技术并预研落地,推进可观测体系迭代优化。 4:跨团队协作,解决可观测相关复杂技术问题,参与故障复盘,保障系统稳定性。 1:本科及以上学历,计算机相关专业,6年+可观测领域工作经验,大厂或头部加密货币交易所相关经验优先。 2:精通可观测核心概念,熟练掌握主流开源可观测组件(Prometheus、ELK、Jaeger等),熟悉至少一种云服务可观测体系。 3:具备分布式系统、微服务基础,熟练使用Go/Java/Python之一,有可观测平台二次开发或插件开发能力。 4:具备大规模可观测平台运维、调优及复杂问题排查能力。
有使用AI实现智能监控、异常检测、告警降噪、故障根因分析、容量预测等场景的实战经验。 了解大模型基本原理,可基于开源LLM设计可观测相关智能工具(如智能诊断、日志分析助手)。 能将AI能力与可观测场景结合,输出可落地的智能化优化方案。
LBank
LBank
LBank