研究方向
凭借扎实的算法功底(NOI 2012 金牌、Codeforces Grandmaster),研究工作涵盖 LLM 系统的全栈领域,从推理优化到智能运维。
AI Infra Architect · Huawei Top Minds
清华大学计算机博士,华为天才少年,openFuyao 社区架构师。研究聚焦于大语言模型系统与智能运维(AIOps),致力于构建高效、可靠、智能的大规模 AI 系统基础设施。
凭借扎实的算法功底(NOI 2012 金牌、Codeforces Grandmaster),研究工作涵盖 LLM 系统的全栈领域,从推理优化到智能运维。
攻克 PD 分离架构、分布式 KVCache 传输、AscendCacheTier 等关键技术,实现 DeepSeek 等主流大模型在昇腾 910B 上的云原生高效部署。与 Mooncake 社区合作,实现 store 接口 60%-80% 性能提升。
面向万卡以上 GPU/NPU 集群的 LLM 驱动智能故障诊断系统。部署于科大讯飞 X1 集群,达成 87.5% 整体诊断准确率,将诊断时间从天级缩短至分钟级。华为全联接大会 2025 联合发布。
业界首个免人工标注的运维领域日志分析大模型。在 200+ 服务上实现 80%+ 异常日志识别准确率,将问题诊断时间从小时级缩短至分钟级。
自动驾驶网络运维平台核心算法。降低 90% 误报率,实现分钟级故障发现(原为天级)。因此获得华为杰出工程师。
基于 RDMA 的高速 KVCache 传输,解决 LLM 服务中的内存带宽瓶颈,实现高效 KVCache 共享,减少多轮对话和长上下文场景中的冗余计算。已申请 4 项专利。
…… 另有 9+ 篇论文,详见 Google Scholar
Mooncake(kvcache-ai/Mooncake)— 分布式 KVCache 存储引擎