TrueFoundry × Seldon 技术整合:Kubernetes 上的 LLM Gateway + ML 推理双栈

2026-06-25 01:00:00

整合技术架构

分层设计

┌─────────────────────────────────┐
│   TrueFoundry AI Gateway        │  ← 路由、鉴权、PII、限流
├─────────────────────────────────┤
│   Seldon Core 模型服务           │  ← ML 实时推理
├─────────────────────────────────┤
│   Kubernetes 集群(客户已有)     │
└─────────────────────────────────┘

Gateway 能力

  • 日处理 >1 万亿 Token
  • 多模型 负载均衡Failover
  • Agent 工具调用 审计与策略

Seldon Core

  • 2014 起服务金融/医疗 低延迟推理
  • 严格数据治理模型版本管理
  • 与 Gateway 共享 K8s 运维体系

Agentic 扩展

  • 同一平台编排 LLM + 工具 + 传统 ML
  • 避免 MLOps 与 Agent 平台分裂

部署优势

客户 无需迁移 既有 K8s 投资,leapfrog 到 Agent 时代。