Envoy 基础教程：通过控制平面提供路由

Table of Contents

当微服务集群规模非常庞大时，控制平面包含了大量的 Envoy 配置项和基础设施状态，这时最好将数据平面与控制平面分离。控制平面最主要的功能包括自动重试和集成服务发现。

单独创建控制平面的最大优势之一是可以为路由配置提供统一的来源。传统架构的路由定义分散存储在 Web 服务器的配置文件、负载均衡器配置文件和特定应用程序的配置中（如 routes.rb），使用单独的控制平面可以集中所有的路由配置，使它们更易于更改和管理，同时也为应用的迁移和发布提供了更高的灵活性。

通过 RDS 提供路由
#

Envoy 的动态配置功能允许通过路由发现服务（RDS）的 API 来动态获取路由配置。控制平面通过 RDS 提供路由配置，将 域名+路径 映射到 Envoy 中的某个集群（cluster），而实际的流量控制由 Envoy 实例来完成。

这里是一个使用 RDS 来动态获取路由的示例：

version_info: "0"
resources:
- "@type": type.googleapis.com/envoy.api.v2.RouteConfiguration
  name: local_route
  virtual_hosts:
  - name: local_service
    domains: ["*"]
    routes:
    - match: { prefix: "/" }
      route: { cluster: some_service }

开源项目 go-control-plane， Istio Pilot 和商业项目 Houston 都提供了 RDS 的 API，Envoy 官方文档也定义了一个完整的 RDS 规范。RDS 规范只是一种流量传输机制，如何对路由进行管理还是要取决于你。

路由定义的最佳实践
#

当你的系统中有数千个 Envoy 实例时，应该选择控制平面来作为所有路由的统一来源。客户端请求可以直接来自用户、内部服务或者来自不同的云区域，因此最好使用 Envoy 来处理这些不同的网络拓扑（例如，作为客户流量的前端代理以及内部流量的服务网格），虽然流量来自不同的方向，但它们的行为都是相似的。

为了扩展单个系统的路由定义，通常需要遵循以下三个关键原则：

将路由视为数据，而不是配置
将控制权分配给具有 ACL 权限的团队
使用审计日志和回滚操作来管理路由的更改

将路由视为数据
#

将路由视为一组相互关联的服务的数据可以防止发生冲突，同时确保了其语义的正确性。虽然像 Istio 这样的工具可以很容易地编写基于 YAML 配置文件的路由，但是在数千行 YAML 文件中管理数百条路由很难保证每个定义都是有效的路由。或许你也想过使用版本控制来管理这些配置文件，但如果合并分支时发生致命错误将会导致灾难性的后果（如路由丢失或通过 API 重写）。

实际上，从静态配置文件转移到动态配置文件是在大规模集群中使用 Envoy 的第一步。为了能够将 Envoy 投入生产，建议至少使用像 go-control-plane 这样实现了 xDS 的控制平面统一提供路由配置。通过将路由的来源转移到 RDS API 背后，可以实现路由的并发更新，同时也可以防止对路由进行无意义的更新。