容器云服务

帮助中心 / 容器与中间件 / 容器云服务 / 快速入门 / 微服务治理 /

微服务治理

更新时间: 2022-12-09 18:02:00

1. 微服务治理平台概览

2. 服务全局可视化

支持可视化查看服务之间的调用关系、流量信息、调用链信息。

平台提供统一的微服务管理视角,用户通过可视化表单对服务进行负载均衡、连接池管理、服务熔断、服务安全等服务治理策略的配置。

满足企业用户随时掌握微服务治理全局的需求,有效降低Istio实践的门槛。

(1) 服务拓扑

服务拓扑图展示命名空间中微服务的调用关系,可从全局聚焦到局部,直至定位查看某服务的详细信息,如服务状态、请求情况、流量信息等。

(2) 调用链追踪

开发人员和运维人员可通过调用链功能对服务间的调用进行下钻分析。

● 支持气泡图展示,以便用户快速定位调用性能较低的链路;

● 支持全链路跟踪;

● 支持通过TraceID快速定位调用支持;

● 支持指定TraceID的链路信息查询。

(3) 微服务列表

支持列表展示不同治理框架的微服务。

(4) 服务路由

所有访问微服务的流量均可以进行服务路由管理。

服务路由支持多组条件规则对流量进行权重分配,条件规则支持uri、scheme、method、headers、port、sourceLabels与多种匹配方式。

(5) 微服务网关

支持为服务网格配置多个入口或出口网关,每个网关允许通过多个端口访问。其中,入口网关支持通过不同的路由场景将外部流量路由到不同的后端资源(API分组、微服务);出口网关可实现网格内服务对外部服务的访问管理及流量监控。可满足业务区域之间网络隔离、业务独占网关、端口隔离等丰富的使用场景。不再需要的网关,可轻松无损下线。

除此之外,可基于网关的黑白名单和JWT对发起请求的客户端进行身份认证与鉴权,并根据请求路径、请求Header、URI重写等多样化的方式配置路由规则;支持实例级别的网关监控,配合多种内置告警策略,可帮助用户及时发现、解决问题。监控数据涵盖了CPU、内存、QPS、连接数、传入流量、传出流量等指标。

(6) 原生资源列表

方便平台高阶用户查看Istio原生资源(资源YAML信息),可按资源类型分类查看。

3. 服务发布管理

基于动态流量策略,实现服务在多版本间的自动化灰度发布。

● 金丝雀发布

创建灰度发布时,对服务的流量进行简单的发布规则配置。发布时,将全程按照发布规则自动化执行发布、流量观测、流量异常回滚。

4. 服务连接可靠性治理

多个微服务之间通过HTTP/HTTP2、gRPC等方式远程完成数据交互。在调用链路中,当某个微服务响应时间过长或者服务不可用时,对前序微服务的调用就会占用越来越多的资源,进而引起系统崩溃的“雪崩效应”。

为了避免这种状况,需要对微服务之间的调用制定保护机制和故障模拟,从而保证服务连接的可靠性,提升微服务系统整体的稳定性。

● 流量策略

负载均衡:调用微服务时,根据指定的负载均衡策略自动在服务实例之间进行流量分配。

熔断策略:对服务实例进行异常检测,无感化处理异常服务,自动隔离异常实例,减少对下游服务的影响。

连接池设置:通过连接池设置,可防止流量太大时导致系统崩溃。连接池中的参数设置作用于客户端的单个实例上。

l 路由规则策略

微服务治理平台提供了在运行时动态配置的故障恢复和故障注入功能,支持错误注入、延迟返回、超时重试、请求重写、流量复制。通过使用这些功能可以辅助服务可靠地运行,防止局部故障级联到其它服务。

5. 服务网格全生命周期管理

在多集群环境中,服务网格的管理变得尤为复杂。服务网格的全生命周期中不仅涉及到服务网格的部署、更新、删除,更重要的是对服务网格的监控和健康状态的查看,使运维人员能够及时发现异常,排查故障,从而保证服务网格对业务的支撑是连贯、稳定的。

6. 组件管理

管理员可根据实际业务规模自定义网格组件的资源配置和扩缩容模式(手动、弹性)。

7. 服务错误排查

当用户的服务发生故障时,通过对异常流量的追踪,可定位到故障引起的位置,从而缩小排查范围,分析具体原因。基于此,平台搭建了完整的服务问题排查路径,帮助客户基于异常流量迅速定位可疑位置,保障问题的快速解决。

● 流量监控和JVM监控

提供客户端、服务端服务的多维度(服务、API)的流量监控数据面板,监控颗粒度可以细化到API级别。

● 告警

提供基于常用监控指标的告警功能,支持指标采集、策略管理、告警触发和告警处理等功能,配合流量监控和JVM监控,旨在提供完整的“监控-告警”智能运维体验。

提供告警策略配置模版,支持配置单条告警策略或通过模版快速创建告警策略。

支持通过“实时告警”面板总览正在告警的资源信息,可按照告警级别筛选数据,支持查看告警详情,帮助用户掌握问题影响范围并快速定位问题根因。

● 快速排障

平台对服务拓扑、流量监控、调用链、服务日志在产品功能上提供了完整的排查路径,基于异常流量帮助用户快速定位服务故障。

8. 服务安全性治理

微服务场景下,服务之间的调用由本地调用改为网络协议接口调用,随之也带来了安全方面的风险,平台提供服务间流量加密功能。

通过服务的流量策略可以设置安全规则,为流量进行mTLS加密处理。

9. 微服务容灾

多地多数据中心场景下,当某个数据中心的微服务实例发生故障被熔断隔离时,为保证服务端稳定提供服务,平台将自动将客户端的流量分发给其他数据中心的计算组件。

● 就近路由

所有数据中心的服务调用将默认使用就近路由。当调用链路节点较长时,可以有效保障容灾流量优先被同集群的服务端处理。

● 自定义容灾优先级

可通过配置地域负载,根据集群所在地域自定义容灾流量在多集群之间的容灾负载优先级。