k8s 事件告警

原创

大林123 2024-03-11 12:45:07 ©著作权

©著作权归作者所有：来自51CTO博客作者大林123的原创作品，请联系作者获取转载授权，否则将追究法律责任

K8S事件告警是Kubernetes集群中非常重要的一环，它可以帮助我们及时了解集群中发生的变化和异常情况，以便及时做出响应和处理。在这篇文章中，我将会为你介绍如何实现K8S事件告警，并通过代码示例来演示。

首先，我们来看一下实现K8S事件告警的整体流程：

| 步骤 | 描述 |
|------|-----------------------------------------------------------|
| 1 | 创建用于监控事件的Namespace和ServiceAccount |
| 2 | 给ServiceAccount授权获取事件的权限 |
| 3 | 部署Event Exporter用于收集K8S事件 |
| 4 | 部署Prometheus和Grafana用于告警展示和通知 |
| 5 | 设置Prometheus的告警规则，配置Grafana的告警通知方式 |

接下来，让我们逐步来实现这些步骤：

### 步骤1：创建用于监控事件的Namespace和ServiceAccount

```yaml
apiVersion: v1
kind: Namespace
metadata:
name: event-monitor

---
apiVersion: v1
kind: ServiceAccount
metadata:
namespace: event-monitor
name: event-exporter-sa
```

### 步骤2：给ServiceAccount授权获取事件的权限

```yaml
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
name: event-reader
rules:
- apiGroups: [""]
resources: ["events"]
verbs: ["get", "watch", "list"]

---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: event-exporter-crb
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: event-reader
subjects:
- kind: ServiceAccount
name: event-exporter-sa
namespace: event-monitor
```

### 步骤3：部署Event Exporter用于收集K8S事件

可以使用Prometheus自带的kube-state-metrics来收集事件数据，并暴露给Prometheus。

### 步骤4：部署Prometheus和Grafana

可以使用Helm来部署Prometheus和Grafana，下面是Helm命令：

```shell
helm install stable/prometheus
helm install stable/grafana
```

### 步骤5：设置Prometheus的告警规则，配置Grafana的告警通知方式

可以通过在Prometheus的配置文件中设置告警规则，例如：

```yaml
groups:
- name: example
rules:
- alert: HighPagingUsage
expr: sum(kubelet_pleg_stat_started_containers_total) by (namespace) / sum(node_namespace_pod_container:kube_pod_container_resource_requests{resource="memory"}) by (namespace) > 0.1
for: 5m
labels:
severity: high
annotations:
summary: High paging usage
```

通过配置Prometheus告警规则，我们可以在Grafana中添加相应的告警通知渠道，例如邮件、Slack等。

通过以上步骤，我们就成功搭建了K8S事件告警系统，并且能够及时监控集群中事件的变化和异常情况，并做出相应的处理。希望这篇文章对你有所帮助！