一、项目介绍
1.项目简述
Netdata是一个开源、跨平台、又低资源运行的监控平台。Netdata每秒收集指标,并将它们呈现在漂亮的低延迟仪表板中。它旨在在所有物理和虚拟服务器、云部署、Kubernetes集群和边缘/IoT设备上运行,以监控您的系统、容器和应用程序。
2.项目功能
收集数据:操作系统指标、容器指标、虚拟机、硬件传感器、应用程序指标、OpenMetrics 导出器、StatsD 和日志。
所有数据都是每秒收集的,并在数据收集后立即显示在仪表板上。
为每个指标训练多个机器学习 (ML) 模型,并使用 AI 根据每个指标的过去行为检测异常。
全自动仪表板提供所有指标的可视化,让您一目了然地了解任何数据集,还可以直接在仪表板上对数据进行过滤、切片和切块,而无需学习查询语言。
带有数百个开箱即用的警报,用于检测常见问题和陷阱,揭示容易被忽视的问题。它支持多种通知方法,让您知道何时需要注意。
在各个方面都完全自动化:自动化仪表板、开箱即用的警报、指标的自动检测和自动发现、零接触机器学习、易于扩展和高可用性以及 CI/CD 友好。
扩展的Netdata是一个模块化平台,可以以所有可能的方式进行扩展,并且还可以与其他监控解决方案很好地集成。
3.项目开源地址
https://github.com/netdata/netdata
二、项目搭建环境
1. 项目测试环境
A.项目映射在华为云centos8.2,外网地址为124.71.67.131,实际搭建在我的minipc,通过内网穿透映射到华为云进行访问
Linux hcss-ecs-031b 4.18.0-348.7.1.el8_5.x86_64 #1 SMP Wed Dec 22 13:25:12 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
B.docker版本为26.1.3,docker-compose版本为26.1.3
注意:本次实践部署环境为个人的测试环境,若是生产环境请谨慎部署;对应开启了容器的端口,在linux下和防火墙下需开放对应端口。
2. 本次项目实施过程
使用docker下载镜像,创建好项目需要挂载的路径,通过docker compose启动容器,启动容器后查看容器启动状态,查看容器的运行日志是否正常,以上全部正常执行后体验项目功能。
3.注意:docker下载镜像有可能遇到比较慢的情况,参考以下解决措施:
A.docker配置换源,进入/etc/docker的路径,如果没有就创建这个目录
cd /etc/docker/
mkdir -p /etc/docker
B.编辑配置文件
vim daemon.json ##可以清空里面的内容:%d 然后复制下面的源进去wq保存
{
"registry-mirrors":[
"https://286u3d9d.mirror.aliyuncs.com"
]
}
C.registry-mirrors:指定了一个镜像仓库的 URL https://286u3d9d.mirror.aliyuncs.com。 这个配置项用于设置 Docker镜像的镜像仓库地址,使得在拉取和推送 Docker 镜像时能够通过该镜像仓库进行加速。这边提供的是广东广州服务器的镜源,建议个人自己去阿里云建一个个人账号,根据实际所在区获取镜源。
D.重新加载源,重启docker服务
sudo systemctl daemon-reload
sudo systemctl restart docker
三、项目搭建前巡检
1. 检查docker是否正常运行
systemctl status docker
or
service docker status
注:我个人测试环境是使用systemctl进行管理,若有使用service管理请使用第二条的命令进行查看。
[root@VM-8-12-centos ~]# systemctl status docker
● docker.service - Docker Application Container Engine
Loaded: loaded (/usr/lib/systemd/system/docker.service; enabled; vendor preset: disabled)
Active: active (running) since Mon 2024-04-22 23:13:57 CST; 4 days ago
Docs: https://docs.docker.com
Main PID: 17092 (dockerd)
Tasks: 158
Memory: 142.3M
CGroup: /system.slice/docker.service
若显示docker的Active是active (running),即表明docker是正常运行的。
2.一般我会使用docker-compose去管理,所以预先需要创建好yaml文件,vim docker-compose.yml,格式如下例子:
services:
nginx:
image: nginx
logging:
options:
max-size: 1g
restart: always
volumes:
- '/var/run/docker.sock:/tmp/docker.sock:ro'
ports:
- '80:80'
四、项目实施过程
1.根据开源项目,找到对应的镜像进行pull,若遇到很慢的情况,先检查是否网络问题以及是否已经换源。
docker pull netdata/netdata
[root@hcss-ecs-031b opt]# docker pull netdata/netdata
Using default tag: latest
latest: Pulling from netdata/netdata
59bf1c3509f3: Pull complete
757ead7370db: Pull complete
112f96308c19: Pull complete
9c9b30283f8a: Pull complete
64fdd10c9c5c: Pull complete
c508a519e196: Pull complete
d7542f38f888: Pull complete
Digest: sha256:ec2ae6b29437a6fee9e5c6b4c4c9c244eeaacac73a1517995d1ae59aeccff905
Status: Downloaded newer image for netdata/netdata:latest
docker.io/netdata/netdata:latest
2.若已经下载完成显示新的一行,可以输入命令查看是否上一条命令执行成功
echo$?
若返回0,则成功;返回其他则根据实际情况重新下载或者查找原因。
3.docker下载完后,可以查看对应的镜像是否下载成功
docker images |grep netdata
4.下载成功后,编辑docker-compose.yml文件
services:
netdata:
image: netdata/netdata
security_opt:
- apparmor=unconfined
cap_add:
- SYS_PTRACE
volumes:
- '/var/run/docker.sock:/var/run/docker.sock:ro'
- '/sys:/host/sys:ro'
- '/proc:/host/proc:ro'
ports:
- '19999:19999'
container_name: netdata
编辑后输入wq进行保存
5.启动docker-compose
docker compose up -d
6.启动容器后,查看容器的状态是否正常
docker ps |grep netdata
[root@hcss-ecs-031b opt]# docker ps |grep netdata
89e6580c8e28 netdata/netdata "/usr/sbin/run.sh" 14 minutes ago Up 14 minutes (healthy) 0.0.0.0:19999->19999/tcp, :::19999->19999/tcp netdata
7.启动容器后,查看容器的日志是否正常
docker logs -f netdata
[root@hcss-ecs-031b opt]# docker logs -f netdata
ls: /var/run/balena.sock: No such file or directory
Netdata detected docker.sock
Creating docker group 990
Assign netdata user to docker group 990
2024-06-28 07:23:48: netdata INFO : MAIN : CONFIG: cannot load cloud config '/var/lib/netdata/cloud.d/cloud.conf'. Running with internal defaults.
2024-06-28 07:23:48: netdata INFO : MAIN : Found 0 legacy dbengines, setting multidb diskspace to 256MB
2024-06-28 07:23:48: netdata INFO : MAIN : Created file '/var/lib/netdata/dbengine_multihost_size' to store the computed value
2024-06-28 07:23:48: netdata INFO : MAIN : Using host prefix directory '/host'
2024-06-28 07:23:48: netdata INFO : MAIN : TIMEZONE: using strftime(): 'UTC'
2024-06-28 07:23:48: netdata INFO : MAIN : TIMEZONE: fixed as 'UTC'
2024-06-28 07:23:48: netdata INFO : MAIN : SIGNAL: Enabling reaper
2024-06-28 07:23:48: netdata INFO : MAIN : process tracking enabled.
2024-06-28 07:23:48: netdata INFO : MAIN : resources control: allowed file descriptors: soft = 1048576, max = 1048576
2024-06-28 07:23:48: netdata INFO : MAIN : Adjusted my Out-Of-Memory (OOM) score from 0 to 1000.
2024-06-28 07:23:48: netdata ERROR : MAIN : Cannot adjust netdata scheduling policy to idle (5), with priority 0. Falling back to nice. (errno 38, Function not implemented)
2024-06-28 07:23:48: netdata ERROR : MAIN : Cannot get my current process scheduling policy. (errno 38, Function not implemented)
2024-06-28 07:23:48: netdata INFO : MAIN : netdata started on pid 1.
2024-06-28 07:23:48: netdata INFO : MAIN : Initializing spawn client.
2024-06-28 07:23:48: netdata INFO : MAIN : Executing /usr/libexec/netdata/plugins.d/system-info.sh
Spawn server is up.
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_NAME=Alpine Linux
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_ID=alpine
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_ID_LIKE=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_VERSION=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_VERSION_ID=3.15.0
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_OS_DETECTION=/etc/os-release
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_CONTAINER_IS_OFFICIAL_IMAGE=true
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_NAME=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_ID=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_ID_LIKE=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_VERSION=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_VERSION_ID=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_OS_DETECTION=unknown
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_HOST_IS_K8S_NODE=false
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_KERNEL_NAME=Linux
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_KERNEL_VERSION=4.18.0-348.7.1.el8_5.x86_64
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_ARCHITECTURE=x86_64
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_VIRTUALIZATION=hypervisor
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_VIRT_DETECTION=/proc/cpuinfo
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CONTAINER=docker
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CONTAINER_DETECTION=dockerenv
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CPU_LOGICAL_CPU_COUNT=2
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CPU_VENDOR=GenuineIntel
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CPU_MODEL=General Purpose Processor
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CPU_FREQ=0
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_CPU_DETECTION=lscpu
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_TOTAL_RAM=1904758784
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_RAM_DETECTION=procfs
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_TOTAL_DISK_SIZE=0
2024-06-28 07:23:48: netdata INFO : MAIN : NETDATA_SYSTEM_DISK_DETECTION=sysfs
2024-06-28 07:23:48: netdata INFO : MAIN : SQLite database /var/cache/netdata/netdata-meta.db initialization
2024-06-28 07:23:48: netdata INFO : MAIN : SQLite database initialization completed
2024-06-28 07:23:48: netdata INFO : MAIN : Cannot open the file /var/lib/netdata/health.silencers.json, so Netdata will work with the default health configuration.
五、项目体验
注:云服务器记得放开防火墙!
访问地址http://124.71.67.131:19999/,欢迎点击玩一下!
ps:内网穿透搭建好了,minipc可以撑一段时间,这些测试的服务应该会保留一段时间...如果有需要体验的但是服务已经被我down了的,可以在微信公众号《零氪的云原生》私我开启!