一、项目介绍

1.项目简述
Netdata是一个开源、跨平台、又低资源运行的监控平台。Netdata每秒收集指标,并将它们呈现在漂亮的低延迟仪表板中。它旨在在所有物理和虚拟服务器、云部署、Kubernetes集群和边缘/IoT设备上运行,以监控您的系统、容器和应用程序。

2.项目功能
收集数据:操作系统指标、容器指标、虚拟机、硬件传感器、应用程序指标、OpenMetrics 导出器、StatsD 和日志。

所有数据都是每秒收集的,并在数据收集后立即显示在仪表板上。

为每个指标训练多个机器学习 (ML) 模型,并使用 AI 根据每个指标的过去行为检测异常。

全自动仪表板提供所有指标的可视化,让您一目了然地了解任何数据集,还可以直接在仪表板上对数据进行过滤、切片和切块,而无需学习查询语言。

带有数百个开箱即用的警报,用于检测常见问题和陷阱,揭示容易被忽视的问题。它支持多种通知方法,让您知道何时需要注意。

在各个方面都完全自动化:自动化仪表板、开箱即用的警报、指标的自动检测和自动发现、零接触机器学习、易于扩展和高可用性以及 CI/CD 友好。

扩展的Netdata是一个模块化平台,可以以所有可能的方式进行扩展,并且还可以与其他监控解决方案很好地集成。

3.项目开源地址
https://github.com/netdata/netdata

二、项目搭建环境

1. 项目测试环境

A.项目映射在华为云centos8.2,外网地址为124.71.67.131,实际搭建在我的minipc,通过内网穿透映射到华为云进行访问
Linux hcss-ecs-031b 4.18.0-348.7.1.el8_5.x86_64 #1 SMP Wed Dec 22 13:25:12 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

B.docker版本为26.1.3,docker-compose版本为26.1.3
注意:本次实践部署环境为个人的测试环境,若是生产环境请谨慎部署;对应开启了容器的端口,在linux下和防火墙下需开放对应端口。

2. 本次项目实施过程

使用docker下载镜像,创建好项目需要挂载的路径,通过docker compose启动容器,启动容器后查看容器启动状态,查看容器的运行日志是否正常,以上全部正常执行后体验项目功能。

3.注意:docker下载镜像有可能遇到比较慢的情况,参考以下解决措施:

A.docker配置换源,进入/etc/docker的路径,如果没有就创建这个目录
cd /etc/docker/
mkdir -p /etc/docker

B.编辑配置文件
vim daemon.json   ##可以清空里面的内容:%d 然后复制下面的源进去wq保存

{
    "registry-mirrors":[
        "https://286u3d9d.mirror.aliyuncs.com"
    ]
}

C.registry-mirrors:指定了一个镜像仓库的 URL https://286u3d9d.mirror.aliyuncs.com。 这个配置项用于设置 Docker镜像的镜像仓库地址,使得在拉取和推送 Docker 镜像时能够通过该镜像仓库进行加速。这边提供的是广东广州服务器的镜源,建议个人自己去阿里云建一个个人账号,根据实际所在区获取镜源。

D.重新加载源,重启docker服务
sudo systemctl daemon-reload 
sudo systemctl restart docker

三、项目搭建前巡检

1. 检查docker是否正常运行
systemctl status docker
or
service docker status
注:我个人测试环境是使用systemctl进行管理,若有使用service管理请使用第二条的命令进行查看。   

[root@VM-8-12-centos ~]# systemctl status docker
● docker.service - Docker Application Container Engine
   Loaded: loaded (/usr/lib/systemd/system/docker.service; enabled; vendor preset: disabled)
   Active: active (running) since Mon 2024-04-22 23:13:57 CST; 4 days ago
     Docs: https://docs.docker.com
 Main PID: 17092 (dockerd)
    Tasks: 158
   Memory: 142.3M
   CGroup: /system.slice/docker.service

若显示docker的Active是active (running),即表明docker是正常运行的。

2.一般我会使用docker-compose去管理,所以预先需要创建好yaml文件,vim docker-compose.yml,格式如下例子:

services:
    nginx:
        image: nginx
        logging:
            options:
                max-size: 1g
        restart: always
        volumes:
            - '/var/run/docker.sock:/tmp/docker.sock:ro'
        ports:
            - '80:80'

四、项目实施过程

1.根据开源项目,找到对应的镜像进行pull,若遇到很慢的情况,先检查是否网络问题以及是否已经换源。
docker pull netdata/netdata

[root@hcss-ecs-031b opt]# docker pull netdata/netdata
Using default tag: latest
latest: Pulling from netdata/netdata
59bf1c3509f3: Pull complete 
757ead7370db: Pull complete 
112f96308c19: Pull complete 
9c9b30283f8a: Pull complete 
64fdd10c9c5c: Pull complete 
c508a519e196: Pull complete 
d7542f38f888: Pull complete 
Digest: sha256:ec2ae6b29437a6fee9e5c6b4c4c9c244eeaacac73a1517995d1ae59aeccff905
Status: Downloaded newer image for netdata/netdata:latest
docker.io/netdata/netdata:latest

2.若已经下载完成显示新的一行,可以输入命令查看是否上一条命令执行成功
echo$?
若返回0,则成功;返回其他则根据实际情况重新下载或者查找原因。

3.docker下载完后,可以查看对应的镜像是否下载成功
docker images |grep netdata
 
4.下载成功后,编辑docker-compose.yml文件

services:
    netdata:
        image: netdata/netdata
        security_opt:
            - apparmor=unconfined
        cap_add:
            - SYS_PTRACE
        volumes:
            - '/var/run/docker.sock:/var/run/docker.sock:ro'
            - '/sys:/host/sys:ro'
            - '/proc:/host/proc:ro'
        ports:
            - '19999:19999'
        container_name: netdata


编辑后输入wq进行保存

5.启动docker-compose

docker compose up -d  

6.启动容器后,查看容器的状态是否正常  

docker ps |grep netdata
    
[root@hcss-ecs-031b opt]# docker ps |grep netdata
89e6580c8e28   netdata/netdata   "/usr/sbin/run.sh"       14 minutes ago   Up 14 minutes (healthy)   0.0.0.0:19999->19999/tcp, :::19999->19999/tcp   netdata

7.启动容器后,查看容器的日志是否正常

docker logs -f netdata

[root@hcss-ecs-031b opt]# docker logs -f netdata
ls: /var/run/balena.sock: No such file or directory
Netdata detected docker.sock
Creating docker group 990
Assign netdata user to docker group 990
2024-06-28 07:23:48: netdata INFO  : MAIN : CONFIG: cannot load cloud config '/var/lib/netdata/cloud.d/cloud.conf'. Running with internal defaults.
2024-06-28 07:23:48: netdata INFO  : MAIN : Found 0 legacy dbengines, setting multidb diskspace to 256MB
2024-06-28 07:23:48: netdata INFO  : MAIN : Created file '/var/lib/netdata/dbengine_multihost_size' to store the computed value
2024-06-28 07:23:48: netdata INFO  : MAIN : Using host prefix directory '/host'
2024-06-28 07:23:48: netdata INFO  : MAIN : TIMEZONE: using strftime(): 'UTC'
2024-06-28 07:23:48: netdata INFO  : MAIN : TIMEZONE: fixed as 'UTC'
2024-06-28 07:23:48: netdata INFO  : MAIN : SIGNAL: Enabling reaper
2024-06-28 07:23:48: netdata INFO  : MAIN : process tracking enabled.
2024-06-28 07:23:48: netdata INFO  : MAIN : resources control: allowed file descriptors: soft = 1048576, max = 1048576
2024-06-28 07:23:48: netdata INFO  : MAIN : Adjusted my Out-Of-Memory (OOM) score from 0 to 1000.
2024-06-28 07:23:48: netdata ERROR : MAIN : Cannot adjust netdata scheduling policy to idle (5), with priority 0. Falling back to nice. (errno 38, Function not implemented)
2024-06-28 07:23:48: netdata ERROR : MAIN : Cannot get my current process scheduling policy. (errno 38, Function not implemented)
2024-06-28 07:23:48: netdata INFO  : MAIN : netdata started on pid 1.
2024-06-28 07:23:48: netdata INFO  : MAIN : Initializing spawn client.
2024-06-28 07:23:48: netdata INFO  : MAIN : Executing /usr/libexec/netdata/plugins.d/system-info.sh
Spawn server is up.
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_NAME=Alpine Linux
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_ID=alpine
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_ID_LIKE=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_VERSION=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_VERSION_ID=3.15.0
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_OS_DETECTION=/etc/os-release
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_CONTAINER_IS_OFFICIAL_IMAGE=true
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_NAME=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_ID=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_ID_LIKE=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_VERSION=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_VERSION_ID=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_OS_DETECTION=unknown
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_HOST_IS_K8S_NODE=false
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_KERNEL_NAME=Linux
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_KERNEL_VERSION=4.18.0-348.7.1.el8_5.x86_64
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_ARCHITECTURE=x86_64
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_VIRTUALIZATION=hypervisor
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_VIRT_DETECTION=/proc/cpuinfo
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CONTAINER=docker
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CONTAINER_DETECTION=dockerenv
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CPU_LOGICAL_CPU_COUNT=2
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CPU_VENDOR=GenuineIntel
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CPU_MODEL=General Purpose Processor
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CPU_FREQ=0
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_CPU_DETECTION=lscpu
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_TOTAL_RAM=1904758784
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_RAM_DETECTION=procfs
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_TOTAL_DISK_SIZE=0
2024-06-28 07:23:48: netdata INFO  : MAIN : NETDATA_SYSTEM_DISK_DETECTION=sysfs
2024-06-28 07:23:48: netdata INFO  : MAIN : SQLite database /var/cache/netdata/netdata-meta.db initialization
2024-06-28 07:23:48: netdata INFO  : MAIN : SQLite database initialization completed
2024-06-28 07:23:48: netdata INFO  : MAIN : Cannot open the file /var/lib/netdata/health.silencers.json, so Netdata will work with the default health configuration.

五、项目体验

注:云服务器记得放开防火墙!
访问地址http://124.71.67.131:19999/,欢迎点击玩一下!
ps:内网穿透搭建好了,minipc可以撑一段时间,这些测试的服务应该会保留一段时间...如果有需要体验的但是服务已经被我down了的,可以在微信公众号《零氪的云原生》私我开启!

【打工日常】docker部署一个开源、跨平台、又低资源运行的监控平台_Docker

【打工日常】docker部署一个开源、跨平台、又低资源运行的监控平台_Docker_02

【打工日常】docker部署一个开源、跨平台、又低资源运行的监控平台_Docker_03

【打工日常】docker部署一个开源、跨平台、又低资源运行的监控平台_css_04