本文讲述如何完美地将prometheus监控的告警消息通过alertmanager发送到企业微信、飞书、钉钉当前主流的通讯软件。
相信很多公司都在使用云服务器,不知道大家有没有注意到,当你购买了一台云服务器以后,在操作系统里面通过 free 命令查看服务器的内存,容量总是会小于在云厂商控制台上面看到的内存容量。 为什么会这样呢,那就带着疑问往下看。 现象描述 购买了2台云服务,控制台上面显示的内存是4GiB(4096MiB) 登陆到操作系统里面查看内存大小,通过 free -m 命令发现机器的tot
由《羊了个羊》为话题切入点,结合自己的面试经历,详细讲解了高并发架构设计的演进过程!涉及到应用服务、数据库服务、缓存服务、负载均衡、ddos高防、WAF应用防火墙等多个知识点。
前言我们使用的各种软件,运行都离不开操作系统。大家都知道操作系统主要有Windows和Linux,如何查看当前操作系统的具体版本,你知道哪些方式呢? 1.WindowsWindows系统大家都很熟悉,可以用图形界面直接查看。除了用鼠标点点点的方式,也可以用命令行查看。打开cmd窗口,执行:bash方式一:winver方式二:systeminfo 2.CentOSCentOS直接
1、/etc/security/limits.conf是linux资源使用配置文件,用来限制用户对系统资源的使用。limits.conf文件实际是linux PAM(插入式认证模块,Pluggable Authentication Modules)中pam_limits.so的配置文件,而且只针对于单个会话。 2、/etc/security/limits.d/文件夹下定义的文件内容和limits.conf格式一样,但优先级更高,系统默认该目录下面是没有root.conf文件的。所以排错过程中,只修改了limit.conf仍然无法登录。 3、fs.file-max是系统级别的能够打开的文件句柄的数量,是对整个系统的限制,所有进程打开的文件描述符数不能超过该文件的值。系统内可以通过/proc/sys/fs/file-max查看。
前言 Promethues是目前一个比较流行的开源监控项目,被使用也越来越多。我们都知道Prometheus是通过时序数据库来保存数据的,那么Prometheus采集到数据后,是如何保存在自已的时序数据库中的呢?通常我们看到Prometheus的数据指标都类似这样:node_cpu_seconds_total{cpu="0",instance="10.
前言 prometheus是现在一个比较主流的监控软件,随着容器的普及,prometheus的应用越来越广泛,前面我也有专门讲到prometheus的相关文章。但是跟传统老牌的zabbix监控不一样,prometheus的webUI是没有登录认证的,有时候显得没有安全性,本文就主要讲解一下如何为prometheus添加一个登录认证界面。
最近在对接对象存储,为了确保上传到对象存储的文件没有被损坏,所以需要计算文件的md5值,以确保文件的完整性。现分享下目前工作中用到的各语言的md5的计算方式:linux shellmd5sum ./cheshi.txtwindows cmdcertutil.exe -hashfile .\ceshi.txt MD5pythonimport hashlibif __name__ == "__main
国庆节之前,生产服务器上面的一些文件被异常删除,费了九牛二虎之力才找到删除原因,今天终于抽空在这里总结记录下事情的前因后果。文件异常删除9月27日突然接到leader的反馈,说业务团队没有收到当天的业务收据,让我检查对应的服务程序是不是异常。于是开始登录对应服务器,开始检查每日数据发送的脚本。结果一查看,服务器下面的/mnt下面的文件全部被删了,难怪说收不到当前的数据了。好在有备份的脚本,首先将备
1.前言深度学习、图像渲染、科学计算、挖矿这些复杂计算的场景都需要使用GPU进行大量计算,但是当你拿到一台GPU服务器以后,你应该如何入手学习呢,如何进行调试呢。本文主要讲解一些GPU相关的知识,从GPU简单介绍开始,进而到linux下如何查看GPU相关指标,最后讲解如何调试调用GPU,并使用GPU运行简单程序。注:本文讲解使用的GPU是NVIDIAGPU。2.GPU知识介绍2.1GPU简单介绍G
1.前言 之前文章安装kubernetes集群,都是使用kubeadm安装,然鹅很多公司也采用二进制方式搭建集群。这篇文章主要讲解,如何采用二进制包来搭建完整的高可用集群。相比使用kubeadm搭建,二进制搭建要繁琐很多,需要自己配置签名证书,每个组件都需要一步步配置安装。 本文以2021年1月14日官方更新的最新版v1.20.2来介绍。2.环境准备2.1机器规划IP地址机
1SSL/TLS基本概念 SSL:SecureSocketLayer(安全套接层协议)的缩写,可以在Internet上提供秘密性传输。它是在上世纪90年代中期,由Netscape公司设计,目前已有3.0版本。为啥要发明SSL这个协议呢?因为原先互联网上使用的HTTP协议是明文的,内容是不加密的,这样就很可能在内容传播的时候被别人监听到,对于安全性要求较高的场合,必须要加密,
前言监控是每个公司必不可少的部门,通过监控我们能实时的观察设备的运行状态,保证业务稳定运行。当业务出现问题时,监控及时给各负责人发送告警,从而我们能够快速定位问题,及时止损。所以监控就像是眼睛一样,帮我们时刻盯着各个设备的工作情况。目前市面上有很多的监控软件,比如老牌的nagios、cacti、zabbix,新兴的prometheus、open-falcon、夜莺等,收费的监控宝、solarwin
1前言管理kubernentes集群时,总是需要登陆机器命令行查看,难免有时候显得繁琐。那么有没有一种可视化的更方便管理kubernente的工具呢,这样更方便的全局查看整个集群的各种资源。目前用的比较多的是KubernetesDashBoard和Rancher,其中Kubernentes-DashBoard是kubernentes官方提供的WebUI,Rancher是第三方开发的。当然也有很多公
目前很多公司业务已经上云,使用了大量的云主机。当前大多数云厂商的云主机公网都是采用的eip,也就是内网和外网使用的同一张网卡,所以流量全部经过的同一个网卡。然而这就面临一个问题,如何将公网和私网的流量分开统计呢?特别是当机器流量异常的时候,如何快速的判断流量是来自公网还是私网。当然云厂商一般也提供了eip的监控,然而很多公司也有一套自己的监控,对于自建监控如何实现,这就值得思考了。本文将采用pyt
1.前言kubernetes版本更新迭代非常快,上一篇写kubernetes搭建时,版本还是v1.15.0,现在已经更新到v1.18。看kubernetes在github的官方仓库,8月14日小版本已经到了v1.18.8。本篇文章基于kubeadm搭建kubernetesv1.18.8版。本篇文章与上篇文章几点不同之处:操作系统采用CentOS。master采用单节点,如果要搭建多master高可
很多时候,我们是是需要查看服务器的网卡当前跑了多大流量,但对于网卡流量的查询,在linux下似乎没有像top那样的原生命令。虽然top功能很强大,可以实时查看cpu、内存、进程的动态,但是却没有对网卡流量的监控。既然没有,那那就自己写一个吧,哈哈。本文代码综合使用了psutil和curses模块,脚本工具同时支持在linux和windows下使用,支持动态查看网卡流量。当然现在也有些第三方的工具可
1.前言电脑用了很多年了,安装的windows7,经常出现很卡的情况,于是今天索性重装了系统。既然重装系统,选择什么系统好呢,windows10系统的话,对于我这老旧本来说,可能真的是为难它了。刚好ubuntu20发行没多久,于是尝试安装了ubuntu20.04。刚开始安装ubuntu20的时候,也是遇到了很多坑。在自定义分区的时候,一定要有boot、efi、biosgrub分区,否则安装完成后,
云计算是当下非常流行的技术,各互联网公司基本上都在使用着不同云厂商的资源。我们要查看或者操作购买的云计算资源,一般都通过控制台登录直接操作。但是如果我们要批量操作资源,或者是开发自己的平台调用资源,那么我们该怎么办呢?其实各云计算厂家都提供了资源操作的接口,api和sdk。其中,api接口需要我们自行实现接口的签名认证,再调用厂商的各种方法,然后二次开发;sdk是厂商已经封装好的操作接口,我们可以
前言ping是我们工作中常用的一个工具,我们经常说ping一下这个ip地址,看网络是不是通的。但是除了我们经常使用的简单用法外,ping还有很多其他功能,你是否get到了,下面让我们来探索下吧。ping是网络检测中常用的一个工具,ping工作在TCP/IP网络体系结构的应用层,主要是向特定的目标主机发送ICMP(IternetControlMessageProtocol因特网报文控制协议)Echo
简单介绍tcpdump是一个能够对网络上的数据包进行收集的网络分析工具,根据用户自定义条件收集数据包,具备灵活的策略,是系统管理员分析网络、排查问题的利器。tcpdump提供了源代码,有公开的接口,因此具备很强的可扩展性,它支持针对网络层、协议、主机、网络或端口的过滤,并且支持and、or、not等逻辑语句。普通用户无法执行tcpdump命令,只有具备root权限才能执行。参数介绍默认情况下启动t
dig命令主要从来从dns域名服务器查询主机地址信息,与nslookup命令作用相同,但是比nslookup输出的信息更多。安装digredhat系系统yuminstall-ybind-utilsdebian系系统apt-getinstall-ydnsutils如下查询新浪的dns解析digwww.sina.com输出如下信息现详细讲解下以上输出信息;<<>>DiG9.10
当我们服务器数量只有1台,2台,几台时,我们部署软件工具可以逐台登录服务器操作,但随着企业服务器数量不但增多,显然逐台登录部署已经变得不现实。这时自动化运维管理工具就闪亮登场了,目前比较流行的工具有puppet,ansible,saltstack。我曾经使用过ansible和saltstack,当机器数量较多时,ansible执行比saltstack慢很多,今天主要介绍下saltstack。1.s
好的工具能够让我们工作更加高效,结合工作中的情况,今天分享下linux下比较好用的几个工具。网络分析工具mtr mtr是网络链路检测判断问题非常好用的工具,集成了tracert和ping这两个命令的功能,动态的输出检测结果。mtr默认发送icmp数据包进行链路探测,会对链路上的相关节点做持续探测并给出相应的统计信息,mtr能避免节点波动对测试结果的影响其中中间线路丢包严重但是目标地址不丢包,可能是因
最近准备换房子,在网站上寻找各种房源信息,看得眼花缭乱,于是想着能否将基本信息汇总起来便于查找,便用python将基本信息爬下来放到excel,这样一来就容易搜索了。 1. 利用lxml中的xpath提取信息 xpath是一门在 xml文档中查找信息的语言,xpath可用来在 XML 文档中对元素和属性进行遍历。对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但
exporter是prometheus监控中重要的组成部分,负责数据指标的采集。本文将详细介绍mysqld_exporter、redis_exporter、blackbox_exporter、cadvisor,通过这些插件来采集监控主机的相关指标数据,来打造完整的监控系统。
1.Prometheus简介Prometheus又称之为普罗米修斯,是一个最初在SoundCloud上构建的开源系统监视和警报工具包。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有一个非常活跃的开发人员和用户社区。它现在是一个独立的开源项目,可以独立于任何公司进行维护。Prometheus于2016年加入CNCF(云原生计算基金会),作为继kubernetes之后的第
1. VyOS简介 VyOS是一个开源的网络操作系统,可以安装在物理硬件上,也可以安装在你自己的虚拟机上,或者是一个云平台上。它基于GNU/Linux,并加入了多个应用程序,如:Quagga, ISC DHCPD, Open×××, StrongS/WAN等,以及其他的管理界面。 VyOS系统安装最低要求512M内存和2G存储即可。2.
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号