开源私有云全能冠军proxmox,一键安装,一条指令即可建立起集群。不借助外挂存储,不需要什么控制中心,谁都可以做老大,死了谁都不要紧。用了好长一段时间,把服务器虚拟化与桌面虚拟化整合到一起,这才是真超融合呢!
接到一个求助电话,说是有个阿里云上的服务器,有性能瓶颈,但又没有什么具体的数据,只是说偶尔客户端有少数连接不上,或者连接会突然中断。我的天,最怕这种状况了,还得自己去找问题表现是什么,再去找什么原因所致。因为是线上的环境,得分两步进行。先检查,看系统或者应用存在什么明显的印迹,分析原因和处理方法;协商什么时候可以处理,处理风险是什么。怕影响用户体验,白天还不让搞。月黑风高,家里有没暖气啊(用一块闲
发件人: 周** 发送时间: 2011-03-04 18:54:37 收件人: sery 抄送: 主题: 请教问题 我看你们的服务器的连接都是比较正常的 [root@381263 conf]# netstat -n |&n
终于等到啦!"Linux高可用实践真传系列"三本终于全部弄齐了,总的来说算是圆满。本书为《Linux企业级高可用实践真传》系列丛书之《Linux 高可用负载均衡集群实践真传》。是一本专门介绍主流负载均衡技术的原创书籍,是作者二十多年来一线运维工作的经验总结。负载均衡技术是服务或应用高可用的基础,不论是Web应用,还是数据库,要保证访问的持续性,负载均衡技术的支持不可或缺,至关重要。本书囊括了常规类
作者:田逸(formyz)目标需求接到一个任务,需要在凌晨四点对一个数据库进行备
作者:田逸(formyz)一台核心业务数据库,版本为MySQL社区服务器版。从上线以来,这个数据库服务器的错误日志增增加非常迅猛(如下图所示),每24小时能增加到10多个G的容量。因为有故障报警,也还没有影响到业务的正常访问,有关人员不让重启MySQL服务。鉴于这个情况,我只好设置一个自动计划任务,在每晚的夜间定点清理这些日志。具体的操作时候在系统命令行,执行“crontab -e”,添加如下的文
做了很长一段时间的运维部门负责人,除了负责管控IDC机房的业务系统服务器外,还得兼管公司内部的办公网络。虽然不用亲自去帮同事搬主机、安装系统,但面对堆积如山的、分配不出去的旧电脑,很是犯愁。为什么这样呢?因为有员工辞职,需要收回电脑,等新的员工入职,再把回收的电脑分配出去。但新来的员工,觉得旧电脑配置太低,不愿意接受,于是只能再采购新电脑,以致于旧电脑库存越来越多。14.1 办公场景使用PC机面临
作者:田逸(formyz)一大早就收到某个数据库服务器磁盘满的报警信息,其中数据盘使用率超过90%,如下图所示。这是一台刚上线不久的MySQL从库服务器,数据盘的总容量是300G。先登录系统,查看主从同步是否正常,幸运的是主从同步正常;再看看磁盘空间的使用情况,执行的命令及输出如下。df -h[root@MySQL-S-200-169 mysql_db]# df -hFilesystem Size
寻赞助商
作者:田逸(formyz)一个NFS服务器,为多个Web项目所共享。这些目录包括PHP程序、图片、HTML页面和用户上传的文档和附件等。因为某些Web框架古老,存在诸如不对上传文件做严格的安全性检查,虽然此NFS服务器位于受保护的内部网络,但任然被别有用心的人上传了大量的恶意文件。强烈要求程序员进行程序(Discuz)更新,答复说更新难度太大,无法在程序上进行处理。从系统管理层面上,临时的措施仅仅
KL银行现场服务记录—HA故障服务时间2019年9月10日星期二14:40 到2019年9月11日星期三0:30服务内容排查redhat RHEL 6.4 一个节点cman启动故障。(1)、查看系统日志;(2)、查看ha日志,/etc/cluster下各日志文件;(3)、clustat查看集群状态,提示cman未运行;(4)、查看集群配置文件/etc/cluster.conf;(5)、对比另一个正
作者:田逸(formyz)Oracle 当前的最新版本是23c,虽然官方网站下载不了它的正式版本,但是却提供了一个性能受限的免费版本“Oracle Database 23.3 Free”(存储容量受限、内存使用受限)。这里就只好用这个免费的版本来做测试,免费的版本能正常部署,那么将来的正式版本的部署也不在话下。Oracle 23C 提供如下几种安装方式:Docker容器。通过docker pull
作者:田逸(formyz)跳板服务器Jumpserver部署起来非常容易,但由于其组件多,组件之间关联复杂,一旦出现故障,恢复起来就比较费事。为了解决这个麻烦,本人通常是将Jumpserver部署到Proxmox VE 上的虚拟机,然后对整个虚拟机备份,如果有需要,直接从PBS 用备份进行完整恢复。Proxmox VE 8安装Opensuse 15JumpServer官方文档指出,JumpServ
作者:田逸(formyz)试用统信Linux操作系统UOS,想了解一下用已有的Linux经验能否轻松驾驭它。以便在某些场景下,可以多一种选择。本次试验在Proxmox VE 8(以下简称PVE 8)平台下进行,采用的版本为UOS 20 Server。试用的内容大概包括:操作系统安装、与主流Linux发行版之间的差异、软件的安装…安装UOS 20操作系统如果在PVE 8下创建虚拟机,并在此虚拟机上安
作者:田逸(formyz)销毁Ceph Pool的目的一套五节点的Proxmox VE超融合集群,当初为有效利用资源,配备了Nvme高性能磁盘和大容量的SATA机械磁盘(如图所示),高性能Nvme磁盘用于虚拟机的系统盘、数据库的数据存储盘,而大容量的机械盘则用于存储诸如图片、视频、共享数据等对性能要求不高的场景。由于机构的业务发展迅猛,收益较好(个人猜测),决策人打算将现有的机械盘全部更换成Nvm
作者:田逸(formyz)非常好用的开源监控系统Centreon从版本号21.40以后(包括Centreon 21.40这个版本),不在提供ISO一键式安装包,取而代之的是在线脚本安装和VMware虚拟机或者Oracle VirtualBox 虚拟机镜像。本着开源的精神,以及对现有资源的有效利用,打算把VMware 虚拟机形式的Centreon镜像,部署到Proxmox VE上。运行环境运行平台为
作者:田逸(formyz)2023年11月31日,Proxmox 官方正式发布Proxmox Backup Server 3.1版本。现在我负责管理的Proxmox Backup Server(以下简称PBS)版本号为2.3,打算将部分PBS升级到PBS 3.1,体验一下新版本的新特性。PBS 2.3要升级到PBS 3.1 ,至少需要满足两个前提条件:PBS版本升级的2.4和操作系统Debian
最近一些项目的站点经常发告警短信,提示网站无法访问。通过排查,发现后端数据库资源都被耗尽(连接数上千,正常情况是小于100),负载也高得吓人,如下图所示。“load average”数值最高的时候,能超过1000。再排查访问异常站点的Web日志,大致判断是被人盯上了。为了解决这个问题,在不能增加任何投入的情况下,决定部署一套开源的WAF。通过综合评估,最终选择雷池作为安全防范工具,部署在网络的边界
将Gitlab迁移到内网Proxmox VE在一台服役超过15年得高龄服务器上,运行了一套Gitlab 11.0,因为使用的人比较少,访问不频繁,未将其加入到高可用集群平台。但是最近以来,开发人员经常反馈Gitlab不能使用,通过仔细排查,发现故障的原因是物理服务器运行一段时间后就死机。为了解决这个麻烦,计划将Gitlab迁移到Proxmox VE,方便对其备份及故障快速恢复(虚拟机整体恢复)。迁
五个节点的Proxmox VE超融合集群,创建了两个Ceph Pool,一个是高速的Nvme存储池,另一个是大容量SATA存储池。现在需要将原有的SATA磁盘全部拔出来,换成高速Nvme磁盘。首先,先销毁由SATA机械盘组成的“hdd_pool”,选中它,然后点击按钮“销毁”。注意,必须先销毁Ceph Pool,在销毁组成Ceph Pool的OSD盘,如果顺序反了,在销毁Ceph OSD过程中,剩
因为资源紧张的原因,担心一旦关机,虚拟机因为没有空闲的资源而被冻结,以致于不能漂移,导致部分服务停止,只好让机房帮忙热插拔。幸运的是,插上去能够被系统所识别(/dev/sdf就是新插入的硬盘)。开始对新加入磁盘的服务器做创建OSD操作。
这几天centreon监控频频报警,提示ceph pg 错误,用 ceph health detail 确定不一致的pgs,然后用指令 ceph pg repair pg_num 进行修复,通过查看系统日志,有IO错误,修复一次,能管半天,提醒决策人买新硬盘换上,不理睬,今天终于挂掉了,虽然不影响业务,但资源总体利用率超过70%,一旦节点挂掉,虚拟机连漂移的机会都没有。编辑Ceph O
持续gong击俺管理的服务器,有什么好处呢?你就不能消停一下?弄得我好一阵不能安稳,画个雷符治死你们信不信?
连续运行了3018天的高龄服务器硬盘挂了,昨晚整了一个通宵,困极。负载不高,IO稍微有点高。硬盘报错,系统盘没问题,是一块独立的SCSI盘坏了,里边存储的是MySQL用户数据,可以访问目录,查看文件属性,企图将MySQL整个数据库目录完整拷贝出来(cp或rsync),失败。妥妥的连续运行了3018天,在本次开机以前,它就是一台老龄服务器,最初在我手里投入使用的时间是2010年,由此推断,此服务器可
故障描述位于某Proxmox VE超融合集群上的一个网站频频报警,表现的形式是一会儿服务不可用,一会儿又恢复(如下图所示),但同一集群上的其他Web站点未发现异常。可能的原因1)出口带宽占满。2)Proxmox VE集群故障。3)负载均衡器故障。4)应用服务器故障。5)数据库故障。故障定位1)通过查看IDC出口带宽,使用率低于50%;2)查看负载均衡器状态,转发正常。3)随机抽查其它域名的网站,访
由于缺乏良好的规划,有开发人员直接在公有云采购一个容量超过100TB的NAS存储,使用过程中,数据的存储也没有规划,业务数据一股脑的写入到同一个目录,下边的子目录没有规律,用用户的图片、视频、访问日志、甚至还有备份。因应用日趋增多,公有云的使用成本急剧上升,考虑到成本及可控性,决定把公有云的NAS及所有应用迁移到自建的Proxmox VE超融合集群。于是在Proxmox VE集群创建虚拟机,并给
旧版本新版本没有与操作系统一起打包的ISO文件了,要么先安装系统,再安装Centreon,要么用pve导入OVF文件
《Linux高可用负载均衡实践真传》第9章节选对负载均衡的集群监控,不仅仅集中在对集群所有的资源、服务等进行监控,还要兼顾整体逻辑。以MongoDB高可用负载均衡集群为例,对逻辑层面的监控,就是模拟用户行为,访问集群数据,判断运行状态是否正常。MongoDB集群内置一个名为“db.serverStatus()”的工具,用它可以来监控整个集群是否处于正常状态。用客户端“mongosh”登录Mongo
MongoDB自身可可组成分片加复制的集群,在这个集群的前端加上负载均衡器(比如HAProxmy + Keepalived),就可组建成一个无单点故障、十分完美的高可用负载均衡集群(如图8-1所示)。图8- 1整个MongDB高可用体系结构中,存在四个应用集群:入口路由集群Mongos、配置集群“Config Server”、分片集群1、分片集群2。入口路由集群“Mongos”由负载均衡器来实现高
Proxmox VE 8.0正式版发布Proxmox VE 需要升级到7.4,验证一下。root@pve99:~# pveversion pve-manager/7.4-13/46c37d9c (running kernel: 5.13.19-6-pve) root@pve99:~# pve7to8 = CHECKING VERSION INFORMATION FOR PVE PACKAGES =
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号