OGG一次故障_51CTO博客

记录一次宕机后，OGG出现故障，OGG-01705的解决方法

数据库OGG故障OGG-01705

OGG一次故障

OGG-01705

原创

李石岩

2021-04-15 03:14:15

1526阅读

记一次故障经过

问题现象：公司客服的电话录音每次只有11秒，这不正常。解决方法：和开发CRM系统的人沟通后，对方说要做端口镜像。把A服务器1网卡和B服务器的2网卡镜像步骤： 1 跑去机房，接上笔记本，登上交换机 H3C S1550， http://192.168.0.234 2 端口管理---端口镜像，这里用4

交换机

服务器

笔记本

开发

电话录音

原创

pengjian06

2014-03-06 16:07:05

694阅读

早上例行巡检的时候发现后台签到数只有5000多，前几天每天早上都有8000多的，咋一下就变5000多了呢？然后就开始了漫长的排查过程。首先想到的是dns解析的问题。因为后台有大量的签到数，说明网站是正常的。能够一下子掉几千的签到数，有可能是某地区的DNS服务器解析出问题，抱着怀疑的态度在DNSPOD上对签到服务器的域名进行了解析诊断。诊断结果为47个DNS解析正常。排除了dns的解析问题后，就想着

服务器

记录

统计

local

而且

原创

a1008611

2015-01-23 10:10:52

687阅读

记录一次 MHA故障

masterha_check_ssh --conf=/etc/mha4mysql/app1.cnfFri Mar 30 17:49:06 2018 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.Fri Mar 30 17:49:06 2018 - [info] Re

mysql

perl

时间间隔

原创

linux成长日记

2021-12-05 16:46:45

429阅读

一次ansible故障排除

运行ansbile时候报错：[root@localhost pyhook-2014-06-09-17:47:17-2454]# ansibleTraceback (most recent call last): File "/usr/bin/ansible", line 25, in <module> from ansible.runne

故障排除

ansible

原创

yaozhaosheng

2014-08-15 10:10:43

10000+阅读

记一次kafka故障

故障现象：kafka有3个Partition分别为0，1，2，在实际运行中发现consumer只能收到Partition:0和Partition:1的数据，检查topic状态均正常。查找Partition::2的Leader为92,如下所示：进一步检查92的server.properties配置文件，发现advertised.listeners字段没有填写，填上后便恢复正常。如果advertise

kafka

故障

原创

大魔鬼

2018-01-09 14:02:09

2502阅读

1点赞

1评论

一次奇怪的网卡故障

今天接到一客户的电话，说上不了网了，我二话没说，赶紧蹬蹬的跑到那去，打开电脑，看到网卡没有显示出来，初次判断是网卡没插紧，赶紧打开机箱盖，把网卡按下~电脑显示查到硬件，本来欢喜十分，想想这么个小问题，很好解决的，但是，却发生了奇怪的事情， windows xp找不到驱动，看了下网卡的型号，是阿尔法的8839D的型号，按理说不可能会出现这样的问题呢。 &n

职场

网卡故障

奇怪

休闲

原创

wuqingying

2006-08-28 16:09:05

969阅读

1评论

一次服务器故障

大周末的，接到同事电话，说服务器不通了，服务器在公司机房里，没有远程控制卡，说让我去看一下，接上显示器，发现满屏幕的“sd 0:1:1:0 rejecting I/O to offline device”,无法远程连接服务器，我就按电源重启了。重启后能正常使用。把这个报错到网上查了一下说这个sd 0:1:1:0 被踢下

iostat

io调度算法

offline device

原创

wangshiqlaile

2014-01-05 16:07:40

4368阅读

1评论

记一次Ceph故障处理

ceph存储集群是建立在两台服务器上面，两台服务器各有4个OSD节点，上班的时候发现，两台服务器上其中一台服务器上4个OSD节点全部掉线，重启OSD节点后恢复正常。查看OSD节点日志后发现，整个故障过程如下：1. 单个OSD节点接收不到另外一台服务器节点上的所有OSD心跳信息，日志记录如下2016-03-21 17:43:

down

osd

ceph

原创

shark_tear

2016-03-24 10:40:53

10000+阅读

记录一次VMwame的故障

故障发生时间2023年4月12日故障发生现象无法启动虚拟机启动虚拟机，报错权限不足，无法访问文件，打不开磁盘"******"或它所依赖的某个磁盘快照，启动”Disk”模块失败故障解决过程找资料，网上的解决方案是删除以.lck为后缀名的文件夹，将 .vmx文件中的vmci0.present = "TRUE"改为 vmci0.present = "FALSE"按照网上的教程操作后出现了新的错误再次查询

解决方案

无法访问

ci

原创

机卸狮老白

2023-07-31 11:01:14

109阅读

记一次磁盘故障排查

事故背景：物理机（192.168.200.10）安装了KVM虚拟化，虚拟化的机器无法正常启动，进入vnc界面查看到linux系统在读取硬盘的时候需要30s-60s左右，正常启动的话几秒钟即可。怀疑是和硬盘有关系。解决思路：1、查看当前系统硬盘负载情况2、查看哪个进程占用了硬盘IO步骤使用iostat–x1iostat还有一个比较常用的选项-x，该选项将用于显示和io相关的扩展数据。如图rrqm/s

硬盘

原创

细哥细妹

2019-08-12 15:45:07

1543阅读

1点赞

记录一次vSAN硬盘故障

本文主要记录了一次vSAN下的磁盘故障排查操作，问题的发现、排查、解决，以及总结

服务器

故障记录

vSAN

vmware

ESXi

原创精选

wuweijava

2022-02-09 14:07:26

4471阅读

1点赞

Zookeeper的一次迁移故障

前阶段同事迁移Zookeeper（是给Kafka使用的以及flume使用）后发现所有Flume-producer/consumer端集体报错：07 Jan 2014 01:19:32,571 INFO [conf-file-poller-0-SendThread(xxx:2181)] (org.apache.zookeeper.ClientCnxn$SendThrea

zookeeper

flume

推荐原创

MIKE老毕

2014-03-01 11:29:26

10000+阅读

2点赞

一次DHCP故障的处理

故障描述：客户端得不到ip，三层核心设备是cisco６５０９，二层是h3c e528查看二层交换机配置，dis int bri ，查看哪个口连接电脑，dis dhcp-snooping 查看哪个口得到ip，哪个没得到ip，dis cu 查看端口下有没有stp edged-port enable，如果是cisco二层交换机，则看端口下是否有 spanning-tree portfast在相

cisco h3c dhcp

原创

古老

2017-08-22 10:31:22

3565阅读

1点赞

记一次线上故障处理

前言下面信息裁剪了一些，有的不确定了就拍脑袋定了，大体情况还是和实际相似。整体过程最开始接到告警一个周六的 9:00 接到钉钉告警A应用线上 499 数量大量增加， A应用的背景介绍先说下A应用的背景，我们A应用每天上亿次访问，主要是给别的厂商买接口的，按照各个厂商的调用量收钱，A 应用的

kafka

nginx

服务器

原创

wx59521ff69b8ec

2022-04-02 11:26:53

319阅读

记activemq的一次故障

今天下午发现公司的activemq消息系统异常，在某个topics上堆积了大量消息，后来发现是有开发同学直接在生产环境上测试，以durable subscription方式订阅消息，应为是测试，消费不及时，导致大量消息堆积。停止activemq后重新启动，发现服务总是起不来，查看日志文件有如下异常 2011-09-16 1

职场

activemq

休闲

延迟发送

原创

yyj0531

2011-09-16 17:05:32

4259阅读

记一次varnish异常/故障

Error 503 Service Unavailable Guru Meditation:

varnish

503

原创

低吟浅唱

2014-06-03 15:29:23

2045阅读

1点赞

2评论

记一次内网DHCP故障

一、现象内网路由器默认为DHCP服务器，提供DHCP服务，下面有5个网段，忽然有一天4网段内的主机获取的IP地址不是内网路由分配的IP地址段，造成4网段通过DHCP上网的主机无法自动获取合理的IP上网。二、解决办法（1）所有设备的进行静态地址绑定缺点是比较麻烦，此网络中PC都是静态地址，有一个无线AP是给无线设备提供IP的，如果改为静态绑定，需要每个手机都进行静态IP绑定，比较麻烦，不能完全解决问

DHCP故障

伪DHCP服务器

原创

zisehuainian

2014-09-16 10:50:57

10000+阅读

记一次lnmp 502故障

nginx

php

原创

dccw

2018-03-07 21:12:18

695阅读

记录一次GC故障排查

问题描述：应用生产环境宕机故障，通过GC日志初步判断是频繁FullGC失败造成进程挂掉，为了止损临时解决方案是调大oldgen空间大小并重启应用。根据监控可看到OldGen使用空间逐渐增加。问题排查：通过分析分析内存溢出时的dump文件，得知老年代中有99%的内存空间都被HashMap对象占用继续分析可以看到溢出风险点ExecutionRuntimeManager类对象中，而且可以看到有多个场景线

java

原创

mb5fe1902d5617a

2021-01-22 12:43:49

848阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

OGG一次故障

记录一次宕机后，OGG出现故障，OGG-01705的解决方法

记一次故障经过

一次故障排查经过

记录一次 MHA故障

一次ansible故障排除

记一次kafka故障

一次奇怪的网卡故障

一次服务器故障

记一次Ceph故障处理

记录一次VMwame的故障

记一次磁盘故障排查

记录一次vSAN硬盘故障

Zookeeper的一次迁移故障

一次DHCP故障的处理

记一次线上故障处理

记activemq的一次故障

记一次varnish异常/故障

记一次内网DHCP故障

记一次lnmp 502故障

记录一次GC故障排查

记一次odoo 启动故障

一次ogg extract抽取进程异常abending问题处理OGG-00446

【故障处理】一次RAC故障处理过程

记一次紧急故障的维修

记一次nagios故障及解决

记一次FTP服务故障分析