1. 故障背景当一个网站打不开的时候,首先要收集信息,然后根据经验去判断问题所在,;     (跟去医院看病一个道理,医生询问病人情况,然后对症下药,如果一上来不闻不问直接开药,很容易草菅人命;) 考虑:          1. 确定网站打不开的范围,部分人打不开 还是 所有人打不开(全国/某个地区)   &nb
原创 4月前
109阅读
ZooKeeper 是分布式环境下非常重要的一个中间件,可以完成动态配置推送、分布式 Leader 选举、分布式锁等功能。在运 ZooKeeper 服务的以来,积累如下经验:1. 集群数量3台起,如果是虚拟机,必须分散在不同的宿主机上,以实现容灾的目的。如果长远来看(如2-3年)需求会持续增长,可以直接部署5台。ZooKeeper集群扩容是比较麻烦的事情,因此宁可前期稍微浪费一点。2. 客户端配
原创 2021-05-12 15:40:18
744阅读
    本文根据讲课笔记整理1、如何最小化安装系统精简安装策略:仅安装需要的,按需安装、不用不装开发包、基本网络包、基本应用包Centos6.x下的设置:Centos7.x下的设置:2、网络设置问题与经验1)、服务器IP地址配置/etc/sysconfig/network-scripts/ ifcfg-eth0/1/2….重启网卡命令:service network rest
转载 精选 2016-09-03 13:20:11
761阅读
# Kubernetes 4000 节点经验分享 Kubernetes(K8s)是一个开源的容器编排平台,广泛应用于大规模应用的管理与自动化部署。作为一名刚入行的新手,如果想要建立和管理一个拥有4000个节点的Kubernetes集群,首先需要了解整个流程。下面,我将分享一个简单的流程以及详细的步骤和示例代码,帮助你更好地理解并实施这个目标。 ## 整体流程 | 步骤
原创 11月前
34阅读
Kubernetes 4000 节点经验分享
转载 2022-04-07 11:11:47
291阅读
目前很多企业信息化系统都有自己的监控平台和监控手段,无论是采用哪种手段去实现对系统的实时监控和故障告警,大多采用的方式也只有两种:集中式监控和分布式监控。本文作者根据自身公司监控存在的问题,总结了一些经验并提出一些在监控平台的建议,以供大家参考学习,如有考虑不周的地方还希望大家多多批评指正。为了更好、更有效的保障系统上线后的稳定的运行。对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有一
转载 2016-12-16 18:18:10
2060阅读
从事一年半,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题今天想简单整理一下,分享给各位小伙伴一、线上操作规范1.测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一
转载 2017-06-27 15:12:53
3426阅读
2点赞
2评论
从事一年半,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题,今天想简单整理一下,分享给各位小伙伴。一、线上操作规范1.测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候
转载 2023-08-25 10:28:26
0阅读
从事一年半,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题,今天想简单整理一下,分享给各位小伙伴。一、线上操作规范1.测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班
转载 2014-11-27 16:27:34
1083阅读
对于企业IT管理员来说,如何正确的应用IT管理软件至关重要。我们今天将会在这里为大家总结几条应用IT管理软件经验,希望对大家有所帮助。 根据调查,目前在运过程中,会遇到以下问题:     1、缺乏工单记录,纸质报告难以汇总:工程师大多没有养成记录习惯,每个月汇总报告时,对自己的工作量、所维护系统的整体情况还是一头雾水。而且纸质的故障处理报告
原创 2012-11-28 10:20:18
730阅读
本文结合裴丹教授过去二十余年在AIOps领域与几十家企业合作、跨多种技术栈的落地经验积累,以及150篇左右学术论文的算法积累,总结出的AIOps落地的一些经验性原则。
原创 2022-07-14 15:30:25
632阅读
1点赞
作为一名工程,需要学习的东西非常多,在学习的过程中也没有任何捷径可言,必须一步一个脚印地学习、积累才能把个人技能提升到相应的高度。根据目前流行的发行版及国际流行的Linux认证,红帽认证和LPI认证的技能考核目标值得大家借鉴,可以作为自己成长的参考路线,特此分享一下。参考红帽认证,一名合格的Linux工程至少应该掌握RHCSA及RHCE的全部内容、技能。RHCSA认证需要掌握的内容:了
很多的企业测试生产环境是独立的,需要通过云桌面等特殊设备才能进生产,以做到安全隔离,技术社群的这篇文章《企业大规模云桌面管理经验分享》给我们讲解了关于云桌面管理方面的经验,值得学习了解。一、背景随着虚拟化技术的普及,云桌面部署模式逐渐被业内接受,许多金融机构已经建立了自己的云桌面系统并在不同场景中应用。除数据不落地,集中、集中管理等优势逐步显现以外,云桌面规模的逐步扩大以及用户量的增加
一次公司内部分享K8S经验的记录
原创 2022-10-17 19:55:52
484阅读
作为鸿蒙应用开发者,在应用上线后的阶段同样面临诸多挑战。本文将分享我在鸿蒙应用开发中的实战经验,帮助开发者构建更稳定的应用生命周期管理体系。关键场景与解决方案在鸿蒙应用中,我们需要特别关注以下几个核心场景:异常监控与处理:借鉴鸿蒙内核的Fault异常处理机制,我们可以实现应用层的异常捕获性能监控:通过鸿蒙提供的性能统计接口,实时监控应用关键指标热更新机制:利用鸿蒙的分布式能力实现应
原创 4月前
84阅读
目录第一章 初入公司第2章 第一阶段:解决物理服务器单电问题第3章 第二阶段:解决服务器虚拟化问题第4章 第三阶段:数据库备份第5章 第四阶段:解决数据库单点第6章 第五阶段:完善监控项第7章
原创 2021-07-29 11:36:25
2491阅读
1点赞
http://www.qconbeijing.com/download/Nicolas.pdf 重点看了下facebook做了哪些改进以及他们的经验,比较重要的有以下几点: 改进: 1 加强了行级的ACID约束 2 改善了数据的分布规则,可以配置hdfs的replicas所在节点 3 改...
转载 2013-11-25 12:41:00
238阅读
2评论
            好久没有写博文了,最近一段时间真的是太忙,有点对不住MVP这个称号,所以决定将MVP头像拿下来。           工作上事情太多,难免繁琐,难免被人抱怨,被人投诉。仔细想想,需要改进的地方的确很
推荐 原创 2011-06-21 12:08:13
9231阅读
32点赞
19评论
### 什么是项目经验? 在软件开发领域,项目经验指的是在使用Kubernetes(K8S)进行容器化微服务部署和管理过程中积累的实践经验。通过项目经验,开发者可以更好地理解容器化部署、自动化、故障排除等方面的知识,提升项目的可靠性和稳定性。 ### 实现项目经验的步骤 下表列出了实现项目经验的步骤,接下来我们将详细介绍每个步骤需要做什么以及对应的代码示例。 | 步
原创 2024-04-25 10:21:02
103阅读
# Kubernetes (K8S) 工程工作经验 作为一名经验丰富的开发者,我将向你介绍关于Kubernetes(K8S)工程的工作经验。Kubernetes是一个开源的容器集群管理平台,用于自动化容器的部署、扩展和操作。下面我将详细介绍在Kubernetes中作为一名工程需要做的工作及相应的代码示例。 ## 整体流程 首先,让我们看一下在Kubernetes中作为一名
原创 2024-05-20 11:33:45
104阅读
  • 1
  • 2
  • 3
  • 4
  • 5