前言  中国银行业正进入以数字化为导向发展的关键时期。相比于其他行业,中国银行业的建设有着 IT 系统规模庞大、业务系统跨代且复杂的特殊性。金融监管机构对中国银行业的稳定性、安全性也有着严格的政策要求,但很多银行由于顶层数据指标规范和指标体系建设不完善,导致 IT 技术指标与业务运营指标数据质量较差、关联性较弱、场景覆盖分散等问题。  中国银行业数据指标规范应基于银行核心业务和 IT
转载 2024-09-03 06:42:37
2阅读
文章目录0.监控体系框架1.监控系统设计1.1 评估系统1.2 监控种类1.3 监控技术方案/软件选取(主观因素)1.4 监控体系的人员安排2.监控系统搭建3.数据采集编写3.1 可选用脚本作为采集途径3.2 数据采集的形式分类3.2.1 一次性采集3.2.2 后台式采集3.2.3 桥接式采集4.监控数据分析和方法5.监控稳定性测试6.监控自动化7.监控图形化工作 0.监控体系框架1.监控系统设
前言工作以来一直在做平台相关的研发工作,最近计划总结下对体系建设思考,总结出一个通用模型,后续持续迭代,欢迎一起探讨交流。的工作主要有三个方向,稳定性、效率、成本,本篇是第一篇,稳定性篇。下面开始正文概述工作的核心目标是保障线上业务可以稳定的运行,降低故障发生次数,缩短故障发生时间。因此稳定性方向的建设工作,我们可以从故障的整个生命周期角度入手,来展开保障稳定性的工作。故障的生命
原创 精选 2022-06-28 14:40:18
1172阅读
2点赞
1评论
管理与自动化建设思考
原创 2024-03-11 09:39:37
278阅读
建设体系
原创 2024-07-14 11:08:49
651阅读
IT体系的架构中,IT监控是IT体系中重要的组成部分,作为的生命线,安全生产保障的生命线仍需强调。的安全生产保障,主要以“监、管、控”为核心,其中“监”则主要指的是监控。笔者在工作过程中积累的监控体系建设知识进行总结,梳理成体系,思维导图如下:一、监控体系分层1、概述多年运经验的积累,往往己沉淀下来不少监控工具,同时也有不同专业线条的工具,在基础架构、系统网络、数据库、中间件
点击标题下「蓝色微信名」可快速关注技术社群的这篇文章《到了变革关口,新型体系如何建设?》提出了新型体系
转载 2024-07-30 09:58:47
103阅读
监控概述监控系统到底是解决什么问题的?大家通常所谓的监控系统,其实只是可观测性三大支柱之一,何为可观测性三大支柱?作为支柱之一的指标监控系统,具体有哪些特点?本章重点来回答这些问题。需求来源最初始的需求,其实只有一句话,就是系统出问题了我们能及时感知。当然,随着时代的发展,我们对监控系统提出了更多的诉求,比如: 通过监控了解到趋势,知道系统在未来的某个时刻可能出问题
理解IT管理体系 文章目录理解IT管理体系IT一体化“监、控、管” 管理体系的协同“监、控、管”管理体系的意义IT"监控管"一体化 IT一体化针对IT,可以分为三个方面,监控、管理、控制,“监、控、管”三者紧密关联,逻辑上是一条闭环环路。监控的结果作为依据进行分析、决策和指导IT工作;IT工作本身需要资源管理和流程管理来进行资源统一管理、工作规范化和标准化(
转载 2023-08-16 16:15:47
410阅读
技术社群的这篇文章《日 | 人员 7*24 值班拯救指南》节选了《高性能之道》这本书的内容,讲的是值班的问题。我从事了
# 云平台体系建设指南 ## 1. 云平台体系建设流程 构建一个云平台体系是一个系统的工程,以下是一个大致的流程,每个阶段都有其特定的任务和目标。我们用表格形式展示步骤如下: | 步骤 | 描述 | |------|------| | 1. 需求分析 | 收集业务需求,分析哪些服务需要。 | | 2. 设计架构 | 设计云平台的整体架构,包括网络、安全和服务部署等。 | |
原创 9月前
284阅读
初识MySQL数据库特别是mySQL这样不是很成熟化的商业数据库,使用起来其实并不方便,这也是为什么很多互联网公司,像腾讯或者美团都有专门的团队DBA去支持最后的工作。MySQL首先要搞定的是安装部署这块,对于一般开发者来说如果不专门抽时间学几个小时或者学几天的话一般很难完善的部署mysql的相关服务。接着在实例或者集群增多之后,需要对它进行管理,包括整个的集群拓扑关系,切换关系。剩下的是
原创 2021-05-05 10:44:54
682阅读
本文来自Tencent BlueKing社区用户: CanWay 指标指用于描述一个物体或事物的某个性质的指数、规格、标准,使其可以和其他的物体或者事物比较;从软件的角度讲度量即把所有东西都量化、数据化、可采集。指标即表示对这些量化后的数据的目标值。 观测指标体系是指对监控指标进行体系化的规划、实现全生命周期管理、建设管理规范等的系统方法论。 在了解指标体系前,先了解下为什么需要进行指标体系
欢迎关注原创公众号:  监控是为了实时或及时把握设备和系统的整体运行动态,提前、主动发现故障和隐患,缩短故障发现时间和解决时间,提高效率,是工作的主要内容之一。监控范围覆盖基础数据CMDB的全部对象的全生命周期,从底层数据中心机房到顶层应用系统和数据、从系统建设数据产生到系统注销数据归档,从基础信息、可用性、性能、容量以及安全等多个维度进行细粒度的实时监控,通过监控策略、数据
原创 2022-09-30 10:26:20
1843阅读
如何树立正确建设思路。
原创 2021-10-20 10:47:56
2796阅读
11点赞
2评论
姚健 | 某银行科技运营中心工程师项目情况说明项目背景伴随着某银行上海分行业务的快速发展,总行对IT基础架构设备的监控和数据管理要求也日渐提高,势必对分行运监控系统带来极大的挑战。同时,各种新型应用组件和开源技术组件日渐成熟,越来越多此类组件在上海分行业务系统生产环境中上线使用,传统商业监控软件已无法满足我行IT基础架构设备的监控和数据管理展示要求,且传统商业软件存在产品费用高、lice
Linux笔记: 让我们谈谈学习方法和红帽系统  部署虚拟环境安装linux系统  新手必须掌握的Linux命令 管道符、重定向与环境变量 Vim编辑器与Shell命令脚本  用户身份与文件权限 存储结构与磁盘划分   Iptables与 Firewalld 防火墙&n
监控,不:解读企业全栈式监控企业应用由单体应用系统向分布式系统的发展趋势已经不可逆转。十年前 “SOA” 大频率的出现在软件系统招标技术架构要求书中,相信用不了多久“微服务架构”也会被频繁提及——分布式系统将成为主流。 01 为什么分布式系统会“火”? 因为业务应用随着自身功能的复杂化、应用间更频繁的相互调用以及用户数的不断增长等诸多因素,导致单台服务器性能已经无法满足应用系统的业务量,
简述各位小伙伴,近期技术文感觉发的有点多,不知是否给大家在工作中解决实际问题带来了一些灵感。为什么这么说呢?因为正是文章中涉及的细小知识点积少成多,让我从零碎繁忙的工作中得到了一定程度的解放。相信认真读过的小伙伴,一定会觉得工作中并非只有什么高大上的技术才能解决痛点,恰恰相反,正是那些我们平时忽视的细节才是问题的要害。那么只有切中要害,我们才能对症下药。因此接下来一段时间,我可能会陆续分享
目录1 数据库运行维护基本工作2 运行状态监控与分析3 数据库存储空间管理4 数据库性能优化4.1 基本概念4.2 优化考虑角度4.3 数据运行环境与参数调整的角度4.4 模式调整与优化4.5 存储优化4.6 查询优化 1 数据库运行维护基本工作数据库的转储和恢复 数据库的安全性和完整性控制 数据库性能的监控你分析和改进 数据库的重组和重构2 运行状态监控与分析按方法分类 自动监控机制 手动
  • 1
  • 2
  • 3
  • 4
  • 5