阿里巴巴的监控平台经历了多次迭代与更替,在曲折发展中慢慢从简单的自动化转换为颇具智能化的系统运维。2018 年 5 月 18-19 日,由 51CTO 主办的全球软件与运维技术峰会在北京召开。在“容器下的 AIOps”分论坛上,来自阿里巴巴集团监控负责人程超就《自动化到智能化的阿里监控发展之路》主题进行了精彩演讲。本文将从如下三个部分来分享阿里构建超大规模的秒级监控平台的最佳实践:打怪升级修炼
写在前面最近项目组上针对服务器的资源消耗,特别是java这块的堆栈内存,JVM指数(新生代,老年代,存活区区域…)内存消耗之类的需要进行监控(当然主要的还是运维这块的对服务报警监控),以便项目成员能够及时找出项目上回出现的问题,于是引入了阿里开源的阿尔萨斯工具(Arthas)。什么是Arthas,它能帮我们做什么Arthas 是基于 Greys 进行二次开发的全新在线诊断工具,利用Java6的In
转载 4月前
147阅读
       随着用户网络规模的扩大,越来越多的网络业务不断加入到网络当中。如:ERP、CRM、OA系统等,并且不同行业的企业用户,还可能有专属的私有协议和应用。网络中承载业务系统增加,其稳定性要求也越来越高。       在日常的网络维护中,当业务系统出现故
来自 道旅旅游科技股份有限公司 鬼谷子 的撰稿业务背景公司由于业务迅速扩展,需要针对业务方面进行定制监控。通过选型最终采用了 ARMS 方案。以下篇幅简单介绍了方案的大致概要以及最终效果,以供读者参考。选择以下是几个产品方案的对比。需要解释的是,以下三个产品在我们的架构中都有大量使用,但是只是在本监控方案中,由于一些业务场景的特殊性,我们使用了业务实时监控服务 ARMS,虽然这并不代表 ARMS
今天是2017年元旦,互联网架构师祝大家在新的一年里心想事成,阖家欢乐,身体健康!
转载 2022-04-21 18:01:07
930阅读
1月30日公布的2019财年Q3季报财务数据显示,阿里巴巴营收为1172.78亿元,同比增长41%。归属普通股股东的净利润为人民币330.52亿元,同比增长37%。阿里巴巴似乎正在重新变成一家高效的电商平台公司。然而,跟几年前不同的是,电商已经难以囊括阿里的全部业务触角,从这个角度来说,践行了两年的“新零售公司”又是更为合适的概念。2016年,马云就提出阿里将不再提电商概念,“取而代之的是线上线下
1 exporter是什么?广义上向prometheus提供监控数据的程序都可以成为一个exporter的,一个exporter的实例称为target, exporter来源主要2个方面,一个是社区提供的,一种是用户自定义的。 2 常用exporter官方和一些社区提供好多exproter,可以直接使用。 官方的exporter地址: Exporters and in
作者:吴必良(未立)前言2017双11再次创下了32.5万笔/秒交易创建的纪录,在这个数字后面,更是每秒多达几千万次的数据库写入,如何大规模进行自动化操作、保证数据库的稳定性、快速发现问题是一个巨大的难题, 这也是数据库管控平台要完成的任务。随着阿里巴巴数据库规模的不断扩大,我们建设数据库管控平台也经历了很多阶段,从脚本化、工具化、平台化到目前的DBPaaS,DBPaaS在今年双11中, 首次全面
概述 3G、4G移动网络的提速降费,大大改善了国内的网络环境,智能终端的普及、云计算技术的进步与应用,为视频监控在移动端应用的快速发展都提供了良好的条件,安防监控云平台的需求不断增加。-视频云-跨平台播放与互动”的一体化技术框架,在传统的监控视频集中管理的基础上,着重解决了安防领域的突出问题(如:多品牌设备不兼容、设备所处网络结构复杂带来的穿透内网访问难、因网络上行带宽不够导致的视频延迟或卡顿、视
System Center 2012 virtual machine manager是一款非常强大的虚拟化管理工具,在企业虚拟化平台和私有云的管理中具有非常重要的作用。SCVMM之云部署SCOM规划系统配置情况Server Name服务器脚色IP用途备注磁盘大小SCVMM01CAS/HUB192.168.40.31NLB网卡IP300GB*2300GB10.10.1.11心跳网卡IPRAID 1S
中国摄像头数量超过2亿颗,人们已经逐渐习惯被无数双眼睛注视着,人人物联认为这是信息化发展的必然结果。我们愿意通过摄像头去看家护院,照料老人小孩,但摄像头的选择、安装、调试对很多人来说比较陌生,比如我朋友想买一套摄像头监控果园,问我有什么360度全景摄像头推荐,那么今天就来谈谈这个问题。 一、为什么要用360度全景摄像头?1、首先是安全问题。无论是室内还是室外,有摄像头随时观察情况更让人
在上一课时的内容中,分析了分布式系统下的线上服务监控的常用指标,那么在实际开发中,如何收集各个监控指标呢?线上出现告警之后,又如何快速处理呢?这一课时我们就来看下这两个问题。常用监控组件目前分布式系统常用的监控组件主要有 OpenFalcon、Nagios、Zabbix、CAT 等,下面一起来看看这几款组件的应用及相关特性。好钢要用在刀刃上,由于各类监控组件的应用和配置更偏向基础运维,所以本课时的
性能计数器(Performance Counter),也叫性能监视器。一个人健康状况如何,我们通过对其做各项体检获得相关的状况指标,如血压、心跳,肺活量等。那么在做性能测试过程中,整个系统的软硬件进行监控也必不可少,监控所获得的数据也是我们分析系统性能的主要依据。  在整个系统中,对于不同的软件和硬件,我们对其监控的指标也不一样,就像一个公司中的所有人员,其每个人的职责不同,评判和考核的标准也是不
一、行业痛点目前大部分司法机关都存在案多人少矛盾突出,在执行任务时,存在执行取证难、上级指挥信息沟通难、不能记录执行过程信息、上级领导和监控中心不能实时了解一线执法过程等情况,严重影响了重要案件的快速决策与指挥调度。因此需要完善联防体系,建立“联防协调统一、应急处置高效”的集管理、防范、控制于一体的安防视频监控体系,对各类事件做到预知、预判、预防、预警和有效处置,满足司法机关数字化、可视化管理需求
3. 前言做为系统管理员,管理着几十台或几百台服务器在运行。一个非常迫切的需求就是希望了解服务器及服务器上运行的服务的运行状况,在服务器或服务出现当机或停止的时候能够第一时间知道,及时处理。以便最小的减少由此带来的影响和损失。Nagios就是用来解决这个问题的,在目前的一些监控软件中,Nagios 以其良好的稳定性,强大的功能等,已成为业界监控软件的首选。 Nagios官方网站的描述: Nagio
阿里中台业务架构 很多企业都将促进业务与科技的深度融合作为发展战略,也都想学学阿里的中台战略,其实,除了中台战略之外,基于企业级业务架构设计来实现组件化开发也是企业数字化转型的优选路径,是弥合业务与技术之间“数字鸿沟”的有效手段。未来,业务不再仅仅是业务,技术也不再仅仅是技术,谁先实现思维方式的改进,谁能更好地联动整个企业,谁就能赢得竞争的先手,而业务架构能力可以在这方面发挥关键作用,而且是超越中
转载 2023-08-16 16:29:11
97阅读
阿里巴巴B2B网站和淘宝C2C网站均属于阿里巴巴公司,都是交易经纪模式。它们之间有许多共同点,但在商业模式设计方面又有诸多不同。 两类网站的共同点:(1)都为会员提供注册、发布商品信息并提供二级域名;(2)都为会员提供后台管理平台;(3)网站为交易各方提供信用评估机制。 但是,它们又有许多不同之处。阿里巴巴网站的客户针对的是企业(主要是中小型),企
每日数据上报=每日PV(浏览量)+(每日API调用次数-每日50万)✖️
原创 2022-07-30 01:10:23
440阅读
监控子系统是运维管理平台的核心环节,负责对世纪互联网络拓扑、多地IDC机房、服务器的全面监控监控子系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。Open-Falcon功能概述[ http://book.open-falcon.com/zh/intro/README.html ]Open-Falcon 人性化的互联网企业
BAM的具体含义   Business Activity Monitoring的缩写,即业务活动监控。  它提供对业务绩效指标的实时访问,以改进业务运作的速度和效率。”  但是这个新名词的定义还是很宽泛的,它既没有说明实现业务活动监控的技术需求、供应商,也没有确切地定义业务运作的速度。究竟怎样才算是“实时”呢?十亿分之一秒?一分钟?然而正是由于这种宽泛性,我们可以通过多种途径实现BAM,
  • 1
  • 2
  • 3
  • 4
  • 5