计算热仍然在持续升温,越来越多的企业开始着手构建和考虑构建企业内部的计算平台。不过,并不是所有企业都能如愿顺利建成自己的平台,很多云计算的项目匆匆上马,然后匆匆地以失败而告终。计算技术的复杂性注定这样的情形还会持续一段时间,至少最近一两年会使如此。以下是企业在迈向计算之路上易犯的几个错误。前车之鉴,后人之师,吸取别人的教训可以让自己少走弯路。误区1:在项目的后期才考虑治理和安全问题。不管
作者|贾燚星(VMware), 何淋波(阿里)北京时间 9 月 27 号,OpenYurt 发布 v0.5.0 版本。新发布版本中首次提出 kubernetes-native非侵入、可扩展的边缘设备管理标准,使 Kubernetes 业务负载模型和 IOT 设备管理模型无缝融合。同时联合 VMware 推动 EdgeX Foundry 作为原生设备管理模型的首个实现并成功落地,大大降低 Edg
计算时代,平台的稳定性至关重要。然而,平台在运行过程中,偶尔也会遭遇故障,这时及时有效的处理措施就显得尤为重要。以下是我们在面对平台故障时,所经历的复盘记录。 ### 问题背景 随着企业逐渐将业务迁移到平台,任何一次故障都会对正常运作造成重创,导致客户流失和财务损失。 - **业务影响分析:** - 2023年10月1日 发生临时宕机 - 2023年10月2日 客服接到大
随着过去一年疫情的持续彻底改变了IT部门开展业务的方式。我们进行了一项相关研究,以了解这些根本变化并分析了如何提供一种整体方法来改变 IT 运维方式,为未来的IT业内做好充足准备。我们希望将此报告献给在这个充满挑战的时期保持 IT 正常运行的所有 IT 团队。该调查大致分为六个主要部分——IT 管理、、事件管理、IT 安全、终端管理和 IT运维管理——重点是针对一些主要行业问题制定合理的业务建议
转载 2024-07-17 11:25:50
12阅读
运行互联网上一些最关键的计算服务的专家分享了他们所面临的问题,以及他们如何解决或缓解这些问题。正如一位明智的计算架构师曾经说过的那样,“计算有大量的问题需要解决。”计算使大规模运行应用程序和服务变得更加容易。然而,计算也带来了自己的问题。一方面,企业如果回到内部部署时代,一些失控的代码只会导致性能下降或中断。而计算平台的成本也居高不下。虽然使用Amazon Kinesis或Azure
# 平台故障案例及解决方法 ## 引言 随着计算的快速发展,平台已成为企业和个人进行应用开发和部署的重要工具。然而,由于各种原因,平台故障是不可避免的。本文将介绍一个平台故障案例,并提供解决方法。 ## 平台故障案例 假设我们使用的平台是一个提供在线购物服务的电商平台。最近,我们收到了用户投诉,称在结账过程中遇到了问题。用户在购物车中添加了商品,但在点击结账按钮后,页面一直加载不
原创 2023-10-18 10:43:02
499阅读
# 平台故障查看 ## 引言 随着计算技术的快速发展和广泛应用,平台故障已成为服务提供商和用户关注的重点问题之一。当平台发生故障时,及时发现和解决故障非常重要,这样可以最大程度地减少故障对用户的影响。本文将介绍平台故障查看的方法和技巧,并提供相应的代码示例。 ## 平台故障查看方法 ### 1. 日志查看 日志是了解平台运行状态和故障的重要途径之一。平台通常会记录各种运
原创 2023-10-16 08:23:23
95阅读
CloudStack是一个功能强大、UI友好的开源(IaaS)计算解决方案。自Ctrix将CloudStack捐献给 apache 后,一直持续高速发展,其社区活跃度已经渐渐赶上风头一时无两的另一开源OpenStack平台。CloudStack拥有所有开源平台中最为友善的管理界面,而且其天生的多语种支持会使中文用户感觉很爽。今天我们来详细介绍一下CloudStack最新版本 4.1.0 在
转载 精选 2014-02-13 15:23:22
1105阅读
编辑 | 张婵 昨天下午阿里出现大范围故障,影响了全国半个互联网圈。运维工作责任太重大。 6 月 27 日下午 4 点 20 分左右,阿里出现大范围故障,手机端和 PC 端都无法访问,持续时间一个多小时,影响范围包括阿里官网控制台,以及 MQ,NAS,OSS 等产品功能,也有用户反应阿里巴巴,淘宝,滴滴和石墨文档等产品也出现了服务不稳定的情况,据说金
转载 2024-01-26 20:57:20
49阅读
"数字经济的发展驱动越来越多的企业上,每个企业都会基于原生安全能力构筑下一代企业安全架构,完成从扁平到立体式架构的进化,届时原生安全技术红利也将加速释放!”9月27日,阿里智能安全事业部总经理肖力在2019杭州云栖大会·云安全峰会上指出。肖力强调,原生安全技术会默认植入在下一代企业安全架构的每个模块,从而升级整体安全水位。  阿里智能安全事业部总经理肖力一个立体式的安全架构峰
pstree -p `ps -e | grep python | awk '{print $1}'`kill -9 `ps -e|grep python | awk '{print $1}'`vi /etc/crontab# 解决思路export MALLOC_ARENA_MAX=1# Java程序
原创 2021-08-11 11:06:32
223阅读
平台磁盘扩容 #步骤 需求:原先40G--扩容到45G 1.盘--扩容 2.扩容方式 在线扩容 离线扩容 3.付款支付 4.查看
原创 4月前
58阅读
9月30日, 农发行平台项目 建设顺利完成,正式投产上线。这标志着农发行私有成功实现从IaaS层面到PaaS层面的全面升级,实现了农发行私有规划、建设过程中最关键的一步。 在总行党委的周密部署下,根据全行IT建设规划,2019年5月1日,农发行总行生产系统虚拟化资源池、同城和异地灾备虚拟化资源池、珠海研发测试虚拟化资源池完成研发并顺利投产上线,完成了农发行私有建设规划
                            阿里平台之docker容器故障总结各位网友及同行大家好;        今天遇到了一些关于阿里平台docker容器的问题,现在把自己在解决问
原创 2016-10-25 12:04:57
4796阅读
1点赞
# 平台重大故障的应急服务 随着计算的不断发展,越来越多的企业和用户将自己的数据和应用程序搬到了平台上。然而,平台也并非完美无缺,重大故障可能导致服务中断、数据丢失等问题,严重影响企业的运营和用户体验。因此,建立有效的应急服务机制,对于保障平台的稳定性至关重要。本文将为大家介绍平台重大故障的应急服务,包括其组成部分、实施过程以及代码示例。 ## 一、应急服务的组成部分 应急服务主
原创 8月前
41阅读
阿里平台监控系统显示pending 状态故障总结各位网友,各位同行,大家好!       今天遇到了一个问题监控平台服务器显示pending的状态,显示蓝色,把自己解决问题的心得体会,解决问题的小的思路和解决办法分享一下,如下所示描述;       问题描述1:A监控系统SLB负载均衡产品服务器显示pending蓝色
原创 精选 2016-10-26 17:08:21
3030阅读
kubernetes故障排查和处理 排查命令和方式 1、kubectl get pods 2、kubectl describe pods my-pod 3、kubectl logs my-pod 4、kubectl exec my-pod -it /bin/bash 后进入容器排查 5、查看宿主机日志文件 /var/log/pods/*(containerd),/var/log/container
原创 2022-08-09 13:03:01
4067阅读
Docker容器排查以及常见故障Docker是一种相对使用较简单的容器,我们可以通过以下几种方式获取信息: 1、通过docker run执行命令,或许返回信息 2、通过docker logs 去获取日志,做有针对性的筛选 3、通过systemctl status docker查看docker服务状态 4、通过journalctl -u docker.service 查看日志启动故障1、docker
原创 2022-08-09 00:23:48
2142阅读
阿里专有平台docker容器内应用检测失败故障总结各位网友,各位同行,大家好!       今天在阿里专有平台中,遇到了一些关于docker容器内应用检测失败的问题,现把今天的解觉问题的心得和解决思路,分享给大家;       问题描述:在docker容器中rhs服务应用显示检测失败;(这里我只说一个例子就好了
原创 2016-10-27 14:39:32
707阅读
  • 1
  • 2
  • 3
  • 4
  • 5