想必大家都在linux系统中设置过环境变量,有没有感觉不知道应该在哪个文件里面设置呢?比如~/.profile, ~/.bash_profile, ~/.bashrc , /etc/profile , 等等
Ambari是Hortonworks出一款开源Hadoop管理系统,是用python写的,目前市场是开源的Hadoop管理系统好像就只有这一个,虽然Ambari问题很多,也不好用,但也没办法了。 最近监控系统经常报警说一个url老是不可达,只是一个ambari服务器的url 。 于是登录到服务器上一探究竟。
做过kickstart或者cobbler的同学应该都知道postinstall,它是用来在自动化安装操作系统时执行的脚本,对系统作一些定制化的配置,比如ip,分区,硬盘,包等。
在linux系统上操作的同学都熟悉rpm,它是包管理软件,适用度很广。 很多时候我们会想要把我们写的程序或者别人的源码变成rpm包,这样只需要一个rpm文件就可以安装好我们需要的程序了,方便管理而且应用程序直接在系统默认路径下,调用对应应用程序时很方便。 这里说说如何把python源码转变为rpm包。
本文介绍在时间Linux运维过程中用到tcpdump的实际经验分享
用Linux的同学应该都知道yum,是用来管理系统软件包的,非常快捷,可以自动解决包依赖问题。 但真正了解yum的工作原理的人估计并不多。 本文记录一次在公司云平台上遇到无法使用yum的问题。
做运维的同学估计很多都遇到过如下这个问题: 程序启动了多个线程或多个进程,这些线程或进程都会写入一个文件,这时就有可能会造成文件错乱的情况,也就是多个线程或进程同时写入一个文件,造成这个文件错乱了,有些行被插入到了另一些行里去了。 这时很多同学想到了可以用文件锁来解决这个问题,很好,但你知不知道触发文件错乱是有一定条件的,在一次写入文件很小的情况下是不会造成文件错乱的
本文讲Linux系统参数的含义及调优
本文通过分析RHEL/CentOS系统静态路由的启动过程,由此同学们可以了解到Linux系统的启动流程。 可以帮助同学们更好的理解Linux系统,也可以帮助平时的排错。
运维同学们经常会用history命令来查看命令的历史记录,有时候是为了查找”犯罪证据“,但因为history命令输出默认只有ID和command,查找的同学还想知道命令对应的时间,有没有办法让时间也显示出来呢?办法是有的。本文主要讲讲相关的配置。
NAT, 利用tc和iptables进行流量分类
本文主要讲解Linux中/etc/fstab /etc/mtab /proc/mounts这三个文件的作用以及不同之处。
本文主要讲讲ethtool工具的使用,ethtool是Linux中操作网卡的工具。
本文主要分享下服务器中硬盘发生故障后/var/log/messages 和/var/log/mcelog中会出现的具体日志以及对应的修复方法,随着案例的不断增多和丰富,最后我会归纳形成自动化脚本。 当然其中会有很多硬盘有物理坏道,需要更换,这种就需要硬盘供应商去更换了,此处不在本文讨论范围。
本文介绍ipmitool工具的使用,这个命令主要是用来操作服务器硬件的,所以一般的业务运维很少会用它,但它的功能很强大,比如:能够硬重启服务器,重设BMC口,配置BMC口IP,进入grub环境,设置boot顺序,等等。 在Centos和Redhat的大部分版本中都会默认安装它,所以它的实用性比较广。 还有一个好处是用它可以制作远程管理服务器的运维自动化系统。
硬盘在服务器中起着至关重要的作用,因为硬盘里面存储的是数据,随着制造业技术的提高,硬盘的类型也在逐渐的改变。对于硬盘的管理是IAAS部门的责任,但作为业务运维也需要懂得相关的技术。 有的公司采用LVM来管理硬盘,这样做方便扩缩容,也有的公司直接用裸盘来存数据,这样做的好处是不会因LVM而损失掉一部分硬盘I/O速度。需要根据不同的场景采用不同的方式来管理。 Hadoop集群中跑Datanode服务的节点不建议做LVM,因为没有必要,你想想,Hadoop的HDFS就是做分布式大数据的,用Hadoop的公司肯定是有大量的数据,所以对于HDFS基本原则是硬盘有多少空间就用多少空间,不够用的话再加机器或者加硬盘。
sssd是一款用以取代ldap和AD的软件,配置比较简单。 本文介绍如何在ldap客户端部署sssd,来启用ldap认证。
leap second 是指Linux系统自动调整系统时间,这通常会发生在某个月的月末,很可能是6月和12月的月底,当leap second发生的时候可能会导致应用程序(Java)很繁忙,从而导致响应很慢。
vim行操作和列操作
strace
linux top
Linux 命令行 快捷键
幽灵漏洞是Linux glibc库上出现的一个严重的安全问题,他可以让攻击者在不了解系统的任何情况下远程获取操作系统的控制权限。目前他的CVE编号为CVE-2015-0235。
磁盘IO突然很高是运维人员经常碰到的问题,这是由于有大量的磁盘读和写造成的,通常发生在数据库身上,然而发生的场景各种各样。本文举几个例子阐述解决思路。
如何在局域网内ssh可以从任意一台机器登录到另外一台机器
介绍本文说的SSH指的是OPENSSH这个开源软件,通过OPENSSH官网可发现,它在服务器上的使用率已经非常高了。运维人员、开发人员每天都在用它,但很多人对他的工作原理和认证方式不是很了解。正文SSH的认证方式可以概括有4种。1 PAM认证在配置文件/etc/ssh/sshd_config中对应参数:UsePAM2 公钥私钥认证在配置文件/etc/ssh/sshd_config中对应参数:RSA
1 介绍服务器上的Raid卡电池,简称BBU,是个很重要的组件,它对于磁盘的I/O性能影响很大,但一般的BBU电量只能用90天,电用完后系统会自动给其充电,但因充电一般需要几个小时,在充电期间,Raid卡的cache状态是处于write through的,即不带缓存功能。所以为了保证服务器处于正常运行状态,就需要手工进行BBU的充放电,通常把充放电时间定在夜里面,也就是服务器负载最小的时候。2 过
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号