Devops(2)

原创

古奇宝宝 2017-04-11 21:43:07 ©著作权

文章标签 linux 其他 文章分类 服务器

©著作权归作者所有：来自51CTO博客作者古奇宝宝的原创作品，请联系作者获取转载授权，否则将追究法律责任

宣布一个事情，那就是我找到工作了！

还是做openstack的，我比较欣慰，我不知道自己适不适合做openstack，但是我肯定不喜欢做7*24的系统运维，我一点都不喜欢加班，我更加鄙视值夜班。也许就是命吧，经历那么多次面试，能进入实习公司学习openstack，虽然我离开了99，但是我觉得做这门会比其他运维好多了，学习压力至少少了一部分，什么各种乱七八糟的数据库我也不用太花时间了，各种复杂的应用服务器软件我也许不需要管。我的重点就是openstack和python，甚至ansible或salt，再用一些Linux基本的服务软件和shell，现在对我这个应届生来说，最大的困难就是服务器硬件设备本身了，这一点我有点难搞！

这次我进的是南京一个很小的创业公司，去年才成立，不是我没有野心去幻想大公司了，而是遭遇到了失败，或者说此时的心气已经没了。在面小公司之前，春招我也面过苏宁，上午很easy，下午一个是笑都不笑的面庞，表现很差，算了吧，进不去就进不去，我也不想做那种没完没完了的工作。如果小公司发展好了，我就是元老，几年后也就是技术总监，如果发展不好就会倒闭，我就又要找工作了，我一定要有随时准备面试的意识呀，我怕到时候压力一来，没做准备，容易扛不住！现在看来，运维真的是一个屌丝行业，运维开发才是主流，趁还有时间，我这python必须好好学了。

有段时间没写博客了，其实这篇面经也是整理很久了，不知道为什么我比较懒，现在才发出来，签了三方协议后，说玩也没有玩，反正就是偏向实践的学习了，理论方面有些放松。以后上班了就不再是系统的学习，而是遇到问题再学习，那时候的压力和急性子就是让人失望了。

不知道接下来还会遇到什么坎，希望勤于思考吧...

1、求10次以内的斐波那契数列，初始值是0

答：

def foo(list,num):

if num == 1:

list.append(0)

elif num == 2:

foo(list,1)

list.append(1)

elif num > 2:

foo(list,num-1) ##从10一直遍历到0为止，才执行下一句话

list.append(list[-1]+list[-2]) ##从倒数第1个，倒数第2个

mylist = []

foo(mylist,10)

print (mylist) ##输出[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

2、合并两个有序列表？

答：思想就是制造空列表，再填数据，这个方法我记得最熟了

list1 = [1,3,5]

list2 = [2,4,6,8]

temp = []

for i in range(len(list1)):

if list1[i] not in temp:

temp.append(list1[i])

for j in range(len(list2)):

if list2[j] not in temp:

temp.append(list2[j])

temp.sort() ##这里就不需要赋值了

print ("合并后的列表是",temp)

3、列表和字符串如何相互转换？

答：>>> str1 = 'abcdef'

>>> list(str1)

['a', 'b', 'c', 'd', 'e', 'f']

>>> mylist = list(str1)

>>> ''.join(list(mylist)) ##引号之间不加任何东西，结果就直接粘在一起，注意有一个点，点与单引号之间没有空格

'abcdef'

>>> '->'.join(list(mylist)) ##单引号之间加入任意字符，那么字符串结果就是以连接符构成的

'a->b->c->d->e->f'

4、分析a、b、c、d的值？

>>> a = [1, 2, 3, 4, ['a', 'b']]

>>> b = a ##赋值，就是把a对象的引用（地址）传给b，b相当于是a的标签

>>> import copy

>>> c = copy.copy(a) ##浅拷贝：只拷贝外围的对象的值，意思说外围值不会发生变化，以后内围对象的值随a的变化而变化

>>> d = copy.deepcopy(a) ##深拷贝，外围对象和內围对象的值都进行拷贝，以后都不会发生变化。

>>> a.append(5)

>>> a[4].append('c')

答：>>> print ('a = ', a)

a = [1, 2, 3, 4, ['a', 'b', 'c'], 5]

>>> print ('b = ', b)

b = [1, 2, 3, 4, ['a', 'b', 'c'], 5]

>>> print ('c = ', c)

c = [1, 2, 3, 4, ['a', 'b', 'c']]

>>> print ('d = ', d)

d = [1, 2, 3, 4, ['a', 'b']]

5、select、poll、epoll之间的区别？（反正我是记不住的）

答：select的几大缺点：

（1）每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大

（2）同时每次调用select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很大

（3）select支持的文件描述符数量太小了，默认是1024

poll改善了第三个缺点，epoll改善了三个缺点。

参考文档：http://www.cnblogs.com/Anker/p/3265058.html

6、Linux系统的CPU和内存使用率比较高怎么办？（居然这个问题问开发，果然是大厂，就是叼，就算我运维我一时也拿不出最好的解决办法，这不是一件容易的事情）

答：（1）用top命令查看哪个进程占用CPU高，[root@python ~]# top -b -n 1 >top.txt ## -b bacth mode，-n 1次循环

（2）用top -H -p pid命令查看进程内各个线程占用的CPU百分比

（3）查看这个线程所有系统调用所花费时间 strace -p 【线程ID】

（4）使用nice命令降低该进程任务的优先级

参考文档：http://blog.sina.com.cn/s/blog_48eef8410101fl4p.html

7、Linux中进程A能否直接访问进行进程B？为什么？（我擦，拓麻这种问题太底层了，不过是操作系统概念，说到linux就反而觉得太高深了）

答：显然不能。（1）B进程为避免破坏数据的一致性，可能有互斥锁。（2）A与B的进程通信需要一些手段如消息队列、共享内存、socket、信号量、管道等实现。（3）A进程的三态（运行、就绪、阻塞）都需要CPU来调度，而调度又有一些算法（先来先服务、最高优先级、最短时间优先）才能来实现进程的状态转换，如果进程B在使用CPU，A进程就只能阻塞，那么A进程又怎么能访问B呢。

8、如何实现对cinder进行备份？（这个被问到过，想了半天说快照，其实错了）

答：（1）首先快照不是备份，没有冗余作用，只是用来恢复某个时间点的状态，如果原有卷挂掉，卷也是不能用的。因为快照要求卷是available的（即不能被挂载），所以一旦原有卷做了快照，是不能删除原有卷的，必须先删除其关联的快照才行。在快照的基础上，再进行创建volume（如果基于快照创建了硬盘，快照删除不掉）。快照命令：cinder snapshot-list

参考文档：http://blog.csdn.net/hhp_hhp/article/details/49175101

（2）备份前，卷需要是available状态（即不能被挂载），备份一旦完成，对卷就不具有依赖性。cinder backup-create

（3）使用后端驱动进行备份，比如swift或NFS共享存储，块存储节点写入数据，而后上传到NFS服务端（局域网中的另一个节点）。

（4）目前Freezer已正式引入OpenStack，能够进行数据库和nova实例、cinder卷的备份。

参考文档：http://www.aixchina.net/Article/159885

9、某公司系统突然发生访问异常，经程序员排查确定程序里没有死循环和定时任务等，该线上系统采用的是nginx+tomcat方式部署，现在让你快速分析系统最有可能的异常原因，后期防范这种异常可以采用什么方案。其他信息和答题要求如下：

（1）该线上系统周一到周五压力较高，周六周日压力较低；

（2）异常发生在周日；

（3）外界只能通过nginx访问到系统，不能通过tomcat直接访问；

（4）系统分配给tomcat的内存被耗尽了；

（5）nginx已经记录了详细的访问日志；

（6）定位异常原因的主要操作步骤和主要命令写出来；

（7）防范方案的原理和主要命令要写出来

分析：（1）周一周五压力高，说明访问量和负载比较大，用户人群多，但是周末压力很小，异常却发生在周末，说明不是并发连接数受限的问题，nginx和数据库肯定还撑得住。

（2）外界只能通过Nginx代理到tomcat，tomcat自身不开放8080端口，这一点是完全可以的，让tomcat专心处理动态页面

（3）系统分配给tomcat的内存用光了，这句话不太好理解，是说tomcat内存利用率高达95%以上吗？按理说服务器的内存一般都是够的，那么内存使用率很高，不知道CPU使用率高不高，使用top命令查看一下，另外查杀相应的僵死进程。

（4）awk '{arr[$1++]}END {for i in arr {print i ,arr[i]}}' nginx.log 统计nginx每个IP的访问人数，判断有没有恶意攻击，另外分析服务

器响应的状态码，这一点可能是排错的关键，如果都是200 OK或则304都没啥大问题,。

10、linux下的压力测试工具有哪些？注意事项有什么?

答：（1）webbench、ab:访问web服务器的压力测试　

1、压力及性能测试工作应该放到产品上线之前，而不是上线以后；

2、测试时并发应当由小逐渐加大，比如并发100时观察一下网站负载是多少、打开页面是否流畅，并发200时又是多少、网站打开缓慢时并发是多少、网站打不开时并发又是多少；

3、更详细的进行某个页面测试，如电商网站可以着重测试购物车、推广页面等，因为这些页面占整个网站访问量比重较大。

备注：webbench 做压力及性能测试时，该软件自身也会消耗CPU和内存资源，为了测试准确，建议将 webbench安装在其他的服务器上，已达到测试数据更加精确

（2）mysqlslap对数据库的并发连接测试、sysbench对磁盘IO进行压力测试，两者可以结合起来。

参考文档：http://www.cnblogs.com/chenmh/p/5866058.html

（3）除了这些之外，还可以说系统性能测试命令，如top、vmstat、free等常用命令，其实对于uptime命令我始终无法衡量它的上限达到怎样才算不合适？还有top的CPU使用率描述太混乱了！

（4）ipperf测试网络带宽和丢包率，突然想起pstree命令是个好东西，找父进程，多线程。[root@kvm ~]# yum -y install psmisc 依赖安装pstree

11、如何在Linux多级目录下，搜索某个关键字？

答：[root@python ppp]# grep -Rn 'mask' ./ ##用grep递归查找，但是find仅仅能够找到该关键字是否存在，暂时不知道如何打印该关键字所在的文件

12、迭代器和生成器？

答：（1）迭代器（iterator）代表一个数据流对象，不断重复调用迭代器的next()方法可以逐次地返回数据流中的每一项，当没有更多数据可用时，next()方法会抛出异常StopIteration。

（2）生成器(generator)也是一个迭代器，但是你只可以迭代他们一次，不能重复迭代，因为它并没有把所有值存储在内存中，而是实时地生成值。Yield是关键字，它类似于return，只是函数会返回一个生成器。对于类似资源的访问控制等场景，生成器显得很实用。其实最好的理解就是，每执行这个函数，yield都会保存结果值，打印的时候全部打印所有结果。

val = False

while not val:

print '这句话的意思是当val变量为假的时候死循环执行！'

def test():

yield "$1000"

13、zabbix如何去监控一个web服务器的性能？

答：监控指标：（1）打开网页的响应时间（2）每秒的下载速度（3）服务器返回的http状态码（4）验证用户密码登录是否成功

14、Python是强类型还是弱类型的语言？（这个东西我肯定要说错）

答：python是强类型。强弱是对类型而言的。强类型，你有一个值之后这个值是什么类型是确定的，比如n='1'，n的类型是确定的（字符串），因此你不能在Python做n='3'm=n+1运算。而弱类型就不是这样的，值的类型可以在需要的时候再去确定，比如PHP里面你可以$n='3'; $m=$n+1，运算的时候'3'就可以当作整型来进行计算。

参考文档：https://segmentfault.com/q/1010000002230156

15、python的动态性体现在哪？

答：（1）定义变量的时候无需指定它的数据类型，根据运行时具体情况确定。

（2）类class不提供private私有属性的关键字；无法定义常量；函数参数无类型

（3）python中的namespace是可以动态变化的，类的成员，类实例的成员都可以动态添加

16、python的namespace有几种？

答：（1）locals:函数内部的名字空间，一般包括函数的局部变量以及形式参数。

（2）enclosing function:在嵌套函数中外部函数的名字空间。

（3）globals:当前的模块空间，模块就是一些py文件。也就是说，globals()类似全局变量。

（4）__builtins__: 内置模块空间，也就是内置变量或者内置函数的名字空间。比如len()等函数的命名空间就是BIF命名空间

参考文档：http://www.jianshu.com/p/7f3fdd41096f

17、awk实现下列文本的转换？

[root@ssd tmp]# cat 5.sh

[root@ssd tmp]# cat 5.sh |awk '{if(NR%2!=0)ORS=" ";else ORS="\n";print}'

1 D

2 E

3 V

18、怎么实现迭代器？迭代器比for循环有什么优势吗？（这个东西我怎么就记不住呢！）

答：迭代器和经典for循环的索引访问相比并无优势，反而丢失了索引值（可以使用内建函数enumerate()找回这个索引值）。但对于无法随机访问的数据结构（比如set）而言，迭代器是唯一的访问元素的方式。

next方法：返回迭代器的下一个元素

__iter__方法：返回迭代器对象本身

参考文档：http://www.cnblogs.com/kaituorensheng/p/3826911.html

19、python的三目运算符有吗？怎么用一行代码实现三目运算？

答：python没有三目运算符。使用If-else可以模拟三目运算

>>> x, y = 50, 25

>>> small = x if x < y else y

>>> small

>>>

20、磁盘利用率快用尽时，如何看哪个目录使用的最多？

答：（1）find命令：find / -type d -size +2G -print

（2）du -sh /etc ##×××了，这个命令没记住，记成df了

21、python多线程与多进程有何区别？

答：多线程用来并行处理多个任务，以提高处理效率，在python中导入threading模块。join（）方法的作用是必须在子线程运行完毕之后，父线程才能运行，即父线程被阻塞，因为如果父线程一旦运行完毕，子线程就不会再运行了。

（1）多线程可以共享全局变量（内存地址空间），当然锁问题也变成麻烦了；多进程独占资源，进程通信变得就比较麻烦了。

（2）多线程中，所有子线程的线程号相同；多进程中，不同的子进程进程号不同

（3）多线程只使用一颗CPU内核，属于IO密集型，比如在读取文件以及网络IO的时候使用多线程；多进程充分发挥多核的优势，属于计算密集型执行任务。

22、简要说明nova compute创建实例的大体步骤？（这个问题总结很多遍了，但是下面是最简单的描述）

答：（1）nova compute准备创建虚拟机实例的资源，比如根据flavor配置使用多大内存、多少颗CPU、多大磁盘？

（2）nova 从glance下载镜像文件，会对计算节点的_base目录进行缓存

（3）定义实例的XML文件，描述实例的元数据信息，以便下次可以正常启动

（4）nova请求neutron获取虚拟网卡的参数，实例得到诸如IP地址、MAC地址的信息，而后引导虚拟机。

23、虚拟机迁移如何防止调度到源节点的机制？

答：nova-compute 在做 migrate 的时候会检查目标节点，如果发现目标节点与源节点相同，会抛出 UnableToMigrateToSelf 异常。Nova-compute 失败之后，scheduler 会重新调度，由于有RetryFilter，会将之前选择的源节点过滤掉，这样就能选到不同的

计算节点了。

24、计算节点宕机，虚拟机实例还能运行吗？如果不能，怎么恢复呢？

答：虚拟机实例当然不能运行，如果只是nova-compute进程已经挂掉，Rebuild 可以恢复损坏的 instance。

但是计算节点宕机就不行，可以把虚拟机实例撤离到正常的计算节点上去。Evacuate可在 nova-compute 无法工作的情况下将节点上的instance 迁移到其他计算节点上。但有个前提： Instance 的镜像文件必须放在共享存储上。

流程：（只能在后台执行）

执行命令nova evacuate 主机名 --no-shared-storage -> 消息下发到nova-api -> nova-schedule筛选好主机 -> nova-compute分配资源，使用共享存储上的镜像文件 -> 启动instance

参考文档：http://www.mamicode.com/info-detail-1608057.html

25、网卡绑定的工作模式？（这个问题曾经在去年6月份才学过这点，现在都忘了，只记得3种，而且平衡二字又说不出来）

答：如果不同主机的网卡绑定的话，交换机也要进行配置链路聚合才行。总共7种，主要3种

（1）平衡模式

（2）主动备份

（3）广播

bond的好处：（1）提高整体带宽（2）负载均衡

参考文档：http://alanwu.blog.51cto.com/3652632/1095566

26、MySQL 5.5是单线程复制还是多线程复制？如果有大量的DML语句，如何解决主从延迟同步问题？（卧了个槽，这种

问题从来没思考过，又差点栽在数据库集群上了）

答：mysql从5.6才开始支持多线程复制。DML（一瞬间有点懵逼，反应好久才想起来是数据库操作语言）就是Insert、update等。

呵，我是记得到被思必驰狠狠虐过，固态硬盘做RAID阵列和分库分表记得最熟了。

MySQL的高可用知道多少？MMM、MHA架构熟悉吗？（日了狗，我又不是DBA，只听说过，又没做过）

答：只知道一主多从中，对从集群的HAProxy+Keepalived架构。

27、Linux Bridge与Open Vswitch有什么区别？（这段时间我没有全身心放在openstack上，知识尚缺，以后还会补充）

答：（1）基于vlan的隔离方式不同，ovs使用flow rule实现外部vlan以及内部vlan的转换

（2）iptables只能用于linux bridage而非OVS bridge，linux bridge 不支持GRE，但OVS支持。

（3）OVS的patch port用来连接集成网桥br-int和隧道网桥br-tun，而linux bridage使用veth对连接br-int和外部网桥br-eth1

（4）OVS的功能应该强于Linux Bridge，否则官网使用Linux Bridge，但是很多企业都用的是OVS。根据测试结果，Linux Bridge的性能（如网络吞吐量、虚拟之间的文件传输速度）略强于OVS。

（5）OVS 将各种功能都原生地实现在其中，而Linux Bridge依赖各种其他模块来实现各种功能。

参考文档：http://www.cnblogs.com/sammyliu/p/4985907.html

28、数据包流过OVS的过程？（先来个很简单的印象吧，其实OVS的很多桥还是比较麻烦的，脑壳里一定要想那个拓扑图）

答：1 VM实例instance的网络协议栈产生一个数据包并发送至实例内的虚拟网络接口VNIC，就是instance中的eth0.

2 这个数据包会传送到物理节点上的VNIC接口，就是vnet接口。

3 数据包从vnet NIC出来，到达桥（虚拟交换机）br100上.

4 数据包经过交换机的处理，从物理节点上的物理接口发出，如物理节点上的eth0.

5 数据包从eth0出去的时候，是按照物理节点上的二层交换机以及默认网关操作的，这个时候该数据包其实已经不受OVS的控制了

29、python要求输入一个列表，其中值为整数，输出为偶数，并且偶数所在的索引值也是偶数，例：输入[1,3,2,5,4,6]，输出[2,4]

答：这个最大问题是要求随机输入，那么输入的列表就变成字符串型了，必须想个办法替换掉列表外边的单引号，使用eval方法

list1 = eval（input("请输入一个列表：")) ##如果不加eval.那么list1就是<str>类型的。

list2 = [] ##eval将字符串str当成有效的表达式来求值并返回计算结果

def fun(list1):

count = len(list1)

for i in range(count):

if list1[i] % 2 == 0 and i%2 == 0:

list2.append(list1[i])

print ('输出后的列表是：',list2)

return list2

fun(list1)

30、分析简单代码，求输出结果。

class p(object):

attr = 'a'

class c1(p):

pass

class c2(p):

attr = 'd'

class c3(p):

pass

print ('第1次',p.attr,c1.attr,c2.attr)

c1.attr = 'b'

print ('第2次',p.attr,c1.attr,c2.attr)

p.attr= 'c'

print ('第3次',p.attr,c1.attr,c2.attr,c3.attr)

答：#第1次 a a d

#第2次 a b d

#第3次 c b d c

上一篇：Devops（1）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯