1. 进程阻塞的原因不包括________。

正确答案: A    你的答案: D    (错误)            

时间片切换

等待I/O

进程sleep

等待解锁

回答:

进程有3个状态:就绪态。执行态、阻塞态。三种状态的转换包含有:

就绪->执行,执行->就绪,执行->阻塞,阻塞->就绪

等待I/O、进程sleep、等待解锁等原因都会导致进程暂停。关于"时间片切换",当进程已经获得了除cpu外所有的资源,这时的状态就是就绪态,当分配到了时间片就成了执行态,当时间片用完之前一直未进入阻塞态的话,此后便继续进入就绪态。所以进程的就绪与阻塞是完全不同的。


2. 设只含根节点的二叉树高度为1,现有一颗高度为h(h>1)的二叉树上只有出度为0和出度为2的结点,则此二叉树中所包含的结点数至少为________个。

正确答案: B 你的答案: A    (错误)            

2^h-1

2h-1

2h

2h+1

回答:

要保证高度最高,那么只要每次向最左边(或者向最右边延伸),保证其(唯一一个)出度为2.

那么除了根节点那一层只有一个节点外,余下的每一层都有两且仅有个节点。


3. 某地电信局要对业务号码进行梳理,需要检测开通的市话号码是否存在某一个是另一个的前缀的情况,以简化电话交换机的逻辑。例如:某用户号码是“11001100”,但与"110"报警电话产生前缀配对。已知市话号码最长8位,最短3位,并且所有3位的电话号码都以1开头。由于市话号码众多,长度也未必一直,高效的算法可以用O(n)的时间复杂度完成检测(n为开通市话号码个数,数量是千万级的)。那么,该算法最坏情况下需要耗费大约________内存空间。

正确答案: C 你的答案:  D   (错误)            

5GB

500MB

50MB

5MB

回答:

千万级,也就是10,000,000。市话最长8位,也就是一个字节的空间,那么全部存下这些号码所耗费的空间为:1B*1000*1000*10  = 10MB(不必纠结1000还是1024,只要代表了千万级的数量就行了)。所以是两位数的级别。


4. 给定一个m行n列的整数矩阵(如图),每行从左到右和每列从上到下都是有序的。判断一个整数k是否在矩阵中出现的最优算法,在最坏情况下的时间复杂度是________。

正确答案:  B  你的答案:   A   (错误)            

O(m*n)

O(m+n)

O(log(m*n))

O(log(m+n))

回答:

杨氏矩阵查找算法

<ol style="color: rgb(92, 92, 92);">
     
    <li style="color: inherit;">
        <span style="color: black;"><span style="color: rgb(46, 139, 87); font-weight: bold;">bool stepWise(<span style="color: rgb(46, 139, 87); font-weight: bold;">int mat[][N_MAX], <span style="color: rgb(46, 139, 87); font-weight: bold;">int N, <span style="color: rgb(46, 139, 87); font-weight: bold;">int target,  
     
 
     
        <span style="color: black;">              <span style="color: rgb(46, 139, 87); font-weight: bold;">int &row, <span style="color: rgb(46, 139, 87); font-weight: bold;">int &col) {  
     
 
    </span></span></span></span></span></span></span></span><li style="color: inherit;">
        <span style="color: black;">  <span style="color: rgb(0, 102, 153); font-weight: bold;">if (target < mat[0][0] || target > mat[N-1][N-1]) <span style="color: rgb(0, 102, 153); font-weight: bold;">return <span style="color: rgb(0, 102, 153); font-weight: bold;">false;  
     
 
     
        <span style="color: black;">  row = 0;  
     
 
    </span></span></span></span></span><li style="color: inherit;">
        <span style="color: black;">  col = N-1;  
     
 
     
        <span style="color: black;">  <span style="color: rgb(0, 102, 153); font-weight: bold;">while (row <= N-1 && col >= 0) {  
     
 
    </span></span></span><li style="color: inherit;">
        <span style="color: black;">    <span style="color: rgb(0, 102, 153); font-weight: bold;">if (mat[row][col] < target)  
     
 
     
        <span style="color: black;">      row++;  
     
 
    </span></span></span><li style="color: inherit;">
        <span style="color: black;">    <span style="color: rgb(0, 102, 153); font-weight: bold;">else <span style="color: rgb(0, 102, 153); font-weight: bold;">if (mat[row][col] > target)  
     
 
     
        <span style="color: black;">      col--;  
     
 
    </span></span></span></span><li style="color: inherit;">
        <span style="color: black;">    <span style="color: rgb(0, 102, 153); font-weight: bold;">else  
     
 
     
        <span style="color: black;">      <span style="color: rgb(0, 102, 153); font-weight: bold;">return <span style="color: rgb(0, 102, 153); font-weight: bold;">true;  
     
 
    </span></span></span></span></span><li style="color: inherit;">
        <span style="color: black;">  }  
     
 
     
        <span style="color: black;">  <span style="color: rgb(0, 102, 153); font-weight: bold;">return <span style="color: rgb(0, 102, 153); font-weight: bold;">false;  
     
 
    </span></span></span></span><li style="color: inherit;">
        <span style="color: black;">}  
     
 
 
</span></li></ol>

5.某服务请求经负载均衡设备分配到集群A、B、C、D进行处理响应的概率分别是10%、20%、30%和40%。已知测试集群所得的稳定性指标分别是90%、95%、99%和99.9%。现在该服务器请求处理失败,且已排除稳定性以外的问题,那么最有可能在处理该服务请求的集群是________。

正确答案: A    B        你的答案:  A    (错误)            

A

B

C

D

选中该集群,并且处理失败了的概率为:10%*10%、20%*5%、30%*1%、40%*0.1%。A与B的概率最高。


6.以下________状态为TCP连接关闭过程中的出现的状态。

正确答案:  B C    你的答案: D  (错误)            

LISTEN

TIME-WAIT

LAST-ACK

SYN-RECEIVED

回答:

断开连接其实从我的角度看不区分客户端和服务器端,任何一方都可以调用close(or closesocket)之类的函数开始主动终止一个连接。这里先暂时说正常情况。当调用close函数断开一个连接时,主动断开的一方发送FIN(finish报文给对方。有了之前的经验,我想你应该明白我说的FIN报文时什么东西。也就是一个设置了FIN标志位的报文段。FIN报文也可能附加用户数据,如果这一方还有数据要发送时,将数据附加到这个FIN报文时完全正常的。之后你会看到,这种附加报文还会有很多,例如ACK报文。我们所要把握的原则是,TCP肯定会力所能及地达到最大效率,所以你能够想到的优化方法,我想TCP都会想到。                              当被动关闭的一方收到FIN报文时,它会发送ACK确认报文(对于ACK这个东西你应该很熟悉了)。这有个               东西要注意,因为TCP是双工的,也就是说,你可以想象一对TCP连接上有两条数据通路。当发送FIN报文               时,意思是说,发送FIN的一端就不能发送数据,也就是关闭了其中一条数据通路。被动关闭的一端发送               了ACK后,应用层通常就会检测到这个连接即将断开,然后被动断开的应用层调用close关闭连接。            


7.如果在一个排序算法的执行过程中,没有一对元素被比较过两次或以上,则称该排序算法为节俭排序算法,以下算法中是节俭排序算法的有________。

正确答案:  A  D    你的答案:   B    (错误)            

插入排序

选择排序

堆排序

归并排序

回答:

A每个未排序的元素只会与 已经有序的元素进行至多一次比较

D每个有序列表内的元素不进行比较;列表之间的元素比较一次之后就进入了同一个列表


8.请补全下面的快速排序代码,答案中请不要包含空格。

void qsort(int *array, int len)
{
    int value, start, end;
    if (len <= 1) 
        return; 
    value = array[0]; 
    start = 0; 
    end = len - 1; 
    while (start < end) { 
        for (; start < end; --end) { 
            if (array[end] < value) { 
                                             1                                 
                break; 
            } 
        } 
        for (; start < end; ++start) { 
            if (array[start] > value)
            {
                                             2                                
                break;
            }
        }
    }
                                 3                                
    qsort(array,                              4                                );
    qsort(                             5                                ,                              6                                );
}

你的答案   (错误)            

1                    array[0]=array[end];array[end]=value;start++;

参考答案                     array[start++]=array[end];


2                    array[end]=array[start];array[start]=value;end--;

参考答案                     array[end--]=array[start];


3                array[start]=value;


4                    array+start-1

参考答案                     start


5                array+start+1


6                    array+end

参考答案                     len-start-1


9.         图示是一个网络流从s到t的某时刻快照。此时t处一共接收到10+13+16=39单位流量。每条横线上的数字表示当前流量和管道的容量。那么,该网络最大的流量是多少?当这个网络流量最大时,哪几条边是满负荷的(边用两边顶点标识,s3表示从s到3的边,图上的流量和容量表示为10/10)。

笔试2_试题2

解析:最基本的求最大流。可以手动计算,答案为41。可以用最大流模板验证正确性:设s为1,t为8,那么中间结点的实际编号为上图编号+1. 数据如下:
【cpp】view plaincopyprint?
8 15
1 2  11
1 3  22
1 4  10
3 2  6
3 4  4
2 5  18
6 2  7
3 6  17
7 3  6
4 7  16
6 5  15
6 7  5
5 8  10
6 8  16
7 8  16
 
	一种方案为:
 
	1

笔试2_试题2_02


10.         某公司有这么一个规定:只要有一个员工过生日,当天所有员工全部放假一天。但在其余时候,所有员工都没有假期,必须正常上班。假设一年有365天,每个员工的生日都概率均等地分布在这365天里。那么,这个公司需要雇用多少员工,才能让公司一年内所有员工的总工作时间期望值最大?

你的第一感觉或许是,公司应该雇用 100 多人,或者 200 多人吧。答案或许会让你大吃一惊:公司应该雇用 365 个人。注意,雇用 365 个人并不意味着全体员工全年的总工作时间为 0 ,因为 365 个人的生日都是随机的,恰好每天都有一个人过生日的概率极小极小。下面我们就来证明,这个问题的最优解就是 365 人。

由于期望值满足线性关系(即对于随机变量 X 和 Y 有 E(X) + E(Y) = E(X+Y) ),因此我们只需要让每一天员工总工作时间的期望值最大就可以了。假设公司里有 n 个人,那么在特定的一天里,没有人过生日的概率是 (364/365)n 。因此,这一天的期望总工作时间就是 n · (364/365)n 个工作日。为了考察函数 n · (364/365)n 的增减性,我们来看一下 ((n+1) · (364/365)n+1) / (n · (364/365)n) 的值,它等于 (364 · (n+1)) / (365 · n) 。如果分子比分母小,解得 n > 364 。可见,要到 n = 365 以后,函数才是递减的。

答案:365


11.         给定一个排好升序的数组A[1]、A[2]、……、A[n],其元素的值都两两不相等。请设计一高效的算法找出中间所有A[i] = i的下标。并分析其复杂度。(不分析复杂度不得分)

解析:首先分析一下这个数组,假设其中某个位置的A[i] = i,那么可以肯定的值,之前的A[x] > x,之后的A[x] < x。还有一个显而易见的性质就是中间的A[i]=i一定是连续存在的,不可能跨区域存在,因为这个数组是升序的。

我给出的方法是二分查找,具体的做法是:我们假设一个新数组B,其元素是A[i] - i的值,这样的话,B[i] = 0的时候A[i] = i,而且把B数组划分成了三个部分,左边的小于零的区域,中间的等于零的区域,右边的大于零的区域。

我第一次的想法是:二分搜索这个想象中的新数组,找到值为零的下标,但是这个下标不一定是最左边的满足条件的下标,所以我们还需要写一个while来往左移动这个下标,直到找到最左边的符合条件的下标,如下代码(假设已经通过二分查找找到了符合条件的一个下标idx):


while(A[idx-1] == (idx-1))
     idx--;


这样的话其时间复杂度就是O(logn) + O(n),还是属于On)的范畴。

后来我想到,为什么只去随机命中一个目标下标呢!如果二分查找这个数据的边界的话,就能直接得到最左边符合条件的下标了!其实二分查找不仅仅适用于对一个元素的搜索,也可以用于两个、三个特定相对位置元素的搜索。每次查找的时候,假设当前位置是mid,那么只要判断当前A[mid] - mid是否小于零,以及后一个元素A[mid+1] - (mid+1) == 0就行了。

#include  <iostream>  
using namespace std;  
  
int BinarySearch(int cc[], int len)  
{  
   int l = 0, r = len, mid;  
   while (l <= r)  
   {  
      mid = l + ((r-l) >> 1);  
      if(mid == 0 && cc[mid] == mid)   // 若数组一开始就符合条件  
         return 0;  
      // 若满足条件的下标不是从0开始,则边界是前一个<0,且后一个=0  
      if (cc[mid]-mid < 0 && cc[mid+1]-(mid+1) == 0)  
         return mid+1;  
      // 二分查找边界:前一个<0,且后一个=0  
      if (cc[mid] - mid >= 0)  
         r = mid-1;  
      else  
         l = mid+1;  
   }  
   return -1;  
}  
  
int main()  
{  
   // int cc[] = {0, 1};  
   // int cc[] = {0, 1, 2, 3, 4, 5, 6, 7};  
   // int cc[] = {-9, -8, -4, -2, 4, 5, 9};  
   // int cc[] = {-5, -4, -3, 5, 6, 7};  
   int len = sizeof(cc)/sizeof(int);  
   int idx = BinarySearch(cc, len);  
   if(idx != -1)  
   {  
      while(cc[idx] == idx)  
      {  
         printf("%d ", idx);  
         idx++;  
      }  
   }  
   else  
   {  
      printf("Not found\n");  
   }  
  
   getchar();  
   return 0;  
}


OK! 由于程序是原生的二分查找,所以时间复杂度为O(logn),没有占用额外的空间。并且不需要区分正整数还是负整数,数据类型也可以改成double没问题。


12.某怪物被海水冲上一个孤岛。醒来时他发现自己处于险境。周围有N条鳄鱼都虎视眈眈的盯着他。每条鳄鱼看上去都饿得足以把他吞下去。不过,事情也未必真的那么糟糕。鳄鱼吞下他是要花费体力的。这些鳄鱼现在的体力都相当,由于猎食需要花费体力,所以吞下怪物的鳄鱼会由于体力下降而可能被周围的某条鳄鱼吞了。类似的,吞鳄鱼的这条鳄鱼也可能被其他鳄鱼吞了。因此,虽然有食物可猎,但他们自己并不想成为其他鳄鱼的猎食对象。正所谓,螳螂捕蝉,黄雀在后。所以鳄鱼们在确保自己生命安全的情况下才会发动进攻。那么,怪物到底安全么?为什么?

解析:当鳄鱼为偶数的时候,鳄鱼们两两相互制约,只要谁先吃了怪物,那这条鳄鱼就会被吃掉,所以这个时候怪物是安全的。当鳄鱼为奇数的时候,当第一条鳄鱼吃掉了怪物而变得虚弱时,剩下的鳄鱼们为偶数,两两相互制约,谁也不能吃这个吃了怪物的鳄鱼,所以第一个动手的是安全的,既然这样谁都想第一个动手,所以这个时候怪物就完蛋了。


13.         当你在浏览器输入一个网址,如http://www.taobao.com,按回车之后发生了什么?请从技术的角度描述,如浏览器、网络(UDP、TCP、HTTP等),以及服务器等各种参与对象上由此引发的一系列活动,请尽可能的涉及到所有的关键技术点。

解析:首先你输入了一个网址并按下了回车,这个时候浏览器会根据这个URL去查找其对应的IP,具体过程如下:

首先是查找浏览器缓存,浏览器会保存一段时间你之前访问过的一些网址的DNS信息,不同浏览器保存的时常不等。

如果没有找到对应的记录,这个时候浏览器会尝试调用系统缓存来继续查找这个网址的对应DNS信息。

如果还是没找到对应的IP,那么接着会发送一个请求到路由器上,然后路由器在自己的路由器缓存上查找记录,路由器一般也存有DNS信息。

如果还是没有,这个请求就会被发送到ISP(注:Internet Service Provider,互联网服务提供商,就是那些拉网线到你家里的运营商,中国电信中国移动什么的),ISP也会有相应的ISP DNS服务器,一听中国电信就知道这个DNS服务器的规模肯定不会小,所以基本上都能在这里找得到。题外话:会跑到这里进行查询是因为你没有改动过"网络中心"的"ipv4"的DNS地址,万恶的电信联通可以改动了这个DNS服务器,换句话说他们可以让你的浏览器跳转到他们设定的页面上,这也就是人尽皆知的DNS和HTTP劫持,ISP们还美名曰“免费推送服务”。强烈鄙视这种霸王行为。我们也可以自行修改DNS服务器来防止DNS被ISP污染。

如果还是没有的话, 你的ISP的DNS服务器会将请求发向根域名服务器进行搜索。根域名服务器就是面向全球的顶级DNS服务器,共有13台逻辑上的服务器,从A到M命名,真正的实体服务器则有几百台,分布于全球各大洲。所以这些服务器有真正完整的DNS数据库。如果到了这里还是找不到域名的对应信息,那只能说明一个问题:这个域名本来就不存在,它没有在网上正式注册过。或者卖域名的把它回收掉了(通常是因为欠费)。 这也就是为什么打开一个新页面会有点慢,因为本地没什么缓存,要这样递归地查询下去。

多说一句,例如"mp3.baidu.com",域名先是解析出这是个.com的域名,然后跑到管理.com域名的服务器上进行进一步查询,然后是.baidu,最后是mp3, 所以域名结构为:三级域名.二级域名.一级域名。

浏览器终于得到了IP以后,浏览器接着给这个IP的服务器发送了一个http请求,方式为get,例如访问nbut.cn

 笔试2_试题2_03

这个get请求包含了主机(host)、用户代理(User-Agent),用户代理就是自己的浏览器,它是你的"代理人",Connection(连接属性)中的keep-alive表示浏览器告诉对方服务器在传输完现在请求的内容后不要断开连接,不断开的话下次继续连接速度就很快了。其他的顾名思义就行了。还有一个重点是Cookies,Cookies保存了用户的登陆信息,在每次向服务器发送请求的时候会重复发送给服务器。Corome上的F12与Firefox上的firebug(快捷键shift+F5)均可查看这些信息。

发送完请求接下来就是等待回应了,如下图:

笔试2_试题2_04

当然了,服务器收到浏览器的请求以后(其实是WEB服务器接收到了这个请求,WEB服务器有iis、apache等),它会解析这个请求(读请求头),然后生成一个响应头和具体响应内容。接着服务器会传回来一个响应头和一个响应,响应头告诉了浏览器一些必要的信息,例如重要的Status Code,2开头如200表示一切正常,3开头表示重定向,4开头,如404,呵呵。响应就是具体的页面编码,就是那个......,浏览器先读了关于这个响应的说明书(响应头),然后开始解析这个响应并在页面上显示出来。在下一次CF的时候(不是穿越火线,是http://codeforces.com/),由于经常难以承受几千人的同时访问,所以CF页面经常会出现崩溃页面,到时候可以点开火狐的firebug或是Chrome的F12看看状态,不过这时候一般都急着看题和提交代码,似乎根本就没心情理会这个状态吧-.-。

如果是个静态页面,那么基本上到这一步就没了,但是如今的网站几乎没有静态的了吧,基本全是动态的。所以这时候事情还没完,根据我们的经验,浏览器打开一个网址的时候会慢慢加载这个页面,一部分一部分的显示,直到完全显示,最后标签栏上的圈圈就不转了。

笔试2_试题2_05

这是因为,主页(index)页面框架传送过来以后,浏览器还要继续向服务器发送请求,请求的内容是主页里面包含的一些资源,如图片,视频,css样式等等。这些"非静态"的东西要一点点地请求过来,所以标签栏转啊转,内容刷啊刷,最后全部请求并加载好了就终于好了。

笔试2_试题2_06

需要说明的是,对于静态的页面内容,浏览器通常会进行缓存,而对于动态的内容,浏览器通常不会进行缓存。缓存的内容通常也不会保存很久,因为难保网站不会被改动。