一,题目

在校园招聘的季节里,为了能让学生们更好地了解微软亚洲研究院各研究组的情况,HR部门计划为每一个研究组举办一次见面会,让各 个研究组的员工能跟学生相互了解和交流。已知有n位学生,他们分别对m个研究组中的若干个感兴趣。为了满足所有学生的要求,HR希望每 个学生都能参加自己感兴趣的所有见面会。如果每个见面会的时间为t,那么,如何安排才能够使得所有见面会的总时间最短? 最简单的办法,就是把m个研究组的见面会时间依次排开,那我们就要用m * t的总时间,我们有10多个研究小组,时间会拖得很长,能否进一步提高效率?

二,分析

此题的官方解法是将问题转化为一个已知的图的问题:即图的最少着色问题。 但有两点感觉不太好:


  • 一是这个问题的转换感觉角度有些大,不够平滑。 如果此前没听过图的最少着色问题,那么是怎么也不可能想到这儿的。
  • 二是关于此题的分析与解法讲解非常笼统,尤其是解法,寥寥数语就完了 - 我觉得是没有把问题讲清楚的 - 虽然读者自己可以阅读“ 图的最少着色问题”来获得更多的了解,但既然此题作为单独的一题存在,我觉得还是讲清楚点好。

另外,自己思考了一下,觉的此题不转化成图的最少着色问题,通过简单的递归,应该也是可以实现的。

思路分析

已知有n位学生,m个见面会,且每个学生可以选择参加任意多个见面会。我们的目的是在没有冲突的情况下把某几个见面会的时间重叠起来,同时开。何为冲突,比如学生甲参加了见面会A与B,那么A与B就是冲突的,因为如果同时开的话,学生甲必然要放弃一个。

那么,我们可以按以下方式,逐个考虑见面会:


  • 对于见面会A,因为其前面没有见面会,略过;
  • 对于见面会B,考虑它和其前面的见面会A是否冲突,如果不冲突,就将B和A合并,继续考虑C;而另外还有一个分支是不管是否冲突,此时不做合并,直接考虑C;
  • 对于见面会C,考虑它和其前面的见面会A,B是否冲突,第一个分支是如果与A不冲突, 就将C和A合并,继续考虑D;第二个分支是如果与B不冲突, 就将C和B合并,继续考虑D;而第三格分支还是不做任何合并,直接考虑D
  • 按此规则继续对下一个见面会做考察
  • 当对最后一个招聘会做完考察后,记下其时间,程序然后递归回溯,会由其他分支继续考察最后一个招聘会,比较并记录最短的那个,这样,当所有的分支都考察过后,记录的那个最短时间就是全局最短的时间了。

代码


  • 输入数据可以用一个二维数组input[m][n]来表示,行表示见面会,列表示学生,数组元素表示某学生是否参加该见面会。
  • 递归过程用当前考虑的见面会控制,当最后一个见面会考虑完之后,就得到一个候选解,程序然后回溯,从另一分支再次进入,考虑最后一个见面会,与之前的候选解比较,保存较优的那个:候选解包括见面会时间与当前的具体安排


复杂度分析

      可以注意到,我们需要逐个考虑见面会,一共是m个;而在考虑第i个见面会时,我们最多可能会产生出i个分支,不难看出,总问题的规模为m!;

而产生每个分支时需要做的计算是O(n)的冲突检测与合并,于是,整个的算法复杂度为:O(m! * n)


#include <iostream> 2 #include <list> 3 #include <vector> 4 5  using namespace std; 6 7  // If 2 recruiting meetings are conflicting 8  bool IsConflict(const vector<bool>& v1, const vector<bool>& v2) 9 { 10     for(int i = 0; i < v1.size(); ++i) 11    { 12         if(v1[i] && v2[i]) return true; 13    } 14     return false; 15 } 16 17  // merge 2 recruiting meetings: v2 will be held at the same time of v1 18  void Merge(vector<bool>& v1, const vector<bool>& v2) 19 { 20      for(int i = 0; i < v1.size(); ++i) 21      { 22          v1[i] = v1[i] || v2[i]; 23      } 24 } 25 26  // input: input[m][n], 2d array to represents students' selection of meetings.  row stands for meetings, column stands for students, 27 // and array value stands for if a student select a meeting 28 // next: The meeting to check 29 // curTime: Time required so far 30 // curArrangement: record the information of which meeting is merged with another meeting 31 // best[output]:The best time 32 // bestArrangement[output] : The best arragement 33 void ArrangeRecruitings(vector<vector<bool> >& input, int next,            int& curTime, vector<list<int> >& curArrangement, int& bestTime,            vector<list<int> >& bestArrangement) 34 { 35        int m = input.size(); 36       // base cases 37       if(next >= m) 38      { 39      // Save the best one 40      if(curTime < bestTime) 41           { 42                 bestTime = curTime; 43                 bestArrangement = curArrangement; 44            } 45 46       return; 47        } 48       else 49       { 50       // recursive cases 51       for(int i = 0; i <= next; ++i) 52      { 53 54       if(curArrangement[i].empty()) continue; // if already merged with other ones, just skip it 55 56       if (!IsConflict(input[i], input[next])) 57       { 58 59           // update the status 60            vector<bool> bkI = input[i]; 61          Merge(input[i], input[next]); 62 63           curArrangement[next].pop_back(); 64           curArrangement[i].push_back(next); 65 66           // Consider next one after merge 67          ArrangeRecruitings(input, next+1, curTime, curArrangement, bestTime, bestArrangement); 68 69         // restore the status 70        curArrangement[i].pop_back(); 71        curArrangement[next].push_back(next); 72 73       input[i] = bkI; 74      } 75   } 76 77      // Consider next one without any merge 78      ArrangeRecruitings(input, next+1, ++curTime, curArrangement, bestTime, bestArrangement); 79 80   } 81 } 82 83 84 int main() 85 { 86     // 1. Initializing 87    int m = 3; 88    int n = 4; 89 90     vector<vector<bool> > input(m, vector<bool>(n, false)); 91 92     input[0][0] = true; 93     input[0][1] = true; 94 95     input[1][1] = true; 96     input[1][2] = true; 97 98     input[2][2] = true; 99     input[2][3] = true; 100 101    //input[0][2] = true; 102 103     int curTime = 1; 104     int bestTime = m+1; 105     vector<list<int> > curArrangement(m); 106     vector<list<int> > bestArrangement(m); 107      for(int i = 0; i < m; ++i) curArrangement[i].push_back(i); 108 109      // 2. Solve 110     ArrangeRecruitings(input, 1, curTime, curArrangement, bestTime, bestArrangement); 111 112     // 3. Output the result 113    cout << "Totoal Time: " << bestTime << endl; 114     for(int i = 0; i < m; ++i) 115    { 116    cout << i << "): "; 117    if(bestArrangement[i].empty()) 118    { 119         cout << "none" << endl; 120          continue; 121    } 122    for(list<int>::const_iterator it = bestArrangement[i].begin(); it != bestArrangement[i].end(); ++it) 123    cout << *it << "-"; 124 125      cout << endl; 126      } 127 }





三,第二种解决方法


寻找活动集合S的最大相互兼容集合的方法[2],在《算法导论》贪心算法一章中有详细的讲解。解决此问题的具体步骤可总结为:

1)把面试集合S中的元素按其结束时间的递增顺序排列;

2)求其最大相互兼容面试集合M,并从原始集合S中删除之;

3)求集合S-M的最大相互兼容面试集合Q,并从集合S-M中删除之。重复此过程直到原始面试集合S中为空集为止;

4)统计求出的最大相互兼容面试集合的个数,即是面试集合S所需的最少面试点个数。

以上面的面试集合S为例,上述步骤用图像表示如下:每个图中用矩形框起来的面试为所属集合的最大相互兼容集合,一共有5个,即至少需要5个面试点。



四,扩展问题一:


实际上就是求区间的最大重叠次数。书上P57的算法,比较巧妙,但要注意的是:排序时要用到双关键字比较,当两个值相等时,属于时间段开始的一定要排在属于时间段结束的后面,只有这样才能保证结果的正确性。(假设[3, 4)和[4, 5)能在同一个地方举行。书上区间段都是用闭区间,本文采用前闭后开。)


考虑到面试安排的时间一般安排在某个整点、半点或者某刻,可以采用计数的方法,如果都安排在整点,每处理一个区间[a, b),就对[a, b)间的所有整数计数一次。最后从计数结果中找出最大值即可。时间复杂度为O(n)(准确的讲,应该是O(k*n),k为区间的最大间隔,k<=24)。如果面试安排时间在某个半点、刻,可以对原来的时间乘以一个整数(比如2或4,这实际上就是桶排序设置桶间隔为0.5或0.25)。


//arr[][0]为面试开始时间,arr[][1]为面试结束时间 int max_places (int arr[][2], size_t sz) {   if (arr==NULL || sz<1) return 0;    const size_t MAX_HOURS=24;   int count[MAX_HOURS]={0};    int max=0, j=0;    size_t i=0;   for (i=0; i<sz; ++i)     for (j=arr[i][0]; j<arr[i][1]; ++j) ++count[j];   for (i=0; i<MAX_HOURS; ++i)     if (count[i]>max) max=count[i];   return max; }