题目:

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

  • void addNum(int num) - 从数据流中添加一个整数到数据结构中。
  • double findMedian() - 返回目前所有元素的中位数。

示例:


addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3) 
findMedian() -> 2


进阶:

  1. 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
  2. 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?

思路:

如果把一个数组升序排列之后,我们把这个从中间分成长度差不大于1的两部分,元素小的记作数组1,元素大的记作数组2

如果两个子数组等长,那么中位数就是数组1的最大值和数组2的最小值的加和/2。可以理解成中位数左边和右边抠出同样数量的元素。

如果子数组不等长,那么中位数就是两个字数组中较长的哪一个元素的最大/最小值。

有了上述的推断,我们就可以通过两个堆来实现了,一个最小堆模拟上述中的数组1,最大堆模拟上述中的数组2,需要维护二者长度差值不大于1。

java代码:

class MedianFinder {

    //中位数为前半部分的最大值,后半部分的最小值;堆实现,两个堆大小差值不超过1

        PriorityQueue<Integer> maxQueue;
        PriorityQueue<Integer> minQueue;
        /** initialize your data structure here. */
        public MedianFinder() {
            maxQueue = new PriorityQueue<>((a,b)->b-a);
            minQueue = new PriorityQueue<>();
        }
        public void addNum(int num) {
            if(maxQueue.isEmpty() || num<=maxQueue.peek()){
                   maxQueue.add(num);
            }else{
                minQueue.add(num);
            }
            if(maxQueue.size()==minQueue.size()+2){
                minQueue.add(maxQueue.poll());
            }
            if(minQueue.size()==maxQueue.size()+2){
                maxQueue.add(minQueue.poll());
            }
        }

        public double findMedian() {
            if(maxQueue.size()==minQueue.size()){
                return (double)(maxQueue.peek()+minQueue.peek())/2;
            }else{
                if(maxQueue.size()>minQueue.size()){
                    return maxQueue.peek();
                }else {
                    return minQueue.peek();
                }
            }
        }
    }