题目链接:Median of Two Sorted Arrays

There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

这道题的要求是在两个有序数组中找到中位数(两个数组合并之后的中位数)。

直接思路,从前往后合并数组,直到第(m+n)/2+1个元素为止。不过时间复杂度是线性的(O(n)),不满足要求的O(log(m+n))。

将问题转化一下,转变成一个寻找第k小数的问题(假设两个原序列升序排列),这样中位数实际上是第(m+n)/2+1小的数或者是第(m+n)/2和第(m+n)/2+1小的数的均值。

首先假设k为偶数并且数组A和B的元素个数都大于k/2,比较A[k/2-1]和B[k/2-1]两个元素,这两个元素分别表示A的第k/2小的元素和B的第k/2小的元素。这两个元素比较共有三种情况:=和<、>:

  • 当A[k/2-1]=B[k/2-1]时,则已经找到了第k小的数,即这个相等的元素。由于在A和B中分别有k/2-1个元素小于这个数,所以这个数就是第k小的数。
  • 当A[k/2-1]<B[k/2-1]时,这表示A[0]到A[k/2-1]的元素都在A和B合并之后的前k小的元素中。换句话说,A[k/2-1]不可能大于两数组合并之后的第k小值,所以可以将其舍弃。
  • 当A[k/2-1]>B[k/2-1]时存在类似的结论。

实际上,由于k可能为奇数,而且数组A中元素个数可能小于k/2,则可以采用先求k/2与m的小的数值,然后用k减去这个数获得另一个数。

通过上面的分析,可以采用递归的方式实现寻找第k小的数。此外还需要考虑几个边界条件:

  • 如果A或者B为空,则直接返回B[k-1]或者A[k-1];
  • 如果k为1,则只需要返回A[0]和B[0]中的较小值;
  • 如果A[k/2-1]=B[k/2-1],则返回其中任意一个。

时间复杂度:O(log(m+n))

空间复杂度:O(log(m+n))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
class Solution
{
public:
    double findMedianSortedArrays(int A[], int m, int B[], int n)
    {
        int k = m + n;
        if(k % 2 == 1)
            return findKth(A, m, B, n, k / 2 + 1);
        else
            return (findKth(A, m, B, n, k / 2) + findKth(A, m, B, n, k / 2 + 1)) / 2.0;
    }
private:
    int findKth(int a[], int m, int b[], int n, int k)
    {
        if(m > n) // 保证a长度小于等于b长度,即m <= n
            return findKth(b, n, a, m, k);
        
        if(m == 0)
            return b[k - 1];
        
        if(k == 1)
            return min(a[0], b[0]);
        
        int pa = min(k / 2, m), pb = k - pa;
        if(a[pa - 1] == b[pb - 1])
            return a[pa - 1];
        else if(a[pa - 1] < b[pb - 1])
            return findKth(a + pa, m - pa, b, n, k - pa);
        else
            return findKth(a, m, b + pb, n - pb, k - pb);
    }
};

不知什么时候,LeetCode的函数接口换了,下面为采用vector实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
class Solution
{
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2)
    {
        int n = nums1.size() + nums2.size();
        if(n % 2 == 1)
            return findKth(nums1, 0, nums2, 0, n / 2 + 1);
        else
            return (findKth(nums1, 0, nums2, 0, n / 2) + 
                    findKth(nums1, 0, nums2, 0, n / 2 + 1)) / 2.0;
    }
private:
    int findKth(vector<int>& nums1, int b1, vector<int>& nums2, int b2, int k)
    {
        if(nums1.size() - b1 > nums2.size() - b2)
            return findKth(nums2, b2, nums1, b1, k);
        
        if(nums1.size() - b1 == 0)
            return nums2[b2 + k - 1];
        
        if(k == 1)
            return min(nums1[b1], nums2[b2]);
        
        int k1 = min(k / 2, (int)nums1.size() - b1), k2 = k - k1;
        if(nums1[b1 + k1 - 1] == nums2[b2 + k2 - 1])
            return nums1[b1 + k1 - 1];
        else if(nums1[b1 + k1 - 1] < nums2[b2 + k2 - 1])
            return findKth(nums1, b1 + k1, nums2, b2, k - k1);
        else
            return findKth(nums1, b1, nums2, b2 + k2, k - k2);
    }
};