关于后端:归并排序详解及应用

读完本文，你不仅学会了算法套路，还能够顺便去 LeetCode 上拿下如下题目：

912. 排序数组（中等）

315. 计算右侧小于以后元素的个数（艰难）

-----------

始终都有很多读者说，想让我用框架思维讲一讲根本的排序算法，我感觉的确得讲讲，毕竟学习任何货色都讲求一个死记硬背，只有对其本质进行比拟粗浅的了解，能力运用自如。

本文就先讲归并排序，给一套代码模板，而后讲讲它在算法问题中的利用。浏览本文前我心愿你读过前文手把手刷二叉树（纲领篇）。

我在手把手刷二叉树（第一期）讲二叉树的时候，提了一嘴归并排序，说归并排序就是二叉树的后序遍历，过后就有很多读者留言说醍醐灌顶。

晓得为什么很多读者遇到递归相干的算法就感觉烧脑吗？因为还处在「看山是山，看水是水」的阶段。

就说归并排序吧，如果给你看代码，让你脑补一下归并排序的过程，你脑子里会呈现什么场景？

这是一个数组排序算法，所以你脑补一个数组的 GIF，在那一个个替换元素？如果是这样的话，那格局就低了。

但如果你脑海中浮现出的是一棵二叉树，甚至浮现出二叉树后序遍历的场景，那格局就高了，大概率把握了我常常强调的框架思维，用这种形象能力学习算法就省劲多了。

那么，归并排序明明就是一个数组算法，和二叉树有什么关系？接下来我就具体讲讲。

算法思路

就这么说吧，所有递归的算法，你甭管它是干什么的，实质上都是在遍历一棵（递归）树，而后在节点（前中后序地位）上执行代码，你要写递归算法，实质上就是要通知每个节点须要做什么。

你看归并排序的代码框架：

// 定义：排序 nums[lo..hi]void sort(int[] nums, int lo, int hi) {    if (lo == hi) {        return;    }    int mid = (lo + hi) / 2;    // 利用定义，排序 nums[lo..mid]    sort(nums, lo, mid);    // 利用定义，排序 nums[mid+1..hi]    sort(nums, mid + 1, hi);    /****** 后序地位 ******/    // 此时两部分子数组曾经被排好序    // 合并两个有序数组，使 nums[lo..hi] 有序    merge(nums, lo, mid, hi);    /*********************/}// 将有序数组 nums[lo..mid] 和有序数组 nums[mid+1..hi]// 合并为有序数组 nums[lo..hi]void merge(int[] nums, int lo, int mid, int hi);

看这个框架，也就明确那句经典的总结：归并排序就是先把左半边数组排好序，再把右半边数组排好序，而后把两半数组合并。

上述代码和二叉树的后序遍历很像：

/* 二叉树遍历框架 */void traverse(TreeNode root) {    if (root == null) {        return;    }    traverse(root.left);    traverse(root.right);    /****** 后序地位 ******/    print(root.val);    /*********************/}

再进一步，你联想一下求二叉树的最大深度的算法代码：

// 定义：输出根节点，返回这棵二叉树的最大深度int maxDepth(TreeNode root) {    if (root == null) {        return 0;    }    // 利用定义，计算左右子树的最大深度    int leftMax = maxDepth(root.left);    int rightMax = maxDepth(root.right);    // 整棵树的最大深度等于左右子树的最大深度取最大值，    // 而后再加上根节点本人    int res = Math.max(leftMax, rightMax) + 1;    return res;}

是不是更像了？

前文手把手刷二叉树（纲领篇）说二叉树问题能够分为两类思路，一类是遍历一遍二叉树的思路，另一类是合成问题的思路，根据上述类比，显然归并排序利用的是合成问题的思路（分治算法）。

归并排序的过程能够在逻辑上形象成一棵二叉树，树上的每个节点的值能够认为是 nums[lo..hi]，叶子节点的值就是数组中的单个元素：

而后，在每个节点的后序地位（左右子节点曾经被排好序）的时候执行 merge 函数，合并两个子节点上的子数组：

这个 merge 操作会在二叉树的每个节点上都执行一遍，执行程序是二叉树后序遍历的程序。

后序遍历二叉树大家应该曾经烂熟于心了，就是下图这个遍历程序：

联合上述根本剖析，咱们把 nums[lo..hi] 了解成二叉树的节点，srot 函数了解成二叉树的遍历函数，整个归并排序的执行过程就是以下 GIF 形容的这样：

这样，归并排序的外围思路就剖析完了，接下来只有把思路翻译成代码就行。

代码实现及剖析

只有领有了正确的思维形式，了解算法思路是不艰难的，但把思路实现成代码，也很考验一个人的编程能力。

毕竟算法的工夫复杂度只是一个实践上的衡量标准，而算法的理论运行效率要思考的因素更多，比方应该防止内存的频繁调配开释，代码逻辑应尽可能简洁等等。

通过比照，《算法 4》中给出的归并排序代码兼具了简洁和高效的特点，所以咱们能够参考书中给出的代码作为归并算法模板：

class Merge {    // 用于辅助合并有序数组    private static int[] temp;    public static void sort(int[] nums) {        // 先给辅助数组开拓内存空间        temp = new int[nums.length];        // 排序整个数组（原地批改）        sort(nums, 0, nums.length - 1);    }    // 定义：将子数组 nums[lo..hi] 进行排序    private static void sort(int[] nums, int lo, int hi) {        if (lo == hi) {            // 单个元素不必排序            return;        }        // 这样写是为了避免溢出，成果等同于 (hi + lo) / 2        int mid = lo + (hi - lo) / 2;        // 先对左半局部数组 nums[lo..mid] 排序        sort(nums, lo, mid);        // 再对右半局部数组 nums[mid+1..hi] 排序        sort(nums, mid + 1, hi);        // 将两局部有序数组合并成一个有序数组        merge(nums, lo, mid, hi);    }    // 将 nums[lo..mid] 和 nums[mid+1..hi] 这两个有序数组合并成一个有序数组    private static void merge(int[] nums, int lo, int mid, int hi) {        // 先把 nums[lo..hi] 复制到辅助数组中        // 以便合并后的后果可能间接存入 nums        for (int i = lo; i <= hi; i++) {            temp[i] = nums[i];        }        // 数组双指针技巧，合并两个有序数组        int i = lo, j = mid + 1;        for (int p = lo; p <= hi; p++) {            if (i == mid + 1) {                // 左半边数组已全副被合并                nums[p] = temp[j++];            } else if (j == hi + 1) {                // 右半边数组已全副被合并                nums[p] = temp[i++];            } else if (temp[i] > temp[j]) {                nums[p] = temp[j++];            } else {                nums[p] = temp[i++];            }        }    }}

有了之前的铺垫，这里只须要着重讲一下这个 merge 函数。

sort 函数对 nums[lo..mid] 和 nums[mid+1..hi] 递归排序实现之后，咱们没有方法原地把它俩合并，所以须要 copy 到 temp 数组外面，而后通过相似于前文单链表的六大技巧中合并有序链表的双指针技巧将 nums[lo..hi] 合并成一个有序数组：

留神咱们不是在 merge 函数执行的时候 new 辅助数组，而是提前把 temp 辅助数组 new 进去了，这样就防止了在递归中频繁调配和开释内存可能产生的性能问题。

再说一下归并排序的工夫复杂度，尽管大伙儿应该都晓得是 O(NlogN)，但不见得所有人都晓得这个复杂度怎么算进去的。

前文动静布局详解说过递归算法的复杂度计算，就是子问题个数 x 解决一个子问题的复杂度。对于归并排序来说，工夫复杂度显然集中在 merge 函数遍历 nums[lo..hi] 的过程，但每次 merge 输出的 lo 和 hi 都不同，所以不容易直观地看出工夫复杂度。

merge 函数到底执行了多少次？每次执行的工夫复杂度是多少？总的工夫复杂度是多少？这就要联合之前画的这幅图来看：

执行的次数是二叉树节点的个数，每次执行的复杂度就是每个节点代表的子数组的长度，所以总的工夫复杂度就是整棵树中「数组元素」的个数。

所以从整体上看，这个二叉树的高度是 logN，其中每一层的元素个数就是原数组的长度 N，所以总的工夫复杂度就是 O(NlogN)。

力扣第 912 题「排序数组」就是让你对数组进行排序，咱们能够间接套用归并排序代码模板：

class Solution {    public int[] sortArray(int[] nums) {        // 归并排序对数组进行原地排序        Merge.sort(nums);        return nums;    }}class Merge {    // 见上文}

其余利用

除了最根本的排序问题，归并排序还能够用来解决力扣第 315 题「计算右侧小于以后元素的个数」：

拍脑袋的暴力解法就不说了，嵌套 for 循环，平方级别的复杂度。

这题和归并排序什么关系呢，次要在 merge 函数，咱们在合并两个有序数组的时候，其实是能够晓得一个数字 x 后边有多少个数字比 x 小的。

具体来说，比方这个场景：

这时候咱们应该把 temp[i] 放到 nums[p] 上，因为 temp[i] < temp[j]。

但就在这个场景下，咱们还能够晓得一个信息：5 前面比 5 小的元素个数就是 j 和 mid + 1 之间的元素个数，即 2 个。

换句话说，在对 nuns[lo..hi] 合并的过程中，每当执行 nums[p] = temp[i] 时，就能够确定 temp[i] 这个元素前面比它小的元素个数为 j - mid - 1。

当然，nums[lo..hi] 自身也只是一个子数组，这个子数组之后还会被执行 merge，其中元素的地位还是会扭转。但这是其余递归节点须要思考的问题，咱们只有在 merge 函数中做一些手脚，叠加每次 merge 时记录的后果即可。

发现了这个法则后，咱们只有在 merge 中增加两行代码即可解决这个问题，看解法代码：

class Solution {    private class Pair {        int val, id;        Pair(int val, int id) {            // 记录数组的元素值            this.val = val;            // 记录元素在数组中的原始索引            this.id = id;        }    }        // 归并排序所用的辅助数组    private Pair[] temp;    // 记录每个元素前面比本人小的元素个数    private int[] count;        // 主函数    public List<Integer> countSmaller(int[] nums) {        int n = nums.length;        count = new int[n];        temp = new Pair[n];        Pair[] arr = new Pair[n];        // 记录元素原始的索引地位，以便在 count 数组中更新后果        for (int i = 0; i < n; i++)            arr[i] = new Pair(nums[i], i);                // 执行归并排序，本题后果被记录在 count 数组中        sort(arr, 0, n - 1);                List<Integer> res = new LinkedList<>();        for (int c : count) res.add(c);        return res;    }        // 归并排序    private void sort(Pair[] arr, int lo, int hi) {        if (lo == hi) return;        int mid = lo + (hi - lo) / 2;        sort(arr, lo, mid);        sort(arr, mid + 1, hi);        merge(arr, lo, mid, hi);    }        // 合并两个有序数组    private void merge(Pair[] arr, int lo, int mid, int hi) {        for (int i = lo; i <= hi; i++) {            temp[i] = arr[i];        }                int i = lo, j = mid + 1;        for (int p = lo; p <= hi; p++) {            if (i == mid + 1) {                arr[p] = temp[j++];            } else if (j == hi + 1) {                arr[p] = temp[i++];                // 更新 count 数组                count[arr[p].id] += j - mid - 1;            } else if (temp[i].val > temp[j].val) {                arr[p] = temp[j++];            } else {                arr[p] = temp[i++];                // 更新 count 数组                count[arr[p].id] += j - mid - 1;            }        }    }}

因为在排序过程中，每个元素的索引地位会一直扭转，所以咱们用一个 Pair 类封装每个元素及其在原始数组 nums 中的索引，以便 count 数组记录每个元素之后小于它的元素个数。

你当初回头领会下我在本文结尾说那句话：

所有递归的算法，实质上都是在遍历一棵（递归）树，而后在节点（前中后序地位）上执行代码。你要写递归算法，实质上就是要通知每个节点须要做什么。

有没有品出点滋味？

最初总结一下吧，本文从二叉树的角度讲了归并排序的外围思路和代码实现，同时讲了一道归并排序相干的算法题。这道算法题其实就是归并排序算法逻辑中夹杂一点私货，但依然属于比拟难的，你可能须要亲自做一遍能力了解。

那我最初留一个思考题吧，下一篇文章我会讲疾速排序，你是否可能尝试着从二叉树的角度去了解疾速排序？如果让你用一句话总结疾速排序的逻辑，你怎么形容？

好了，答案下篇文章揭晓。

点击我的头像查看更多优质算法文章，手把手带你刷力扣，致力于把算法讲清楚！我的算法教程曾经取得 100k star，欢送点赞！