前言
本文重点讲解十大经典排序算法的归并排序
要点
归并排序(Merge Sort)是建立在归并操作上的一种有效的排序算法。
算法是采用分治法(Divide and Conquer)的一个非常典型的应用,且各层分治递归可以同时进行。
将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。
若将两个有序表合并成一个有序表,称为二路归并。
归并排序思路简单,速度仅次于快速排序,为稳定排序算法,一般用于对总体无序,但是各子项相对有序的数列。
基本思想
归并排序是用分治思想,分治模式在每一层递归上有三个步骤:
- 分解(Divide):将n个元素分成个含n/2个元素的子序列。
- 解决(Conquer):用合并排序法对两个子序列递归的排序。
- 合并(Combine):合并两个已排序的子序列已得到排序结果.
执行步骤
- 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
- 设定两个指针,最初位置分别为两个已经排序序列的起始位置
- 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
- 重复步骤3直到某一指针超出序列尾
- 将另一序列剩下的所有元素直接复制到合并序列尾
代码实现
以下代码由java实现
public class MergeSort {
/**
* 初始化
* @param sourceArray
* @param n
* @return
*/
public static int[] init(int[] sourceArray, int n) {
if (n <= 0) {
return null;
}
// 创建一个辅助数组
int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);
sort(sourceArray, arr, 0, arr.length - 1);
return arr;
}
/**
* 归并排序
* @param sourceArray
* @param arr
* @param low
* @param high
*/
public static void sort(int[] sourceArray, int[] arr, int low, int high) {
if (low < high) {
int mid = (low + high) / 2;
// 递归划分左半区
sort(sourceArray, arr, low, mid);
// 递归划分右半区
sort(sourceArray, arr, mid + 1, high);
// 合并排序数据
merge(sourceArray, arr, low, mid, high);
}
}
/**
* 合并排序数据
* @param sourceArray
* @param arr
* @param low
* @param mid
* @param high
*/
public static void merge(int[] sourceArray, int[] arr, int low, int mid, int high) {
// 左半区的第一个坐标
int firstLeft = low;
// 右半区的第一个坐标
int firstRight = mid + 1;
// 临时数组下标
int i = low;
// 合并
while (firstLeft <= mid && firstRight <= high) {
if (sourceArray[firstLeft] <= sourceArray[firstRight]) {
// 第一个左边元素更小
arr[i++] = sourceArray[firstLeft++];
} else {
// 第一个右边元素更小
arr[i++] = sourceArray[firstRight++];
}
}
// 合并左边剩余元素
while (firstLeft <= mid) {
arr[i++] = sourceArray[firstLeft++];
}
// 合并右边剩余元素
while (firstRight <= high) {
arr[i++] = sourceArray[firstRight++];
}
while (low <= high) {
sourceArray[low] = arr[low];
low++;
}
}
public static void main(String[] args) {
int[] arr = {9, 5, 3, 6, 8, 1, 2, 3, 11, 52, 32, 11, 23};
System.out.println(Arrays.toString(init(arr, arr.length)));
}
}
时间复杂度
归并排序比较占用内存,但却是一种效率高且稳定的算法。
不管元素在什么情况下都要做这些步骤,所以花销的时间是不变的,所以该算法的最优时间复杂度和最差时间复杂度及平均时间复杂度都是一样的为:$O(nlogn)$。
改进归并排序在归并时先判断前段序列的最大值与后段序列最小值的关系再确定是否进行复制比较。
如果前段序列的最大值小于等于后段序列最小值,则说明序列可以直接形成一段有序序列不需要再归并,反之则需要。
所以在序列本身有序的情况下时间复杂度可以降至$O(n)$。
空间复杂度
归并的空间复杂度就是那个临时的数组和递归时压入栈的数据占用的空间:n + logn;所以空间复杂度为: $O(n)$。
稳定性
归并排序算法中,归并最后到底都是相邻元素之间的比较交换,并不会发生相同元素的相对位置发生变化,故是稳定性算法。