十大经典排序算法-堆排序


前言

本文重点讲解十大经典排序算法的堆排序

要点

堆排序是由1991年的计算机先驱奖获得者、斯坦福大学计算机科学系教授罗伯特.弗洛伊德(Robert W.Floyd)和威廉姆斯(J.Williams)在1964年共同发明。
堆排序(Heap Sort),是指利用堆这种数据结构所设计的一种排序算法,堆是一个近似完全二叉树的结构,并同时满足堆积的性质。
堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。

基本思想

将待排序序列构造成一个大顶堆(或小顶堆),此时整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。
然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值,如此反复执行,便能得到一个有序序列了。

基本操作

在堆的数据结构中,堆中的最大值总是位于根节点(在优先队列中使用堆的话堆中的最小值位于根节点)。
最大堆调整(Max Heapify):将堆的末端子节点作调整,使得子节点永远小于父节点。
创建最大堆(Build Max Heap):将堆中的所有数据重新排序。
堆排序(HeapSort):移除位在第一个数据的根节点,并做最大堆调整的递归运算。

代码实现

以下代码由java实现

public class HeapSort {

    /**
     * 堆排序
     * @param arr
     * @return
     */
    public static int[] sort(int[] arr, int n) {
        if (n <= 0) {
            return null;
        }
        int i;
        // 建堆 (i等于根节点(最顶父节点))
        for (i = n / 2 - 1; i >= 0; i--) {
            heapify(arr, n, i);
        }
        // 排序
        for (i = n - 1; i > 0; i--) {
            swap(arr, i, 0);
            heapify(arr, i, 0);
        }
        return arr;
    }

    /**
     * 维护堆的性质
     * @param arr
     * @param n
     * @param i
     * @return
     */
    public static void heapify(int[] arr, int n, int i) {
        int largest = i;
        int lson = i * 2 + 1;
        int rson = lson + 1;

        if (lson < n && arr[largest] < arr[lson]) {
            largest = lson;
        }
        if (rson < n && arr[largest] < arr[rson]) {
            largest = rson;
        }
        if (largest != i) {
            // 左右节点有比largest大,进行交换
            swap(arr, largest, i);
            // 递归维护堆的性质
            heapify(arr, n, largest);
        }
    }

    /**
     * 交换位置
     */
    public static void swap(int[] arr, int low, int high) {
        int temp = arr[low];
        arr[low] = arr[high];
        arr[high] = temp;
    }

    public static void main(String[] args) {
        int[] arr = {9, 5, 3, 6, 8, 1, 2, 3, 11, 52, 32, 11, 23};
		System.out.println(Arrays.toString(sort(arr, arr.length)));
    }
}

时间性能

堆排序是一种选择排序,整体主要由构建初始堆+交换堆顶元素和末尾元素并重建堆两部分组成。
其中构建初始堆经推导复杂度为$O(n)$。
在交换并重建堆的过程中,需交换n-1次,而重建堆的过程中,根据完全二叉树的性质,[log2(n-1),log2(n-2)…]逐步递减,近似为$O(nlogn)$。
所以堆排序时间复杂度一般认为就是$O(nlogn)$级。

空间复杂度

堆排序每次只对一个元素操作,是就地排序,所以空间复杂度为:$O(1)$。

稳定性

堆排序构建完堆后会进行首位交换,是最大或者是最小的放在最后,所以堆排序是一种不稳定排序算法。


文章作者: Baymax
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Baymax !
评论
  目录