排序算法

搜索是计算机中非常重要的步骤,但是从无序的数据中寻找特定的数字往往很难,我们之前提到的二分查找只能运用在排好序的数组中。所以排序算法是一个很重要的工作,如果我们能够将数值排好序,那么当我们寻找特定数值的时候,能省下不少功夫。

排序算法有很多,每种排序算法各有优缺点:

Image result for sorting algorithms complexity

在这章节中,我们就来学习其中最经典的三种排序方法:插入排序Insertion Sort,快排Quick Sort,归并排序Merge Sort。

插入排序 Insertion Sort

概念

插入排序是一种简单直观的排序算法。在插入排序中,我们从前到后依次处理未排好序的元素,对于每个元素,我们将它与之前排好序的元素进行比较,找到对应的位置后并插入。本质上,对于每一个要被处理的元素,我们只关心它与之前元素的关系,当前元素之后的元素我们下一轮才去处理。

在实现上,每个元素和之前元素比较的过程,是一个从后到前扫描的过程。在扫描时,我们将已排好序的元素先后挪位,为新的元素提供插入位置。这也叫做 in-place 排序,这样我们就不需要额外的内存空间了。

具体步骤

  1. 从第二个元素(第一个要被排序的新元素)开始,从后向前扫描之前的元素序列
  2. 如果当前扫描的元素大于新元素,将扫描元素移动到下一位
  3. 重复步骤2,直到找到一个小于或者等于新元素的位置
  4. 将新元素插入到该位置
  5. 对于之后的元素重复步骤1~4

伪代码 pseudo code

function insertion_sort(array[]):
    for (i = 1; i < array.length; i++):
        cur = array[i]
        j = i - 1
        while (j >= 0 && array[j] > cur):
            array[j + 1] = array[j]
            j--
        array[j + 1] = cur

Java 实现

public void insertionSort(int[] array) {
    for(int i = 1; i < array.length; i++) {
        int cur = array[i];
        int insertionIndex = i - 1;
        while(insertionIndex >= 0 && array[insertionIndex] > cur) {
            array[insertionIndex + 1] = array[insertionIndex];
            insertionIndex--;
        }
        array[insertionIndex + 1] = cur;
    }
}

复杂度分析

时间复杂度:O(n²)
空间复杂度:O(1)

「时间复杂度」在此算法中就是计算比较的次数,第一个元素我们需要比较1次,第二个元素2次,对于第n个元素,我们需要和之前的元素比较n次,比较总数量也就是 1 + 2 + … + n = n(n + 1) / 2
≈ n^2。因为我们调换位置时采用「原地操作」(in place),所以不需要额外空间,既空间复杂度为O(1)。

快排 QuickSort

概念

快排是一种分治(Divide and Conquer)算法,在这种算法中,我们把大问题变成小问题,然后将小问题逐个解决,当小问题解决完时,大问题也迎刃而解。

快排的基本概念就是选取一个目标元素,然后将目标元素放到数组中正确的位置。然后根据排好序后的元素,将数组切分为两个子数组,用相同的方法,在没有排好序的范围使用相同的操作。

Image result for quicksort

具体步骤

  1. 对于当前的数组,取最后一个元素当做基准数(pivot)
  2. 将所有比基准数小的元素排到基准数之前,比基准数大的排在基准数之后
  3. 当基准数被放到准确的位置之后,根据基数数的位置将元素切分为前后两个子数组
  4. 对子数组采用步骤1~4的递归操作,直到子数组的长度小于等于1为止

伪代码(Pseudo code)

function quickSort(array[], left, right):
    partitionIndex = partition(array, left, right)
    quickSort(array, left, partitionIndex - 1)
    quickSort(array, partitionIndex + 1, right)

function partition(array[], left, right):
    pivot = array[right]
    smallerElementIndex = left
    biggerElementIndex = right - 1
    while(true):
        while(smallerElementIndex < right && array[smallerElementIndex] <= pivot):
            smallerElementIndex++
        while(biggerElementIndex >= left && array[biggerElementIndex] > pivot):
            rightIndex--
        if(smallerElementIndex > biggerElementIndex) break
        swap(array, smallerElementIndex, biggerElementIndex)
    # Now array[smallerElementIndex] is the first element bigger than pivot
    swap(array, smallerElementIndex, right)
    return smallerElementIndex

Java实现

public void quickSort(int[] array, int left, int right) {
    if(left >= right) return;
    int partitionIndex = partition(array, left, right);
    quickSort(array, left, partitionIndex - 1);
    quickSort(array, partitionIndex + 1, right);
}
public int partition(int[] array, int left, int right) {
    int pivot = array[right];
    int leftIndex = left;
    int rightIndex = right - 1;
    while(true) { 
        while(leftIndex < right & array[leftIndex] <= pivot) {
            leftIndex++;
        }
        while(rightIndex >= left && array[rightIndex] > pivot) {
            rightIndex--;
        }
        if (leftIndex > rightIndex) break;
        swap(array, leftIndex, rightIndex);
    }
    swap(array, leftIndex, right); // swap pivot to the right position
    return leftIndex;
}
public void swap(int[] array, int left, int right) {
    int temp = array[left];
    array[left] = array[right];
    array[right] = temp;
}

复杂度分析

时间复杂度:O(n^2),平均时间复杂度:O(nlogN)
空间复杂度:O(n),平均空间复杂度:O(logN)

在最坏的情况下,如果元素一开始就是从大到小倒序排列的,那么我们每个元素都需要调换,时间复杂度就是O(n^2)。当正常情况下,我们不会总碰到这样的情况,假设我们每次都找到一个中间的基准数,那么我们需要切分logN次,每层的划分(Partition)是O(N),平均时间复杂度就是O(nlogN)。空间的复杂度取决于递归的层数,最糟糕的情况我们需要O(N)层,一般情况下,我们认为平均时间复杂度是O(logN)。

归并排序 MergeSort

概念

归并排序也是一种基于归并操作的有效排序算法。在此算法中,我们将一个数组分为两个子数组,通过递归重复将数组切分到只剩下一个元素为止。然后将每个子数组中的元素排序后合并,通过不断合并子数组,最后就会拿到一个排好序的大数组。

归并排序和快排一样,也是一种分而治之算法,简单理解就是将大问题变为小问题,然后把所有小问题都解决掉,大问题就迎刃而解了。其中主要包括两个步骤:

  1. 切分步骤:将大问题变为小问题,通过递归解决更小的子问题。
  2. 解决步骤:将小问题的结果合并,以此找到大问题的答案。

以数组 [38, 27, 43, 3, 9, 82, 10] 为例,我们通过递归分组,之后原数组被分成长度小于等于2的子数组:

[38, 27], [43, 3], [9, 82], [10]

并将子数组中的元素排序好:

[27, 28], [3, 43], [9, 82], [10]

然后两两合并,归并成排好序的子数组:

[3, 27, 38, 43], [9, 10, 82]

最后将子数组合并为一个排好序的大数组:

[3, 9, 10, 27, 38, 43, 82]
File:Merge sort algorithm diagram.svg

递归具体步骤

  1. 递归切分当前数组
  2. 如果当前数组数量小于等于1,无需排序,直接返回结果
  3. 否则将当前数组分为两个子数组,递归排序这两个子数组
  4. 在子数组排序结束后,将子数组的结果归并成排好序的数组

伪代码 Pseudocode

function mergeSort(array[], start, end):
    if (end - start < 1) return
    mid = (start + end) / 2
    mergeSort(array, start, mid)
    mergeSort(array, mid + 1, end);
    merge(array, start, mid, end)

function merge(array[], start, mid, end):
    helper[] = array.copy()
    leftStart = start, rightStart = mid + 1
    while(leftStart <= mid || rightStart <= end):
        if(helper[leftStart] <= helper[rightStart]):
            array[start++] = helper[leftStart++]
        else:
            array[start++] = helper[rightStart++]
    if(leftStart <= mid): 
        while(leftStart <= mid):
            array[start++] = helper[leftStart++]
    else:
        while(rightStart <= end):
            array[start++] = helper[rightStart++]

Java实现

public void mergeSort(int[] array) {
    int[] helper = copy(array);
    mergeSort(array, helper, 0, array.length - 1);
    return array;
}
public void mergeSort(int[] array, int[] helper, int left, int right) {
    if(right - left < 1) return;
    int mid = left + (right - left) / 2;
    mergeSort(array, helper, left, mid);
    mergeSort(array, helper, mid + 1, right);
    merge(array, helper, left, mid, right);
}
public void merge(int[] array, int[] helper, int left, int mid, int right) {
    for(int i = left; i <= right; i++) {
        helper[i] = array[i];
    }
    int leftStart = left;
    int rightStart = mid + 1;
    for (int i = left; i <= right; i++) { 
        if (leftStart > mid) {   
            array[i] = helper[rightStart++];
        } else if (rightStart > right) {
            array[i] = helper[leftStart++];
        } else if (helper[leftStart] < helper[rightStart]) {
            array[i] = helper[leftStart++];
        } else {
            array[i] = helper[rightStart++];
        }
     }
}
public int[] copy(int[] array) {
     int[] newArray = new int[array.length];
     for(int i = 0; i < array.length; i++) { 
         newArray[i] = array[i];
     }
     return newArray;
}

复杂度分析

时间:O(nlogN)
空间:O(N)

在将大问题切分为小问题的过程中,我们每次都将数组切一半,所以需要logN次才能将数组切到一个元素,所以递归的层级就是logN。在每一层中,我们要对子数组进行归并,我们要扫描所有的元素,所以每一层需要N次扫描。那么,时间复杂度就是层级乘以每层的操作 = logN * N = O(NLogN)。在每一层中,我们需要一个临时的数组来存放原先的数据,然后在这个数组中扫描子数组的元素,并将其排好序放回原来的数组,所以空间复杂度就是O(N)。

Leetcode 实践练习

以下是Leetcode中和排序相关的题目:

  1. Sort an Array (912)
  2. Sort Colors (75)
  3. Merge Sorted Array (88)