关于python:四千字总结实现所有面试会考的排序算法基于Python实现

排序算法

个别排序算法最常考的：疾速排序和归并排序。这两个算法体现了分治算法的外围观点，而且还有很多出题的可能。

1. 常见的排序算法

排序算法很多，除了能写出常见排序算法的代码，还须要理解各种排序的时空复杂度、稳定性、应用场景、区别等。

1.1 抉择排序

1.1.1 思维

对于给定的一组序列，第一轮比拟抉择最小（或最大）的值，而后将该值与索引第一个进行替换；接着对不包含第一个确定的值进行第二次比拟，抉择第二个记录与索引第二个地位进行替换，反复到只剩最初一个记录地位。

案例：幼儿园排队，老师先让站成一队，带第一个小朋友依此跟其余小朋友一一比拟，选出个子最矮的，而后依此进行

1.1.2 实现

def selection_sort(gList):
    """抉择排序
    :param gList: 给定的一组序列
    :return: 返回排好序的序列
    """
    length = len(gList)
    for i in range(length - 1):
        flag = i
        for j in range(i+1, length):
            if gList[flag] > gList[j]:
                flag = j
        # 如果最小值的索引与最小值绝对应，则无需再次替换
        if flag != i:
            gList[flag], gList[i] = gList[i], gList[flag]

    return gList

1.1.3 抉择排序剖析

**工夫复杂度：**最好、最坏、均匀的工夫复杂度都为 O ( n 2 ) O(n^2) O(n2)
空间复杂度: O ( 1 ) O(1) O(1)
**稳定性：**不稳固

1.2 冒泡排序

1.2.1 思维

对于给定的一组序列含n个元素，从第一个开始对相邻的两个记录进行比拟，当后面的记录大于前面的记录，替换其地位，进行一轮比拟和换位之后，最大记录在第n个地位；而后对前（n-1）个记录进行第二轮比拟；反复该过程直到进行比拟的记录只剩下一个时为止。

案例：冒泡，像气泡一样往上升

1.2.2 实现

def bubble_sort(gList):
    """冒泡排序"""
    length = len(gList)
    for i in range(length):
        for j in range(i+1, length):
            if gList[i] > gList[j]:
                gList[i], gList[j] = gList[j], gList[i]
    return gList

1.2.3 冒泡排序剖析

工夫复杂度：
- 最好工夫复杂度： O ( n ) O(n) O(n)
- 最坏工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 均匀工夫复杂度: O ( n 2 ) O(n^2) O(n2)
空间复杂度: O ( 1 ) O(1) O(1)
**稳定性：**稳固的排序

1.3 插入排序

1.3.1 思维

对于给定的一组记录，初始时假如第一个记录自成一个有序序列，其余的记录为无序序列；接着从第二个记录开始，依照记录的大小顺次将以后解决的记录插入到其之前的有序序列中，直至最初一个记录插入到有序序列中为止。

案例：抓扑克牌

1.3.2 实现

def insertion_sort(gList):
    """插入排序"""
    length = len(gList)
    for i in range(1, length):
        temp = gList[i]  # 以后的待插入的值
        j = i - 1  # 前一个值
        while j >= 0:
            if gList[j] > temp:
                gList[j+1] = gList[j]  # 插入的动作
                gList[j] = temp  # 插入结束
            j -= 1
    return gList

1.3.3 插入排序剖析

工夫复杂度
- 最好工夫复杂度： O ( n ) O(n) O(n)
- 最坏工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 均匀工夫复杂度: O ( n 2 ) O(n^2) O(n2)
空间复杂度: O ( 1 ) O(1) O(1)
**稳定性：**稳固的排序

1.4 归并排序 ☆☆★

1.4.1 思维

利用递归与分治技术将数据序列划分成为越来越小的半子表，再对半子表排序，最初再用递归步骤将排好序的半子表合并成为越来越大的有序序列。其中“归”代表的是递归的意思，即递归地将数组折半地拆散为单个数组。

给定一组序列含n个元素，首先将每两个相邻的长度为1的子序列进行归并，失去n/2（向上取整）个长度为2或1的有序子序列，再将其两两归并，重复执行此过程，直到失去一个有序序列为止。

1.4.2 实现

def merge_sort(gList: list) -> list:
    """归并排序
    :param gList: 给定序列
    :return: 升序排列后的汇合
    """

    def merge(left: list, right: list) -> list:
        """merge left and right
        :param left: left list
        :param right: right list
        :return: merge reslut
        """
        i, j = 0, 0
        result = []
        while i < len(left) and j < len(right):
            if left[i] <= right[j]:
                result.append(left[i])
                i += 1
            else:
                result.append(right[j])
                j += 1
        result += left[i:]
        result += right[j:]
        return result

    if len(gList) <= 1:
        return gList
    num = len(gList) // 2
    left = merge_sort(gList[:num])
    right = merge_sort(gList[num:])
    return merge(left, right)


if __name__ == '__main__':
    gList = [3, 5, 2, 4, 1]
    print("----排序前:", gList)
    print("----归并排序后: ", merge_sort(gList))

1.4.3 归并排序剖析

工夫复杂度: 最好、最坏和均匀状况 O ( n l o g n ) O(nlogn) O(nlogn)
空间复杂度: O ( n ) O(n) O(n)
稳定性:稳固

题目：100个有序数列如何合成一个大数组？

1.5 疾速排序☆★★

1.5.1 思维

高效的排序算法，它采纳**“分而治之”的思维，把大的拆分为小的，小的再拆分为更小的。其原理**是：对于一组给定的记录，通过一趟排序后，将原序列分为两局部，其中前局部的所有记录均比后局部的所有记录小，而后再顺次对前后两局部的记录进行疾速排序，递归该过程，直到序列中的所有记录均有序为止。

1.5.2 实现

# -*- coding: utf-8 -*-

def quick_sort(gList, left=0, right=None) -> list:
    """疾速排序
    :param gList: 给定一组序列
    :param left:
    :param right:
    :return: 升序排序后的序列
    """
    if right is None:
        right = len(gList)-1

    if left > right:
        return gList

    key = gList[left]
    low = left
    high = right

    while left < right:
        while left < right and gList[right] >= key:
            right -= 1
        gList[left] = gList[right]

        while left < right and gList[left] <= key:
            left += 1
        gList[right] = gList[left]
    gList[right] = key
    quick_sort(gList, low, left-1)
    quick_sort(gList, left+1, high)
    return gList


if __name__ == '__main__':
    gList = [3, 5, 2, 4, 1, 6, 7]
    print("----排序前:", gList)
    print("----疾速排序后: ", quick_sort(gList))

1.5.3 疾速排序剖析

工夫复杂度：
- 最坏工夫复杂度： O ( n 2 ) O(n^2) O(n2)
- 最好工夫复杂度： O ( n l o g n ) O(nlogn) O(nlogn)
- 均匀工夫复杂度: O ( n l o g n ) O(nlogn) O(nlogn)
空间复杂度： O ( l o g n ) O(logn) O(logn)
稳定性：不稳固

扩大：随机快排

1.6 希尔排序

1.6.1 思维

希尔排序也称为“放大增量排序”。它的基本原理是：首先将待排序的元素分成多个子序列，使得每个子序列的元素个数绝对较少，对各个子序列别离进行间接插入排序，待整个待排序序列“根本有序后”，再对所有元素进行一次间接插入排序。

1.6.2 实现

# -*- coding: utf-8 -*-
def shell_sort(gList) -> list:
    """希尔排序"""
    length = len(gList)
    step = 2
    group = length // step
    while group > 0:
        for startPos in range(group):
            gap_insertion_sort(gList, startPos, group)
        group = group // 2
    return gList


def gap_insertion_sort(gList, start, gap):
    for i in range(start+gap, len(gList), gap):
        curr_value = gList[i]
        pos = i

        while pos >= gap and gList[pos-gap] > curr_value:
            gList[pos] = gList[pos-gap]
            pos = pos - gap
        gList[pos] = curr_value


if __name__ == '__main__':
    gList = [5, 4, 2, 1, 7, 3, 6]
    print("-----yuzhou1su-----", gList)
    print("-----希尔排序后:", shell_sort(gList))

1.6.3 希尔排序剖析

工夫复杂度：
- 最好工夫复杂度： O ( n ) O(n) O(n)
- 最坏工夫复杂度： O ( n s ) ( 1 < s < 2 ) O(n^s)(1<s<2) O(ns)(1<s<2)
- 均匀工夫复杂度： O ( n l o g n ) O(nlogn) O(nlogn)
空间复杂度: O ( 1 ) O(1) O(1)
稳定性: 不稳固

1.7 堆排序

堆是一种非凡的树形数据结构，其每个结点都有一个值，通常提到的堆都是指一棵齐全二叉树，根结点的值小于（或大于）两个子结点的值，同时根结点的两个子树也别离是一个堆。

1.7.1 算法思维：

对于给定的序列，初始把这些记录看成一刻顺序存储的二叉树，而后将其调整为一个大顶堆，而后将堆的最初一个元素与堆顶元素进行替换后，堆的最初一个元素即为最大记录；接着将前(n-1)个元素从新调整为一个大顶堆，在将堆顶元素与以后堆的最初一个元素进行替换后失去次大的记录，反复该过程直到调整的堆中只剩一个元素为止，该记录即为最小记录，此时可失去一个有序序列。

过程：1. 构建堆；2. 替换堆顶元素与最初一个元素的地位

1.7.2 实现

def heapify(unsorted, index, heap_size):
    largest = index
    left_index = 2 * index + 1
    right_index = 2 * index + 2
    if left_index < heap_size and unsorted[left_index] > unsorted[largest]:
        largest = left_index

    if right_index < heap_size and unsorted[right_index] > unsorted[largest]:
        largest = right_index

    if largest != index:
        unsorted[largest], unsorted[index] = unsorted[index], unsorted[largest]
        heapify(unsorted, largest, heap_size)


def heap_sort(unsorted):
    """堆排序"""
    length = len(unsorted)
    for i in range(length // 2 - 1, -1, -1):
        heapify(unsorted, i, length)
    for i in range(length - 1, 0, -1):
        unsorted[0], unsorted[i] = unsorted[i], unsorted[0]
        heapify(unsorted, 0, i)
    return unsorted


if __name__ == '__main__':
    gList = [5, 4, 2, 1, 7, 3, 6]
    print("-----yuzhou1su-----", gList)
    print("-----堆排序后:", heap_sort(gList))

1.7.3 堆排序剖析

**工夫复杂度：**次要消耗在创立堆和重复调整堆上，最坏状况下，工夫复杂度也为 O ( n l o g n ) O(nlogn) O(nlogn)

**稳定性：**不稳固

1.8 计数排序

1.8.1 算法思维

对于某种整数K，计数排序假设每个元素都是1到K范畴内的整数。计数排序的根本思维是为每个输出元素x确定小于x的元素数量，此信息可用于间接将其搁置在正确的地位。例如，如果10个元素小于x，则x属于输入中的地位11。

1.8.2 实现

# -*- coding: utf-8 -*-
# @Time      : 2020-09-10 14:31
# @Author    : yuzhou_1su
# @ContactMe : https://blog.csdn.net/yuzhou_1shu
# @File      : counting_sort.py
# @Software  : PyCharm


def counting_sort(unsorted):
    """计数排序
    :param unsorted：给定一组序列
    :return: 升序序列
    """
    if unsorted is []:
        return []
    # 依据给定序列求信息
    coll_len = len(unsorted)
    coll_max = max(unsorted)
    coll_min = min(unsorted)

    # 创立计数数组
    counting_arr_length = coll_max + 1 - coll_min
    counting_arr = [0] * counting_arr_length

    # 计数操作
    for number in unsorted:
        counting_arr[number - coll_min] += 1

    # 将每个地位与它的前一个相加。counting_arr[i]统计出多少个
    # element <= i的元素
    for i in range(1, counting_arr_length):
        counting_arr[i] = counting_arr[i] + counting_arr[i - 1]

    # 创立保留升序后果的数组
    ordered = [0] * coll_len
    for i in reversed(range(0, coll_len)):
        ordered[counting_arr[unsorted[i] - coll_min] - 1] = unsorted[i]
        counting_arr[unsorted[i] - coll_min] -= 1

    return ordered


if __name__ == '__main__':
    gList = [5, 4, 2, 1, 3, 6]
    print("-----yuzhou1su：", gList)
    print("-----计数排序后:", counting_sort(gList))

1.8.3 计数排序剖析

工夫复杂度: O ( n ) i f K = O ( n ) O(n)\quad if\ K = O(n) O(n)if K=O(n)

空间复杂度： O ( n ) i f K = O ( n ) O(n)\quad if\ K = O(n) O(n)if K=O(n)

Ps: 如果K特地大，工夫复杂度会很高；如果面试官让你设计数据规模小的线性排序算法，可能就是考查计数排序

1.9 桶排序

1.9.1 算法思维

桶排序是计数排序的升级版。它利用了函数的映射关系，高效与否的要害就在于这个映射函数的确定。为了使桶排序更加高效，咱们须要做到这两点：

在额定空间短缺的状况下，尽量增大桶的数量
应用的映射函数可能将输出的 N 个数据平均的调配到 K 个桶中

1.9.2 实现

# -*- coding: utf-8 -*-
# @Time      : 2020-09-10 15:30
# @Author    : yuzhou_1su
# @ContactMe : www.yuzhou_1su@163.com
# @File      : bucket_sort.py
# @Software  : PyCharm
import math


def insertion_sort(collection):
    for i in range(1, len(collection)):
        temp = collection[i]
        index = i
        while index > 0 and temp < collection[index - 1]:
            collection[index] = collection[index-1]
            index -= 1
        collection[index] = temp


def bucket_sort(collection):
    code = hashing(collection)
    buckets = [list() for _ in range(code[1])]
    for i in collection:
        x = rehashing(i, code)
        buck = buckets[x]
        buck.append(i)

    for bucket in buckets:
        insertion_sort(bucket)

    ndx = 0
    for buc in range(len(buckets)):
        for val in buckets[buc]:
            collection[ndx] = val
            ndx += 1
    return collection


def hashing(collection):
    m = collection[0]
    for i in range(1, len(collection)):
        if m < collection[i]:
            m = collection[i]
    result = [m, int(math.sqrt(len(collection)))]
    return result


def rehashing(i, code):
    return int(i / code[0] * (code[1] - 1))


if __name__ == '__main__':
    gList = [5, 4, 2, 1, 3, 6]
    print("-----yuzhou1su：", gList)
    print("-----桶排序后:", bucket_sort(gList))

1.9.3 桶排序剖析

工夫复杂度: O ( n ) O(n) O(n)
空间复杂度: O ( n ) O(n) O(n)

1.10 基数排序

1.10.1 算法思维

与计数排序/桶排序相似，基数排序跟输出元素相干。比方：依据基数d对给定序列进行排序，这意味着所有的数字都是d位数。过程：

取每个元素的最低无效位
依据该数字对元素列表进行排序，但放弃雷同数字的元素程序
用更高无效位反复排序，直到最高位

1.10.2 实现

def radix_sort(unsorted):
    radix = 10
    max_len = False
    tmp, placement = -1, 1
    while not max_len:
        max_len = True
        buckets = [list() for _ in range(radix)]
        for i in unsorted:
            tmp = int(i / placement)
            buckets[tmp % radix].append(i)
            if max_len and tmp > 0:
                max_len = False
        a = 0
        for b in range(radix):
            buck = buckets[b]
            for i in buck:
                unsorted[a] = i
                a += 1
        # move to next digit
        placement *= radix
    return unsorted


if __name__ == '__main__':
    gList = [5, 4, 2, 1, 3, 6]
    print("-----yuzhou1su：", gList)
    print("-----基数排序后:", radix_sort(gList))

1.10.3 基数排序剖析

基数排序实用于位数小的数字序列。

工夫复杂度: O ( n l o g ( r ) m ) O(nlog(r)\ m) O(nlog(r) m)，其中r为所采取的基数，而m为堆数
稳定性：稳固

1.11 其余排序

拓扑排序：在一个有向图中，对所有的节点进行排序，要求没有一个节点指向它后面的节点。
内部排序：大文件的排序，即待排序的记录存储在外存储器上，待排序的文件无奈一次装入内存，须要在内存和内部存储器之间进行屡次数据交换，以达到排序整个文件的目标。
位图排序：当待排序数据规模较大，而堆内存大小又没有限度时，位图排序则最高效。
Tim-sort：Python的list规范排序算法，由Tim Peters设计。实质上是一种自下而上的归并排序，利用一些数据的初始运行，之后进行额定的插入排序。Tim-sort也成为Java7中数组排序的默认算法。

2. 各种排序算法比拟？

依据上图总结：

不稳固算法有：抉择、疾速、希尔、堆

记忆口诀：快选七(希)堆不稳固
工夫复杂度 O ( n 2 ) O(n^2) O(n2)：抉择、冒泡、插入
工夫复杂度 O ( n l o g n ) O(nlogn) O(nlogn)：疾速、归并、堆、希尔
工夫复杂度 O ( n ) O(n) O(n)：计数、桶
空间复杂度 O ( 1 ) O(1) O(1)：抉择、插入、冒泡、希尔、堆
空间复杂度 O ( n ) O(n) O(n)：归并、计数、桶
空间复杂度 O ( l o g n ) O(logn) O(logn)：疾速排序

3.总结

肯定要依据数据的规模、法则来给出适合的算法，不能感觉疾速排序名字就认为是疾速的，切记不能什么排序问题都答复快排。

尽管插入排序和冒泡排序平均速度较慢，但当初始序列整体或部分有序时，这两者效率较高
排序数据较小，且不要求稳固的状况下，抉择排序效率较高；要求稳固，抉择冒泡排序。
堆排序在更大的序列上往往优于疾速排序和归并排序。
针对小数据谋求线性工夫复杂度，思考计数排序和桶排序
除了下面几种常见的排序算法，还有泛滥其余排序算法，每种排序算法都有其最佳实用场合。具体情况具体分析。

最初，感激大家浏览。我是yuzhou_1su，一个头发比想法多的钻研僧。

如果感觉文章还不错，请肯定帮忙点个赞。谢谢