排序算法
个别排序算法最常考的:疾速排序和归并排序。这两个算法体现了分治算法的外围观点,而且还有很多出题的可能。
1. 常见的排序算法
排序算法很多,除了能写出常见排序算法的代码,还须要理解各种排序的时空复杂度、稳定性、应用场景、区别等。
1.1 抉择排序
1.1.1 思维
对于给定的一组序列,第一轮比拟抉择最小(或最大)的值,而后将该值与索引第一个进行替换;接着对不包含第一个确定的值进行第二次比拟,抉择第二个记录与索引第二个地位进行替换,反复到只剩最初一个记录地位。
案例:幼儿园排队,老师先让站成一队,带第一个小朋友依此跟其余小朋友一一比拟,选出个子最矮的,而后依此进行
1.1.2 实现
def selection_sort(gList): """抉择排序 :param gList: 给定的一组序列 :return: 返回排好序的序列 """ length = len(gList) for i in range(length - 1): flag = i for j in range(i+1, length): if gList[flag] > gList[j]: flag = j # 如果最小值的索引与最小值绝对应,则无需再次替换 if flag != i: gList[flag], gList[i] = gList[i], gList[flag] return gList
1.1.3 抉择排序剖析
- **工夫复杂度:**最好、最坏、均匀的工夫复杂度都为 O ( n 2 ) O(n^2) O(n2)
- 空间复杂度: O ( 1 ) O(1) O(1)
- **稳定性:**不稳固
1.2 冒泡排序
1.2.1 思维
对于给定的一组序列含n个元素,从第一个开始对相邻的两个记录进行比拟,当后面的记录大于前面的记录,替换其地位,进行一轮比拟和换位之后,最大记录在第n个地位;而后对前(n-1)个记录进行第二轮比拟;反复该过程直到进行比拟的记录只剩下一个时为止。
案例:冒泡,像气泡一样往上升
1.2.2 实现
def bubble_sort(gList): """冒泡排序""" length = len(gList) for i in range(length): for j in range(i+1, length): if gList[i] > gList[j]: gList[i], gList[j] = gList[j], gList[i] return gList
1.2.3 冒泡排序剖析
工夫复杂度:
- 最好工夫复杂度: O ( n ) O(n) O(n)
- 最坏工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 均匀工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 空间复杂度: O ( 1 ) O(1) O(1)
- **稳定性:**稳固的排序
1.3 插入排序
1.3.1 思维
对于给定的一组记录,初始时假如第一个记录自成一个有序序列,其余的记录为无序序列;接着从第二个记录开始,依照记录的大小顺次将以后解决的记录插入到其之前的有序序列中,直至最初一个记录插入到有序序列中为止。
案例:抓扑克牌
1.3.2 实现
def insertion_sort(gList): """插入排序""" length = len(gList) for i in range(1, length): temp = gList[i] # 以后的待插入的值 j = i - 1 # 前一个值 while j >= 0: if gList[j] > temp: gList[j+1] = gList[j] # 插入的动作 gList[j] = temp # 插入结束 j -= 1 return gList
1.3.3 插入排序剖析
工夫复杂度
- 最好工夫复杂度: O ( n ) O(n) O(n)
- 最坏工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 均匀工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 空间复杂度: O ( 1 ) O(1) O(1)
- **稳定性:**稳固的排序
1.4 归并排序 ☆☆★
1.4.1 思维
利用递归与分治技术将数据序列划分成为越来越小的半子表,再对半子表排序,最初再用递归步骤将排好序的半子表合并成为越来越大的有序序列。其中“归”代表的是递归的意思,即递归地将数组折半地拆散为单个数组。
给定一组序列含n个元素,首先将每两个相邻的长度为1的子序列进行归并,失去n/2(向上取整)个长度为2或1的有序子序列,再将其两两归并,重复执行此过程,直到失去一个有序序列为止。
1.4.2 实现
def merge_sort(gList: list) -> list: """归并排序 :param gList: 给定序列 :return: 升序排列后的汇合 """ def merge(left: list, right: list) -> list: """merge left and right :param left: left list :param right: right list :return: merge reslut """ i, j = 0, 0 result = [] while i < len(left) and j < len(right): if left[i] <= right[j]: result.append(left[i]) i += 1 else: result.append(right[j]) j += 1 result += left[i:] result += right[j:] return result if len(gList) <= 1: return gList num = len(gList) // 2 left = merge_sort(gList[:num]) right = merge_sort(gList[num:]) return merge(left, right)if __name__ == '__main__': gList = [3, 5, 2, 4, 1] print("----排序前:", gList) print("----归并排序后: ", merge_sort(gList))
1.4.3 归并排序剖析
- 工夫复杂度: 最好、最坏和均匀状况 O ( n l o g n ) O(nlogn) O(nlogn)
- 空间复杂度: O ( n ) O(n) O(n)
- 稳定性:稳固
题目:100个有序数列如何合成一个大数组?
1.5 疾速排序☆★★
1.5.1 思维
高效的排序算法,它采纳**“分而治之”的思维,把大的拆分为小的,小的再拆分为更小的。其原理**是:对于一组给定的记录,通过一趟排序后,将原序列分为两局部,其中前局部的所有记录均比后局部的所有记录小,而后再顺次对前后两局部的记录进行疾速排序,递归该过程,直到序列中的所有记录均有序为止。
1.5.2 实现
# -*- coding: utf-8 -*-def quick_sort(gList, left=0, right=None) -> list: """疾速排序 :param gList: 给定一组序列 :param left: :param right: :return: 升序排序后的序列 """ if right is None: right = len(gList)-1 if left > right: return gList key = gList[left] low = left high = right while left < right: while left < right and gList[right] >= key: right -= 1 gList[left] = gList[right] while left < right and gList[left] <= key: left += 1 gList[right] = gList[left] gList[right] = key quick_sort(gList, low, left-1) quick_sort(gList, left+1, high) return gListif __name__ == '__main__': gList = [3, 5, 2, 4, 1, 6, 7] print("----排序前:", gList) print("----疾速排序后: ", quick_sort(gList))
1.5.3 疾速排序剖析
工夫复杂度:
- 最坏工夫复杂度: O ( n 2 ) O(n^2) O(n2)
- 最好工夫复杂度: O ( n l o g n ) O(nlogn) O(nlogn)
- 均匀工夫复杂度: O ( n l o g n ) O(nlogn) O(nlogn)
- 空间复杂度: O ( l o g n ) O(logn) O(logn)
- 稳定性:不稳固
扩大:随机快排
1.6 希尔排序
1.6.1 思维
希尔排序也称为“放大增量排序”。它的基本原理是:首先将待排序的元素分成多个子序列,使得每个子序列的元素个数绝对较少,对各个子序列别离进行间接插入排序,待整个待排序序列“根本有序后”,再对所有元素进行一次间接插入排序。
1.6.2 实现
# -*- coding: utf-8 -*-def shell_sort(gList) -> list: """希尔排序""" length = len(gList) step = 2 group = length // step while group > 0: for startPos in range(group): gap_insertion_sort(gList, startPos, group) group = group // 2 return gListdef gap_insertion_sort(gList, start, gap): for i in range(start+gap, len(gList), gap): curr_value = gList[i] pos = i while pos >= gap and gList[pos-gap] > curr_value: gList[pos] = gList[pos-gap] pos = pos - gap gList[pos] = curr_valueif __name__ == '__main__': gList = [5, 4, 2, 1, 7, 3, 6] print("-----yuzhou1su-----", gList) print("-----希尔排序后:", shell_sort(gList))
1.6.3 希尔排序剖析
工夫复杂度:
- 最好工夫复杂度: O ( n ) O(n) O(n)
- 最坏工夫复杂度: O ( n s ) ( 1 < s < 2 ) O(n^s)(1<s<2) O(ns)(1<s<2)
- 均匀工夫复杂度: O ( n l o g n ) O(nlogn) O(nlogn)
- 空间复杂度: O ( 1 ) O(1) O(1)
- 稳定性: 不稳固
1.7 堆排序
堆是一种非凡的树形数据结构,其每个结点都有一个值,通常提到的堆都是指一棵齐全二叉树,根结点的值小于(或大于)两个子结点的值,同时根结点的两个子树也别离是一个堆。
1.7.1 算法思维:
对于给定的序列,初始把这些记录看成一刻顺序存储的二叉树,而后将其调整为一个大顶堆,而后将堆的最初一个元素与堆顶元素进行替换后,堆的最初一个元素即为最大记录;接着将前(n-1)个元素从新调整为一个大顶堆,在将堆顶元素与以后堆的最初一个元素进行替换后失去次大的记录,反复该过程直到调整的堆中只剩一个元素为止,该记录即为最小记录,此时可失去一个有序序列。
过程:1. 构建堆;2. 替换堆顶元素与最初一个元素的地位
1.7.2 实现
def heapify(unsorted, index, heap_size): largest = index left_index = 2 * index + 1 right_index = 2 * index + 2 if left_index < heap_size and unsorted[left_index] > unsorted[largest]: largest = left_index if right_index < heap_size and unsorted[right_index] > unsorted[largest]: largest = right_index if largest != index: unsorted[largest], unsorted[index] = unsorted[index], unsorted[largest] heapify(unsorted, largest, heap_size)def heap_sort(unsorted): """堆排序""" length = len(unsorted) for i in range(length // 2 - 1, -1, -1): heapify(unsorted, i, length) for i in range(length - 1, 0, -1): unsorted[0], unsorted[i] = unsorted[i], unsorted[0] heapify(unsorted, 0, i) return unsortedif __name__ == '__main__': gList = [5, 4, 2, 1, 7, 3, 6] print("-----yuzhou1su-----", gList) print("-----堆排序后:", heap_sort(gList))
1.7.3 堆排序剖析
**工夫复杂度:**次要消耗在创立堆和重复调整堆上,最坏状况下,工夫复杂度也为 O ( n l o g n ) O(nlogn) O(nlogn)
**稳定性:**不稳固
1.8 计数排序
1.8.1 算法思维
对于某种整数K,计数排序假设每个元素都是1到K范畴内的整数。 计数排序的根本思维是为每个输出元素x确定小于x的元素数量, 此信息可用于间接将其搁置在正确的地位。 例如,如果10个元素小于x,则x属于输入中的地位11。
1.8.2 实现
# -*- coding: utf-8 -*-# @Time : 2020-09-10 14:31# @Author : yuzhou_1su# @ContactMe : https://blog.csdn.net/yuzhou_1shu# @File : counting_sort.py# @Software : PyCharmdef counting_sort(unsorted): """计数排序 :param unsorted:给定一组序列 :return: 升序序列 """ if unsorted is []: return [] # 依据给定序列求信息 coll_len = len(unsorted) coll_max = max(unsorted) coll_min = min(unsorted) # 创立计数数组 counting_arr_length = coll_max + 1 - coll_min counting_arr = [0] * counting_arr_length # 计数操作 for number in unsorted: counting_arr[number - coll_min] += 1 # 将每个地位与它的前一个相加。counting_arr[i]统计出多少个 # element <= i的元素 for i in range(1, counting_arr_length): counting_arr[i] = counting_arr[i] + counting_arr[i - 1] # 创立保留升序后果的数组 ordered = [0] * coll_len for i in reversed(range(0, coll_len)): ordered[counting_arr[unsorted[i] - coll_min] - 1] = unsorted[i] counting_arr[unsorted[i] - coll_min] -= 1 return orderedif __name__ == '__main__': gList = [5, 4, 2, 1, 3, 6] print("-----yuzhou1su:", gList) print("-----计数排序后:", counting_sort(gList))
1.8.3 计数排序剖析
工夫复杂度: O ( n ) i f K = O ( n ) O(n)\quad if\ K = O(n) O(n)if K=O(n)
空间复杂度: O ( n ) i f K = O ( n ) O(n)\quad if\ K = O(n) O(n)if K=O(n)
Ps: 如果K特地大,工夫复杂度会很高;如果面试官让你设计数据规模小的线性排序算法,可能就是考查计数排序
1.9 桶排序
1.9.1 算法思维
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的要害就在于这个映射函数的确定。为了使桶排序更加高效,咱们须要做到这两点:
- 在额定空间短缺的状况下,尽量增大桶的数量
- 应用的映射函数可能将输出的 N 个数据平均的调配到 K 个桶中
1.9.2 实现
# -*- coding: utf-8 -*-# @Time : 2020-09-10 15:30# @Author : yuzhou_1su# @ContactMe : www.yuzhou_1su@163.com# @File : bucket_sort.py# @Software : PyCharmimport mathdef insertion_sort(collection): for i in range(1, len(collection)): temp = collection[i] index = i while index > 0 and temp < collection[index - 1]: collection[index] = collection[index-1] index -= 1 collection[index] = tempdef bucket_sort(collection): code = hashing(collection) buckets = [list() for _ in range(code[1])] for i in collection: x = rehashing(i, code) buck = buckets[x] buck.append(i) for bucket in buckets: insertion_sort(bucket) ndx = 0 for buc in range(len(buckets)): for val in buckets[buc]: collection[ndx] = val ndx += 1 return collectiondef hashing(collection): m = collection[0] for i in range(1, len(collection)): if m < collection[i]: m = collection[i] result = [m, int(math.sqrt(len(collection)))] return resultdef rehashing(i, code): return int(i / code[0] * (code[1] - 1))if __name__ == '__main__': gList = [5, 4, 2, 1, 3, 6] print("-----yuzhou1su:", gList) print("-----桶排序后:", bucket_sort(gList))
1.9.3 桶排序剖析
- 工夫复杂度: O ( n ) O(n) O(n)
- 空间复杂度: O ( n ) O(n) O(n)
1.10 基数排序
1.10.1 算法思维
与计数排序/桶排序相似,基数排序跟输出元素相干。比方:依据基数d对给定序列进行排序,这意味着所有的数字都是d位数。过程:
- 取每个元素的最低无效位
- 依据该数字对元素列表进行排序,但放弃雷同数字的元素程序
- 用更高无效位反复排序,直到最高位
1.10.2 实现
def radix_sort(unsorted): radix = 10 max_len = False tmp, placement = -1, 1 while not max_len: max_len = True buckets = [list() for _ in range(radix)] for i in unsorted: tmp = int(i / placement) buckets[tmp % radix].append(i) if max_len and tmp > 0: max_len = False a = 0 for b in range(radix): buck = buckets[b] for i in buck: unsorted[a] = i a += 1 # move to next digit placement *= radix return unsortedif __name__ == '__main__': gList = [5, 4, 2, 1, 3, 6] print("-----yuzhou1su:", gList) print("-----基数排序后:", radix_sort(gList))
1.10.3 基数排序剖析
基数排序实用于位数小的数字序列。
- 工夫复杂度: O ( n l o g ( r ) m ) O(nlog(r)\ m) O(nlog(r) m),其中r为所采取的基数,而m为堆数
- 稳定性:稳固
1.11 其余排序
- 拓扑排序:在一个有向图中,对所有的节点进行排序,要求没有一个节点指向它后面的节点。
- 内部排序:大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无奈一次装入内存,须要在内存和内部存储器之间进行屡次数据交换,以达到排序整个文件的目标。
- 位图排序:当待排序数据规模较大,而堆内存大小又没有限度时,位图排序则最高效。
- Tim-sort:Python的list规范排序算法,由Tim Peters设计。实质上是一种自下而上的归并排序,利用一些数据的初始运行,之后进行额定的插入排序。Tim-sort也成为Java7中数组排序的默认算法。
2. 各种排序算法比拟?
依据上图总结:
不稳固算法有:抉择、疾速、希尔、堆
记忆口诀:快选七(希)堆不稳固
- 工夫复杂度 O ( n 2 ) O(n^2) O(n2):抉择、冒泡、插入
- 工夫复杂度 O ( n l o g n ) O(nlogn) O(nlogn):疾速、归并、堆、希尔
- 工夫复杂度 O ( n ) O(n) O(n):计数、桶
- 空间复杂度 O ( 1 ) O(1) O(1):抉择、插入、冒泡、希尔、堆
- 空间复杂度 O ( n ) O(n) O(n):归并、计数、桶
- 空间复杂度 O ( l o g n ) O(logn) O(logn):疾速排序
3.总结
肯定要依据数据的规模、法则来给出适合的算法,不能感觉疾速排序名字就认为是疾速的,切记不能什么排序问题都答复快排。
- 尽管插入排序和冒泡排序平均速度较慢,但当初始序列整体或部分有序时,这两者效率较高
- 排序数据较小,且不要求稳固的状况下,抉择排序效率较高;要求稳固,抉择冒泡排序。
- 堆排序在更大的序列上往往优于疾速排序和归并排序。
- 针对小数据谋求线性工夫复杂度,思考计数排序和桶排序
- 除了下面几种常见的排序算法,还有泛滥其余排序算法,每种排序算法都有其最佳实用场合。具体情况具体分析。
最初,感激大家浏览。我是yuzhou_1su
,一个头发比想法多的钻研僧。
如果感觉文章还不错,请肯定帮忙点个赞。谢谢