关于python:Python-实现循环的最快方式forwhile-等速度对比

家喻户晓，Python 不是一种执行效率较高的语言。此外在任何语言中，循环都是一种十分耗费工夫的操作。如果任意一种简略的单步操作消耗的工夫为 1 个单位，将此操作反复执行上万次，最终消耗的工夫也将增长上万倍。

while 和 for 是 Python 中罕用的两种实现循环的关键字，它们的运行效率实际上是有差距的。比方上面的测试代码：

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354

这是一个简略的求和操作，计算从 1 到 n 之间所有自然数的总和。能够看到 for 循环相比 while 要快 1.5 秒。

其中的差距次要在于两者的机制不同。

在每次循环中，while 实际上比 for 多执行了两步操作：边界检查和变量 i 的自增。即每进行一次循环，while 都会做一次边界查看 (while i < n）和自增计算（i +=1）。这两步操作都是显式的纯 Python 代码。

for 循环不须要执行边界检查和自增操作，没有减少显式的 Python 代码（纯 Python 代码效率低于底层的 C 代码）。当循环的次数足够多，就呈现了显著的效率差距。

能够再减少两个函数，在 for 循环中加上不必要的边界检查和自增计算：

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def for_loop_with_inc(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
        i += 1
    return s


def for_loop_with_test(n=100_000_000):
    s = 0
    for i in range(n):
        if i < n:
            pass
        s += i
    return s


def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('for loop with increment\t\t',
          timeit.timeit(for_loop_with_inc, number=1))
    print('for loop with test\t\t', timeit.timeit(for_loop_with_test, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => for loop with increment          4.602369500091299
# => for loop with test               4.18337869993411

能够看出，减少的边界检查和自增操作的确大大影响了 for 循环的执行效率。

后面提到过，Python 底层的解释器和内置函数是用 C 语言实现的。而 C 语言的执行效率远大于 Python。

对于下面的求等差数列之和的操作，借助于 Python 内置的 sum 函数，能够取得远大于 for 或 while 循环的执行效率。

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def sum_range(n=100_000_000):
    return sum(range(n))


def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('sum range\t\t', timeit.timeit(sum_range, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042

能够看到，应用内置函数 sum 代替循环之后，代码的执行效率实现了成倍的增长。

内置函数 sum 的累加操作实际上也是一种循环，但它由 C 语言实现，而 for 循环中的求和操作是由纯 Python 代码 s += i 实现的。C > Python。

再拓展一下思维。小时候都据说过童年高斯奇妙地计算 1 到 100 之和的故事。1…100 之和等于 (1 + 100) * 50。这个计算方法同样能够利用到下面的求和操作中。

import timeit


def while_loop(n=100_000_000):
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s


def for_loop(n=100_000_000):
    s = 0
    for i in range(n):
        s += i
    return s


def sum_range(n=100_000_000):
    return sum(range(n))


def math_sum(n=100_000_000):
    return (n * (n - 1)) // 2


def main():
    print('while loop\t\t', timeit.timeit(while_loop, number=1))
    print('for loop\t\t', timeit.timeit(for_loop, number=1))
    print('sum range\t\t', timeit.timeit(sum_range, number=1))
    print('math sum\t\t', timeit.timeit(math_sum, number=1))


if __name__ == '__main__':
    main()
# => while loop               4.718853999860585
# => for loop                 3.211570399813354
# => sum range                0.8658821999561042
# => math sum                 2.400018274784088e-06

最终 math sum 的执行工夫约为 2.4e-6，缩短了上百万倍。这里的思路就是，既然循环的效率低，一段代码要反复执行上亿次。

索性间接不要循环，通过数学公式，把上亿次的循环操作变成只有一步操作。效率天然失去了空前的增强。

最初的论断（有点谜语人）：

实现循环的最快形式—— —— ——就是不必循环

对于 Python 而言，则尽可能地应用内置函数，将循环中的纯 Python 代码降到最低。

当然，内置函数在某些状况下还不是最快的。比方在创立列表的时候，是字面量写法的速度更快。

关于python:Python-实现循环的最快方式forwhile-等速度对比

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于python:Python-实现循环的最快方式forwhile-等速度对比

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复