关于python:Python函数式编程系列007惰性求值

本系列文章一些重要的函数、办法、类我都实现的一遍，你能够在github(点击此处)中找到代码和测试例子（如果网速过慢我也放了一份在gitee(点击此处)上，但请勿在gitee上提issue或者留言），欢送star/fork。

缘起

咱们回到介绍高阶函数的一章，咱们提到了高阶函数特地是科里化的一个益处便是「提前求值」和「推延求值」，通过这些操作，咱们能够大大优化很多代码。比方，咱们应用之前的例子：

def f(x): # x贮存了某种咱们须要的状态
    ## 所有能够提前计算的放在这里
    z = x ** 2 + x + 1
    print('z is {}'.format(z))
    def helper(y):
        ## 所有提早计算的放在这里
        return y * z
    return helper

咱们在调用f(1)的时候，其实就曾经当时计算了z的局部，如果咱们长期保留这个值，重复调用时就能够节俭很大的工夫：

>>> g = f(1)
z is 3
>>> g(2) + g(1) # 能够看到这次就不会打印`z is xxxx`的输入了
9

也就是说适时的「提前求值」和「推延求值」都能够帮忙咱们大大地缩小很多运算开销。这就引入咱们这一篇要讲的「惰性求值」的概念，惰性求值的概念次要是：调用时才计算，并且只计算一次。

惰性属性与惰性值

咱们思考上面一个例子：

定义一个圆的类，通过圆心和半径来形容，然而当咱们晓得圆心和半径之后咱们能晓得很多事，比方：

周长(perimeter)
面积(area)
圆最下面坐标的地位(upper_point)
圆心到原点的间隔(distance_from_origin)
…

这个列表可能十分十分多，而且随着软件性能的减少，这个列表可能还会增加。咱们可能有两种办法实现。第一种就是在初始化的时候都给设定为圆的属性：

@dataclass
class CircleInitial:
    x: float
    y: float
    r: float

    def __init__(self, x, y, r):
        self.x = x
        self.y = y
        self.r = r

        self.perimeter = 2 * r
        self.area = r * r * 3.14
        self.upper_point = (x, y + r)
        self.lower_point = (x, y - r)
        self.left_point = (x - r, y)
        self.right_point = (x + r, y)
        self.distance_from_origin = (x ** 2 + y ** 2) ** (1/2)

咱们马上能够看出问题：如果这样的属性十分多，而且波及的计算也十分多的话，那么当咱们实例化一个新的对象的时候，消耗的工夫将会十分长。然而，大部分的属性，咱们可能都不会用到。

于是，就有了第二个计划，把这些实现成一个办法（咱们这里仅举例一个area办法）：

@dataclass
class CircleMethod:
    x: float
    y: float
    r: float

    def area(self):
        print("area calculating...")
        return self.r * self.r * 3.14

当然，因为这个值是一个「常」量的概念，咱们也能够应用property润饰器，这样咱们就能够不必带括号地调用它了：

@dataclass
class CircleMethod:
    x: float
    y: float
    r: float

    @property
    def area(self):
        print("area calculating...")
        return self.r * self.r * 3.14

我成心在其中退出了一行打印代码，咱们能够发现，咱们每次调用area时，都会被计算一次：

>>> a = CircleMethod(1, 2, 3)
>>> a.area ** 2 + a.area + 1
area calculating...
area calculating...
827.8876000000001

这又是另外一种节约了，于是咱们发现，第一种计划适宜须要常常被重复调用的属性，第二个计划实现很少被调用的属性。然而，可能咱们在保护代码的时候，没法当时预判一个属性是不是常常被调用，而且这也不是一个长久之计。但咱们发现咱们须要的就是那么一个属性：

这个属性不会初始化的时候计算
这个属性只在被调用时计算
这个属性只会计算一次，前面不会调用

这个就是「惰性求值」的概念，咱们也把这种属性叫「惰性属性」。Python没有内置的惰性属性的概念，不过，咱们能够很容易从网上找到一个实现（你也能够在我的Python-functional-programming中的lazy_evaluate.py中找到）：

def lazy_property(func):
    attr_name = "_lazy_" + func.__name__

    @property
    def _lazy_property(self):
        if not hasattr(self, attr_name):
            setattr(self, attr_name, func(self))
        return getattr(self, attr_name)

    return _lazy_property

具体的应用，只是切换一下润饰器property：

@dataclass
class Circle:
    x: float
    y: float
    r: float

    @lazy_property
    def area(self):
        print("area calculating...")
        return self.r * self.r * 3.14

咱们采纳和下面一样的调用形式，能够发现，area只计算了一次（只打印了一次）：

>>> b = Circle(1, 2, 3)
>>> b.area ** 2 + b.area + 1
area calculating...
827.8876000000001

同样的理由咱们也能够实现一个惰性值的概念，不过因为python没有代码块的概念，咱们只能用没有参数的函数来实现：

class _LazyValue:

    def __setattr__(self, name, value):
        if not callable(value) or value.__code__.co_argcount > 0:
            raise NotVoidFunctionError("value is not a void function")
        super(_LazyValue, self).__setattr__(name, (value, False))      
        
    def __getattribute__(self, name: str):
        try:
            _func, _have_called = super(_LazyValue, self).__getattribute__(name)
            if _have_called:
                return _func
            else:
                res = _func()
                super(_LazyValue, self).__setattr__(name, (res, True))
                return res
        except:
            raise AttributeError(
                "type object 'Lazy' has no attribute '{}'"
                .format(name)
            )

lazy_val = _LazyValue()

具体调用办法如下，如果你要设计一个模块而这个变量不在类中，那么就能够很不便地应用它了：

def f():
    print("f compute")
    return 12

>>> lazy_val.a = f
>>> lazy_val.a
f compute
12
>>> lazy_val.a
12

惰性迭代器/生成器

此外，Python内置了一些惰性的构造次要就是迭代器和生成器，咱们能够很不便验证它们只计算/保留一次（这里只验证迭代器）：

>>> a = (i for i in range(5))
>>> list(a)
[0, 1, 2, 3, 4]
>>> list(a)
[]

咱们能够设计上面两个函数：

def f(x):
    print("f")
    return x + 1

def g(x):
    print("g")
    return x + 1

而后咱们思考上面的后果：

>>> a = (g(i) for i in (f(i) for i in range(5)))
>>> next(a)

它可能有两种后果，一个它可能的计算形式是这样的：

>>> temp = [f(i) for i in range(5)]
>>> res = g(temp[0])

如果是这种后果，则它会打印出5个f而后再打印出g

另一种可能性则是：

>>> res = (g(f(i)) for i in range(5))

则，这样子便只会打印一个f和一个g。如果依据惰性求值的定义，i=1并没有被实在调用，所以它应该不必求值，所以，如果他合乎第二个打印状况，则它就是惰性的对象。事实也就真如此。

当然，这个个性曾经十分的Fancy了，然而咱们基于此能够联想出的一个十分微妙的援用，因为在迭代器计算中，咱们并不是在生成的时候，就计算出了迭代器中的每个值，因而，咱们能够用这个形式存储一个无穷系列。通过下面的形式计算后返回后果。一个最简略的例子是内置模块中的itertools.repeat，咱们能够生成一个无穷的全为1的线性构造：

from itertools import repeat

repeat_1 = repeat(1)

这样，咱们就能够用下面的列表表达式来做一些计算再通过next调用了。

res = (g(i) for i in (i * 3 for i in repeat_1))
next(res)

咱们也将这些线性构造称为「惰性列表」（这里的repeat_1则是一个「无穷惰性列表」的例子），在上面的文章中，咱们将具体地用这个形式来实现一些乏味的事件。

关于python:Python函数式编程系列007惰性求值

缘起

惰性属性与惰性值

惰性迭代器/生成器

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于python:Python函数式编程系列007惰性求值

缘起

惰性属性与惰性值

惰性迭代器/生成器

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复