关于python:Python最会变魔术的魔术方法我觉得是它

4次阅读

共计 3332 个字符,预计需要花费 9 分钟才能阅读完成。

在上篇文章中,我有一个外围的发现:Python 内置类型的非凡办法(含魔术办法与其它办法)由 C 语言独立实现,在 Python 层面不存在调用关系。

然而,文中也提到了一个例外:一个十分神秘的魔术办法。

这个办法十分不起眼,用处狭隘,我简直从未留神过它,然而,当发现它可能是上述“定律”的惟一例外情况时,我认为值得再写一篇文章来具体扫视一下它。

本文次要关注的问题有:

(1) \_\_missing\_\_() 到底是何方神圣?

(2) \_\_missing\_\_() 有什么特别之处?善于“大变活人”魔术?

(3) \_\_missing\_\_() 是否真的是上述发现的例外?如果是的话,为什么会有这种特例?

1、有点价值的 \_\_missing\_\_()

从一般的字典中取值时,可能会呈现 key 不存在的状况:

dd = {'name':'PythonCat'}
dd.get('age')        # 后果:None
dd.get('age', 18)    # 后果:18
dd['age']            # 报错 KeyError
dd.__getitem__('age')  # 等同于 dd['age']

对于 get() 办法,它是有返回值的,而且能够传入第二个参数,作为 key 不存在时的返回内容,因而还能够承受。然而,另外两种写法都会报错。

为了解决后两种写法的问题,就能够用到 \_\_missing\_\_() 魔术办法。

当初,假如咱们有一个这样的诉求:从字典中取某个 key 对应的 value,如果有值则返回值,如果没有值则插入 key,并且给它一个默认值(例如一个空列表)。

如果用原生的 dict,并不太好实现,然而,Python 提供了一个十分好用的扩大类 collections.defaultdict

如图所示,当取不存在的 key 时,没有再报 KeyError,而是默认存入到字典中。

为什么 defaultdict 能够做到这一点呢?

起因是 defaultdict 在继承了内置类型 dict 之后,还定义了一个 \_\_missing\_\_() 办法,当 \_\_getitem\_\_取不存在的值时,它就会调用入参中传入的工厂函数(上例是调用 list(),创立空列表)。

作为最典型的示例,defaultdict 在文档正文中写到:

简而言之,\_\_missing\_\_() 的次要作用就是由 \_\_getitem\_\_在缺失 key 时调用,从而避免出现 KeyError。

另外一个典型的应用例子是 collections.Counter,它也是 dict 的子类,在取未被统计的 key 时,返回计数 0:

2、诡秘莫测的 \_\_missing\_\_()

由上可知,\_\_missing\_\_() 在 \_\_getitem\_\_() 取不到值时会被调用,然而,我不经意间还发现了一个细节:\_\_getitem\_\_() 在取不到值时,并不一定会调用 \_\_missing\_\_()。

这是因为它并非内置类型的必要属性,并没有在字典基类中被事后定义。

如果你间接从 dict 类型中取该属性值,会报属性不存在:AttributeError: type object 'object' has no attribute '__missing__'

应用 dir() 查看,发现的确不存在该属性:

如果从 dict 的父类即 object 中查看,也会发现同样的后果。

这是怎么回事呢?为什么在 dict 和 object 中都没有 \_\_missing\_\_属性呢?

然而,查阅最新的官网文档,object 中明显蕴含这个属性:

出处:https://docs.python.org/3/ref…\_\_missing\_\_#object.\_\_missing\_\_

也就是说,实践上 object 类中会预约义 \_\_missing\_\_,其文档证实了这一点,然而实际上它并没有被定义!文档与事实呈现了偏差!

如此一来,当 dict 的子类(例如 defaultdict 和 Counter)在定义 \_\_missing\_\_ 时,这个魔术办法事实上只属于该子类,也就是说, 它是一个诞生于子类中的魔术办法!

据此,我有一个不成熟的猜测:\_\_getitem\_\_() 会判断以后对象是否是 dict 的子类,且是否领有 \_\_missing\_\_(),而后才会去调用它(如果父类中也有该办法,则不会先作判断,而是间接就调用了)。

我在交换群里说出了这个猜测,有同学很快在 CPython 源码中找到验证:

而这就有意思了, 在内置类型的子类上才存在的魔术办法, 纵观整个 Python 世界,恐怕再难以找出第二例。

我忽然有一个联想:这诡秘莫测的 \_\_missing\_\_(),就像是一个善于玩“大变活人”的魔术师,先让观众在里面透过玻璃看到他(即官网文档),然而揭开门时,他并不在外面(即内置类型),再变换一下道具,他又完整无缺就呈现了(即 dict 的子类)。

3、被施魔法的 \_\_missing\_\_()

\_\_missing\_\_() 的神奇之处,除了它自身会变“魔术”之外,它还须要一股弱小的“魔法”能力驱动。

在上篇文章中,我发现原生的魔术办法间互相独立,它们在 C 语言界面可能有雷同的外围逻辑,然而在 Python 语言界面,却并不存在着调用关系:

魔术办法的这种“老死不相往来”的体现,违反了个别的代码复用准则,也是导致内置类型的子类会呈现某些奇怪体现的起因。

官网 Python 宁肯提供新的 UserString、UserList、UserDict 子类,也不违心复用魔术办法,惟一正当的解释仿佛是令魔术办法互相调用的代价太大。

然而,对于特例 \_\_missing\_\_(),Python 却不得不斗争,不得不付出这种代价!

\_\_missing\_\_() 是魔术办法的“ 二等公民 ”,它没有独立的调用入口,只能被动地由 \_\_getitem\_\_() 调用,即 \_\_missing\_\_() 依赖于 \_\_getitem\_\_()。

不同于那些“ 一等公民 ”,例如 \_\_init\_\_()、\_\_enter\_\_()、\_\_len\_\_()、\_\_eq\_\_() 等等,它们要么是在对象生命周期或执行过程的某个节点被触发,要么由某个内置函数或操作符触发,这些都是绝对独立的事件,无所依赖。

_\_missing\_\_() 依赖于 \_\_getitem\_\_(),能力实现办法调用;而 \_\_getitem\_\_() 也要依赖 \_\_missing\_\_(),能力实现残缺性能。

为了实现这一点,\_\_getitem\_\_() 在解释器代码中开了个后门,从 C 语言界面折返回 Python 界面,去调用那个名为“_\_missing\_\_”的特定办法。

而这就是真正的“魔法”了,目前为止,_\_missing\_\_() 仿佛是惟一一个享受了此等待遇的魔术办法!

4、小结

Python 的字典提供了两种取值的内置办法,即 \_\_getitem\_\_() 和 get(),当取值不存在时,它们的解决策略是不一样的: 前者会报错 KeyError,而后者会返回 None。

为什么 Python 要提供两个不同的办法呢?或者应该问,为什么 Python 要令这两个办法做出不一样的解决呢?

这可能有一个很简单(也可能是很简略)的解释,本文暂不深究了。

不过有一点是能够确定的:即原生 dict 类型简略粗犷地抛 KeyError 的做法有所有余。

为了让字典类型有更弱小的体现(或者说让 \_\_getitem\_\_() 作出 get() 那样的体现),Python 让字典的子类能够定义_\_missing\_\_(),供 \_\_getitem\_\_() 查找调用。

本文梳理了_\_missing\_\_() 的实现原理,从而揭示出它并非是一个毫不起眼的存在,恰恰相反, 它是惟一一个突破了魔术办法间壁垒,反对被其它魔术办法调用的特例!

Python 为了维持魔术办法的独立性,不惜殚精竭虑地引入了 UserString、UserList、UserDict 这些派生类,然而对于 _\_missing\_\_(),它却抉择了斗争。

本文揭示出了这个魔术办法的神秘之处,不知你读后有何感想呢?欢送留言探讨。

正文完
 0