关于python:Python中的不可变集合

Python内置了一个不可变(immutable)汇合对象:frozenset,顾名思义,这种汇合对象,一旦创立了就不能批改。

概念

上面的代码演示了可变和不可变汇合应用上的差异:

l = [1, 2, 3, 4]
new_set = set(l)
new_set.remove(1)
print (new_set)

fset = frozenset(l)
fset.remove(1)

如果运行这段代码,它的输入会是:

{2, 3, 4}

Traceback (most recent call last):
  File "main.py", line 9, in <module>
    fset.remove(1)
AttributeError: 'frozenset' object has no attribute 'remove'

能够看到frozenset实例基本没有remove办法,当然它也没有append办法,不能用index给元素赋值。

作用

除了不可批改以外,frozenset所有的用法都和一般set一样。

这样一个不可变的汇合,有什么用呢?对性能应该没有什么帮忙,已经有文章指出它比一般的set还稍慢一点,次要价值还是体现在可读性和安全性上:

  • 显式地申明了该汇合是不可更改的,给使用者明确提醒,一旦误用了,运行时也会敌对报错;
  • 如果想把这个汇合,放到另一个set外面,或者作为dict的key,那它就必须是不可更改的

这第二点,次要是因为dict的key要求是惟一的(或者set内的元素也是惟一的),要是传一个对象,python会尝试调用它的hash办法生个哈希串,作为判断是否惟一的根据,而如果这个对象竟然是可变的,它的内容就会影响哈希串的值。所以在python里,可变对象基本就没有内置hash办法,防止它被当做key。

比方上面这段代码:

fset = frozenset({4, 5})
s = {1, 2, fset}
print (s)

s = {1, 2, {4, 5}}

首先定义了一个frozenset,把它插入一个一般set;最初一句试图在一般set外面,初始化另外一个一般set。输入后果如下:

{frozenset({4, 5}), 1, 2}

Traceback (most recent call last):
  File "main.py", line 27, in <module>
    s = {1, 2, {4, 5}}
TypeError: unhashable type: 'set'

可见一般set是不能作为另外一个set的元素的,但frozenset就能够。‘

为什么Java没有这个限度

Java程序员可能会感觉奇怪,在hashset里放一个可变对象,不是很失常么?凭什么不行啊,咱们Java常常这样写:

HashSet<ArrayList<String>> masterCollection = new HashSet<ArrayList<String>>();
ArrayList<String> a = new ArrayList<String>();
masterCollection.add(a);
a.add("Hello, World");
for(ArrayList<String> list : masterCollection) {
    // do something to list
}

齐全不会报错么。

So,难道Java的实现机制和Python不一样?

答案是并没有,Java只是“容忍”了可能产生的谬误——这个帖子解释得很分明。简略来说:

Java和Python都是用一个对象的hash值作为key的,相比Python更器重数据一致性,Java更看中灵活性,所以如果咱们真的在HashSet里放了一个可变对象,并且预先扭转了它的值,那么就会发现,HashSet汇合,曾经检测不到它的存在了!

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理