Python笔记在列表字典集合中筛选数据

35次阅读

共计 976 个字符,预计需要花费 3 分钟才能阅读完成。

对数据进行筛选是编程中非常频繁的操作,例如筛选出列表中的非负数、筛选出字典中键值大于 0 的项、筛选出集合中能被 3 整除的数等。

在 Python 中有一些非常简便的写法,在此做一点总结。

在列表中根据条件筛选数据

最普通的方法是使用 for 循环遍历:

data = [-1, 2, 3, -4, 5]
# 筛选出其中的非负数
res = []
for x in data:
    if x >= 0:
        res.append(x)

print(res)
# 输出 [2, 3, 5]

这种方法很啰嗦,效率也很低,而 Python 中提供了列表解析和 filter 函数的方法。

先来看列表解析:

from random import randint

# 生成一个含有 10 个随机数的列表
l = [randint(-10, 10) for _ in range(10)]
# 下划线和 i 一样,只是个临时的循环变量,使用下划线相当于明确指出这个变量没有其他作用
# [5, 0, 4, 5, -1, -1, 2, 6, -7, -5]

# 使用列表解析进行筛选
[x for x in l if x >= 0]
# [5, 0, 4, 5, 2, 6]

然后来看 filter 函数:

l = [5, 0, 4, 5, -1, -1, 2, 6, -7, -5]
# filter 函数接收两个参数,第一个参数为过滤函数,第二个参数为过滤对象
g = filter(lambda x: x>=0, l)
# filter 函数在 Python3 开始会返回一个生成器对象
# 生成器对象使用 next() 获取每一个元素
# 将生成器对象直接传给 list 构造器即可
list(g)

对于简单的筛选功能,推荐列表解析,更加简单而且速度更快一些。

在字典中根据条件筛选数据

先来用字典解析进行筛选:

# 生成一个有 20 个键值对的学生成绩字典
d = {'student%d' % i: randint(50, 100) for i in range(1,21)}

# 筛选分数高于 90 的项
{k:v for k, v in d.items() if v >= 90}

再来用 filter 函数进行筛选:

# 得到生成器对象
g = filter(lambda item: item[1] >= 90, d.items())

# 传给字典构造器来获得过滤后的字典
dict(g)

在集合中根据条件筛选数据

使用集合解析:

# 生成一个随机数集合
s = {randint(0, 20) for _ in range(20)}

# 筛选能被 3 整除的数
{x for x in s if x % 3 == 0}
# {0, 6, 15, 18}

原文来自 陈十一的博客

正文完
 0