Effective Python 学习笔记 2

共1k字 阅读时长约4分 访问量

用列表推导来取代map和filter

列表推导(list commprehension):根据一份列表来制作另外一份列表
1
2
3
4
5
6
7
8
9
10
11
12
13
14
'''
用列表每个元素平方值构建另一份列表
a = [1, 2, 3, 4, 5, 6, 7, 8]
'''
# 列表推导写法
squares = [x ** 2 for x in a]
# map写法
squares = map(lamda x: x ** 2, a)

# 条件输出
# 列表推导输出偶数
squares = [x for x in a if a%2 == 0]
# map辅以filter输出偶数
squares = map(lambda x: x, filter(lambda x: x % 2 == 0, a))
    字典与集也有类似的推导机制,编写算法时,可以通过这些推导机制来创建衍生的数据结构。
1
2
3
4
5
6
7
8
9
chile_ranks = {'ghost': 1, 'god': 2, 'man': 3}
rank_dict = {rank: name for name,rank in chile_ranks.items()}
chile_len_set = {len(name) for name in rank_dict.values()}
print(rank_dict)
print(chile_len_set)

#元组与dict互转
tuple = dict.items()
dict = tuple.values
注意
  1. 不使用含有两个以上表达式的列表推导,难理解尽量避免
  2. 列表推导支持多级循环,每一级循环也支持多项条件
缺点
  1. 数据量较少时,不会出现问题,数据量较多时可能会耗费大量内存

用生成器表达式来改写数据量较大的列表推导

什么是生成器
    通过列表生成式,我们可以直接创建一个列表,但是,受到内存限制,列表容量肯定是有限的,而且创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
    所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间,在Python中,这种一边循环一边计算的机制,称为生成器:generator。
1
2
3
4
5
6
7
8
'''
eg. 读取日志文件
'''
it = (len(x) for x in open('/var/log.log'))
print(it)
>>> <generator object <genexpr> at 0x101b81480
print(next(it))
>>> "logs"
要点
  1. 当输入数据量较大时,列表推导可能会因为占用太多内存而出现问题
  2. 由生成器表达式返回的迭代器,可以逐次产生输出值,从而避免内存用量问题
  3. 把某个生成器表达式所返回的迭代器,放在另一个生成器表达式的for子表达式中,即可将二者结合起来
1
2
a = [1, 2, 3, 4, 5, 6]
res = ((x, x ** 2) for x in a)
  1. 串在一起的生成器表达式执行速度很快

尽量用enumerate取代range

1
2
3
4
5
6
7
8
9
10
'''
场景说明:当想同时打印元素在列表中的索引和值的时候,使用range略显生硬
'''
# range写法
for i range(len(list)):
value = list[i]
index = i
# enumerate写法
for i, value in enumerate(list):
print('%d: %s' % (i + 1, value))
要点
  1. 尽量使用enumerate来改写那种将range与下标访问结合的序列遍历代码
  2. 可以给enumerate提供第二个参数, 以指定开始计数时所用的值

用zip函数同时遍历两个迭代器

zip可以将两个或者多个迭代器封装成一个生成器
1
2
3
4
5
6
7
8
9
10
11
12
13
14
'''
场景说明:需要平行对两个列表进行操作时
'''
names = ['alice', 'bob', 'cendy']
letters = [len(n) for n in names]

longest_name = None
max_letters = 0

for name, count in zip(names, letters):
if count > max_letters:
longest_name = name
max_letters = count
print(longest_name)
要点
  1. 内置的zip函数可以平行地遍历多个迭代器
  2. python3中的zip函数相当于生成器,会在遍历过程中产生元组
  3. 如果提供的迭代器长度不等,那么zip会自动提前终止
  4. itertools内置模块中的zip_longest函数可以平行的遍历多个迭代器,而不用在乎他们的长度是否相等