Effective Python 学习笔记 1

共1k字 阅读时长约4分 访问量

PEP 8规范

命名
  1. 使用下标获取列表元素、调用函数或者给关键字参数赋值时,不在两旁加空格
  2. 函数、变量及属性应该用小写字母来拼写,个单词之间下划线相连
  3. 受保护实例属性以单个下划线开头:_protect_var
  4. 类与异常,以每个单词首字母大写形式命名:ClassName
  5. 模块级别的常量,采用全部大写字母方式命名,单词之间下划线连接:ALL_CAPS
  6. 类中实例方法(instance method),应该把首个参数命名为self,以表示该对象自身
  7. 类方法(class method)的首个参数应该命名为cls,以表示该类自身
语句
  1. 不要不要通过检测长度的办法(如 if len(somelist) == 0)来判断somelist是否为[]或’’等空值,而是采用if not somelist这种写法来判断,它会假定:空值将自动评估为false
  2. 不要编写单行的if、for、while及except语句,应该分开书写以示清晰
  3. import语句应总是放在开头
  4. 引入模块时,总是使用绝对名称,而不是根据当前面模块路径来使用相对名称:from bar import foo
  5. 如果一定要引用相对名称,采用from . import foo的格式
  6. import语句应该按顺序划分成三个部分,分别表示标准库模块、第三方模块以及自用模块,在每个部分中import语句应该按照模块的字母顺序排列

bytes、str与unicode的区别

  1. 把Unicode字符转换成二进制数据就必须使用encode方法

  2. 把二进制数据字符转换成Unicode就必须使用decode方法

  3. 实现:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    def to_str(bytes_or_str):
    if isinstance(bytes_or_str, bytes):
    value = bytes_or_str.decode('utf-8')
    else:
    value = bytes_or_str
    return value

    def to_bytes(str_to_bytes):
    if isinstance(str_to_bytes, str):
    value = str_to_bytes.encode('utf-8')
    else:
    value = str_to_bytes
    return value
  4. 编写程序时,一定要把编码和解码操作放在界面外围来做。程序最核心的部分应该使用Unicode字符类型,而且不对编码做任何假设。这种方法既可以令程序接受多种类型的文本编码(如Latin-1、Shift JIS和Big 5),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8)

  5. open函数添加了名为encoding的新参数,默认值为utf-8,这就要求再写入时必须传入unicode字符的str实例,而不接受二进制数据的bytes实例。解决方法:采用字符写入模式wb,读取采用rb,如:

    1
    2
    with open('file.txt', 'wb') as f:
    f.write(os.urandom(10))

用辅助函数取代复杂的表达式

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
'''
eg. 需求:查询字符串
'''

from urllib.parse import parse_qs
my_values = parse_qs('red=5&blue=0&green=', keep_blank_values=True)
print(repr(my_values))

>>> {'red': ['5'], 'blue': ['0'], 'green': ['']}

# 方法一:用get方法在my_values字典中查询不同参数
print('RED: ', my_values.get('red'))
print('GREEN: ', my_values.get('green'))
>>> RED: ['5']
GREEN: [''] #无法将空值输出为0

#方法二
green = int(my_values.get('green', [])[0] or 0)
print('GREEN: %r' % green)
>>> GREEN: 0 #表达式复杂,不易理解

# 总结辅助函数
def get_first_int(values, key, default=0):
found = values.get(key, [''])
if found[0]:
found = found[0]
else:
found = default
return found

green = get_first_int(my_values, 'green')
总结
  1. 用if/else表达式会比用or或and这样的Boolean操作符更清晰

了解切割序列的办法

基本写法

somelist[start:end]

  1. 如果从头切片,将start留空,而非写0. end同理
  2. 在源列表进行切割之后,会产生一份全新的列表。系统依然维护着指向原列表中各个对象的引用。
  3. 在赋值时采用切割操作会改变原列表:a[2:7] = [1, 2, 3]
  4. 单词切片操作内不要同时指定start、end和stride
  5. 反转字符串:re = str[::-1]
  6. 第五条只对ASCII字符有效,对已经编码成utf-8字符串的Unicode字符无效