Effective Python 学习笔记 1
PEP 8规范
命名
- 使用下标获取列表元素、调用函数或者给关键字参数赋值时,不在两旁加空格
- 函数、变量及属性应该用小写字母来拼写,个单词之间下划线相连
- 受保护实例属性以单个下划线开头:_protect_var
- 类与异常,以每个单词首字母大写形式命名:ClassName
- 模块级别的常量,采用全部大写字母方式命名,单词之间下划线连接:ALL_CAPS
- 类中实例方法(instance method),应该把首个参数命名为self,以表示该对象自身
- 类方法(class method)的首个参数应该命名为cls,以表示该类自身
语句
- 不要不要通过检测长度的办法(如 if len(somelist) == 0)来判断somelist是否为[]或’’等空值,而是采用if not somelist这种写法来判断,它会假定:空值将自动评估为false
- 不要编写单行的if、for、while及except语句,应该分开书写以示清晰
- import语句应总是放在开头
- 引入模块时,总是使用绝对名称,而不是根据当前面模块路径来使用相对名称:from bar import foo
- 如果一定要引用相对名称,采用from . import foo的格式
- import语句应该按顺序划分成三个部分,分别表示标准库模块、第三方模块以及自用模块,在每个部分中import语句应该按照模块的字母顺序排列
bytes、str与unicode的区别
把Unicode字符转换成二进制数据就必须使用encode方法
把二进制数据字符转换成Unicode就必须使用decode方法
实现:
1
2
3
4
5
6
7
8
9
10
11
12
13def to_str(bytes_or_str):
if isinstance(bytes_or_str, bytes):
value = bytes_or_str.decode('utf-8')
else:
value = bytes_or_str
return value
def to_bytes(str_to_bytes):
if isinstance(str_to_bytes, str):
value = str_to_bytes.encode('utf-8')
else:
value = str_to_bytes
return value编写程序时,一定要把编码和解码操作放在界面外围来做。程序最核心的部分应该使用Unicode字符类型,而且不对编码做任何假设。这种方法既可以令程序接受多种类型的文本编码(如Latin-1、Shift JIS和Big 5),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8)
open函数添加了名为encoding的新参数,默认值为utf-8,这就要求再写入时必须传入unicode字符的str实例,而不接受二进制数据的bytes实例。解决方法:采用字符写入模式wb,读取采用rb,如:
1
2with open('file.txt', 'wb') as f:
f.write(os.urandom(10))
用辅助函数取代复杂的表达式
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
'''
eg. 需求:查询字符串
'''
from urllib.parse import parse_qs
my_values = parse_qs('red=5&blue=0&green=', keep_blank_values=True)
print(repr(my_values))
'red': ['5'], 'blue': ['0'], 'green': ['']} {
# 方法一:用get方法在my_values字典中查询不同参数
print('RED: ', my_values.get('red'))
print('GREEN: ', my_values.get('green'))
'5'] RED: [
GREEN: [''] #无法将空值输出为0
#方法二
green = int(my_values.get('green', [])[0] or 0)
print('GREEN: %r' % green)
0 #表达式复杂,不易理解 GREEN:
# 总结辅助函数
def get_first_int(values, key, default=0):
found = values.get(key, [''])
if found[0]:
found = found[0]
else:
found = default
return found
green = get_first_int(my_values, 'green')
总结
- 用if/else表达式会比用or或and这样的Boolean操作符更清晰
了解切割序列的办法
基本写法
somelist[start:end]
- 如果从头切片,将start留空,而非写0. end同理
- 在源列表进行切割之后,会产生一份全新的列表。系统依然维护着指向原列表中各个对象的引用。
- 在赋值时采用切割操作会改变原列表:a[2:7] = [1, 2, 3]
- 单词切片操作内不要同时指定start、end和stride
- 反转字符串:re = str[::-1]
- 第五条只对ASCII字符有效,对已经编码成utf-8字符串的Unicode字符无效