Python生成器
一、Python生成器介绍
1.什么是生成器
在Python中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数(一次一个值),只能用于迭代操作,更简单点理解生成器就是一个迭代器。
2.生成器的作用
内存占用少,节约资源(后面会有具体案例说明)。
二、创建生成器
创建生成器有两种方法,一种是把列表生成式的中括号[]改成小括号(),一种是函数中包含yield关键字。
1.列表生成式与生成器
# 列表生成式
list_1 = [x * x for x in range(10)]
# 生成器
# 把列表生成式的中括号[]改成小括号(),就成了生成器
list_generator = (x * x for x in range(10))
前面说了生成器的最大好处就是节约内存资源,下面打印一下列表list_1和生成器list_generator,对比一下他们的内存占用:
print(list_1.__sizeof__()) # 84字节
print(list_generator.__sizeof__()) # 48字节
一个是84字节,一个是48字节,看起来并不明显,我们把range范围扩大到1000000,也就是包含一百万个元素,此时再来对比:
list_1 = [x * x for x in range(1000000)]
list_generator = (x * x for x in range(1000000))
print(list_1.__sizeof__()) # 4348720字节
print(list_generator.__sizeof__()) # 48字节
当range范围扩大到1000000后,列表list_1占用了4348720字节,而生成器list_generator仍然只占用了48字节(因为一次只取一个值)。因此可以得出结论:使用列表会一次性将元素都加载到内存中,占用大量的内存,如果内存不够的话,很可能还会出现Out Of Memory,而我们只需要访问部分元素,造成了大量的资源浪费;而使用生成器,因为一次只加载一个元素的缘故,所以会比较节约资源
2.函数生成器
坦白讲,如果遇到比较复杂的算法,使用列表推导式写起来会比较麻烦,也不易于阅读,此时可以用函数来实现。例如,读取一个大文本文件:
def read_large_file(file):
with open(file=file, encoding="utf8") as f:
lines = f.readlines()
for line in lines:
yield line
for i in read_large_file("c:/test_file.txt"):
print(i)
三、生成器的执行顺序
- 带有 yield 的函数不再是一个普通函数,而是一个生成器generator。
- yield相当于 return 返回一个值,并且记住这个返回值的位置,下次迭代时,代码从yield的下一条语句开始执行。
-
# 生成器执行顺序 def yield_order(n): for i in range(n): print("i: ", i) yield i * 2 print("i = ", i) print("done") for i in yield_order(5): print(i) ''' i: 0 0 i = 0 i: 1 2 i = 1 i: 2 4 i = 2 i: 3 6 i = 3 i: 4 8 i = 4 done ''' 执行过程分析: *** 第一次迭代 i=0 *** i: 0 0 第一次迭代i=0,yield相当于return返回一个值0,并且记住这个返回值的位置i * 2,也就是0 * 2,乘积为0,所以在调用函数打印i的时候就是0 *** 第二次迭代 i=1 *** i = 0 i: 1 2 第二次迭代i=1,yield相当于return返回一个值1,并且记住这个返回值的位置i * 2,也就是1 * 2,乘积为2,所以在调用函数打印i的时候就是2 第二次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 0 *** 第三次迭代 i=2 *** i = 1 i: 2 4 第三次迭代i=2,yield相当于return返回一个值2,并且记住这个返回值的位置i * 2,也就是2 * 2,乘积为4,所以在调用函数打印i的时候就是4 第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 1 *** 第四次迭代 i=3 *** i = 4 i: 3 6
第四次迭代i=3,yield相当于return返回一个值3,并且记住这个返回值的位置i * 2,也就是3 * 2,乘积为6,所以在调用函数打印i的时候就是6
第四次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 2
-
*** 第五次迭代 i=4 *** i = 3 i: 4 8 i = 4 done
第五次迭代i=4,yield相当于return返回一个值4,并且记住这个返回值的位置i * 2,也就是4 * 2,乘积为8,所以在调用函数打印i的时候就是8
第三次迭代会从yield的下一条语句开始执行也就是print("i = ", i),打印结果为:i = 3
四、用生成器实现斐波那契数列
斐波那契数列(Fibonacci sequence),又称黄金分割数列,因数学家莱昂纳多·斐波那契(Leonardo Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(0)=0,F(1)=1, F(n)=F(n - 1)+F(n - 2)(n ≥ 2,n ∈ N*)。
# 生成器实现斐波那契数列
def fib(number):
"""number表示最大数量"""
n, a, b = 0, 0, 1
while n < number:
yield b
a, b = b, a + b
n = n + 1
for i in fib(5):
print(i)
小结
- 使用yield的函数都是生成器函数,可以使用for循环获取值,也可以使用next获取生成器函数的值
- 生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是什么时候调它,它什么时候开始计算一个新的值,并返回。
?
?
?
?
?
?
?
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!