python函数迭代返回,返回迭代器

Python中的“迭代”详解

迭代器模式：一种惰性获取数据项的方式，即按需一次获取一个数据项。

成都创新互联服务项目包括瓦房店网站建设、瓦房店网站制作、瓦房店网页制作以及瓦房店网络营销策划等。多年来，我们专注于互联网行业，利用自身积累的技术优势、行业经验、深度合作伙伴关系等，向广大中小型企业、政府机构等提供互联网行业的解决方案，瓦房店网站推广取得了明显的社会效益与经济效益。目前，我们服务的客户以成都为中心已经辐射到瓦房店省份的部分城市，未来相信会继续扩大服务区域并继续获得客户的支持与信任！

所有序列都是可以迭代的。我们接下来要实现一个 Sentence（句子）类，我们向这个类的构造方法传入包含一些文本的字符串，然后可以逐个单词迭代。

接下来测试 Sentence 实例能否迭代

序列可以迭代的原因：

iter()

解释器需要迭代对象 x 时，会自动调用iter(x)。

内置的 iter 函数有以下作用：

由于序列都实现了 __getitem__ 方法，所以都可以迭代。

可迭代对象：使用内置函数 iter() 可以获取迭代器的对象。

与迭代器的关系：Python 从可迭代对象中获取迭代器。

下面用for循环迭代一个字符串，这里字符串 'abc' 是可迭代的对象，用 for 循环迭代时是有生成器，只是 Python 隐藏了。

如果没有 for 语句，使用 while 循环模拟，要写成下面这样：

Python 内部会处理 for 循环和其他迭代上下文（如列表推导，元组拆包等等）中的 StopIteration 异常。

标准的迭代器接口有两个方法：

__next__ ：返回下一个可用的元素，如果没有元素了，抛出 StopIteration 异常。

__iter__ ：返回 self，以便在需要使用可迭代对象的地方使用迭代器，如 for 循环中。

迭代器：实现了无参数的 __next__ 方法，返回序列中的下一个元素；如果没有元素了，那么抛出 StopIteration 异常。Python 中的迭代器还实现了 __iter__ 方法，因此迭代器也可以迭代。

接下来使用迭代器模式实现 Sentence 类：

注意，不要在 Sentence 类中实现 __next__ 方法，让 Sentence 实例既是可迭代对象，也是自身的迭代器。

为了“支持多种遍历”，必须能从同一个可迭代的实例中获取多个独立的迭代器，而且各个迭代器要能维护自身的内部状态，因此这一模式正确的实现方式是，每次调用 iter(my_iterable) 都新建一个独立的迭代器。

所以总结下来就是：

实现相同功能，但却符合 Python 习惯的方式是，用生成器函数代替 SentenceIteror 类。

只要 Python 函数的定义体中有 yield 关键字，该函数就是生成器函数。调用生成器函数，就会返回一个生成器对象。

生成器函数会创建一个生成器对象，包装生成器函数的定义体，把生成器传给 next(...) 函数时，生成器函数会向前，执行函数定义体中的下一个 yield 语句，返回产出的值，并在函数定义体的当前位置暂停，。最终，函数的定义体返回时，外层的生成器对象会抛出 StopIteration 异常，这一点与迭代器协议一致。

如今这一版 Sentence 类相较之前简短多了，但是还不够慵懒。惰性，是如今人们认为最好的特质。惰性实现是指尽可能延后生成值，这样做能节省内存，或许还能避免做无用的处理。

目前实现的几版 Sentence 类都不具有惰性，因为 __init__ 方法急迫的构建好了文本中的单词列表，然后将其绑定到 self.words 属性上。这样就得处理整个文本，列表使用的内存量可能与文本本身一样多（或许更多，取决于文本中有多少非单词字符）。

re.finditer 函数是 re.findall 函数的惰性版本，返回的是一个生成器，按需生成 re.MatchObject 实例。我们可以使用这个函数来让 Sentence 类变得懒惰，即只在需要时才生成下一个单词。

标准库提供了很多生成器函数，有用于逐行迭代纯文本文件的对象，还有出色的 os.walk 函数等等。本节专注于通用的函数：参数为任意的可迭代对象，返回值是生成器，用于生成选中的、计算出的和重新排列的元素。

第一组是用于过滤的生成器函数：从输入的可迭代对象中产出元素的子集，而且不修改元素本身。这种函数大多数都接受一个断言参数(predicate)，这个参数是个布尔函数，有一个参数，会应用到输入中的每个元素上，用于判断元素是否包含在输出中。

以下为这些函数的演示：

第二组是用于映射的生成器函数：在输入的单个/多个可迭代对象中的各个元素上做计算，然后返回结果。

以下为这些函数的用法：

第三组是用于合并的生成器函数，这些函数都可以从输入的多个可迭代对象中产出元素。

以下为演示：

第四组是从一个元素中产出多个值，扩展输入的可迭代对象。

以下为演示：

第五组生成器函数用于产出输入的可迭代对象中的全部元素，不过会以某种方式重新排列。

下面的函数都接受一个可迭代的对象，然后返回单个结果，这种函数叫“归约函数”，“合拢函数”或“累加函数”，其实，这些内置函数都可以用 functools.reduce 函数实现，但内置更加方便，而且还有一些优点。

参考教程：

《流畅的python》 P330 - 363

Python 函数 - 返回生成器

如果函数要返回一系列结果，我们常见的方法就是将结果放到一份列表中，然后返回给调用者。比如下面的函数，返回字符串中每个单词的首字母在真个字符串中的索引：

运行结果：

上述的结果完全符合我们的预期，但 get_word_index 函数不够简洁。下面我们尝试使用生成器来实现：

运行结果：

改写之后，不仅运行结果符合要求，由于不需要和 result 列表交互，函数也变得非常简洁。下面我们就来详细学习下生成器吧~

生成器是指使用 yield 表达式的函数，调用生成器函数时，它并不会真的运行，而是会返回迭代器。每次在这个迭代器上面调用内置的 next 函数时，迭代器就会把生成器推进到下一个 yield 表达式那里。生成器传给 yield 的值均会由迭代器返回给调用者。

此外，如果输入量非常大，使用列表作为返回值，那么程序就有可能耗尽内存并崩溃。相反，使用生成器之后，则可以应对任意长度的输入数据。

例如，下面这个生成器函数可以获取文件中单词的索引，而不管文件内容多大，该函数执行时消耗的内存，只由单行的文本长度决定：

其中 test_generator.txt 中的内容如下：

运行结果：

下面这句话特别重要：生成器函数返回的迭代器，是由状态的，及调用者不应该反复使用它。我们那 word_index_iter 来说明：

如果想重复调用，请将其封装成容器：

运行结果：

关于上述自定义容器的实现原理，我的另外一篇文章做了详细介绍，链接奉上：

Python的基础知识之迭代器

迭代：按照一定的顺序访问集合中的每一个元素，或者叫遍历（其他语言叫做遍历）；

可迭代对象（Iterable）：能被迭代的对象，或者说直接作用于for循环的对象，可以通过for..in来遍历的对象，比如数组（list）、元祖（tuple）字符串等；

迭代器（Iterator）：能作用于next() 函数，并不断返回下一个值的对象称为迭代器，是惰性计算的序列（很重要）

1、判断一个对象是可迭代对象呢？方法是通过collections模块的Iterable类型判断

2、判断一个对象是否是迭代器Iterator对象

3、可迭代对象Iterable转化为迭代器对象Iterator

4、使用迭代器迭代

1、迭代器的特性

A.惰性计算数据，节省内存

B.能记录状态，并通过next()函数执行下一个状态

C.具有可迭代性

2、集合数据类型如list、dict、str、tuple等是可迭代对象Iterable但不是迭代器Iterator，不过可以通过iter()函数转化为一个Iterator对象

原因：Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。Iterator对象表示一个无限大的数据，集合是有限集合，假如被next()到最后就是没有返回直接carsh

3、生成器（generator）一定是迭代器，他是一种特殊的迭代器；

如果想了解更多Python知识，请查看

Python的基础知识之生成器

Python的基础知识之装饰器

学无止境，学习Python的伙伴可以多多交流。

本文题目：python函数迭代返回,返回迭代器
文章网址：http://cqcxhl.cn/article/dsshedi.html

重庆分公司，新征程启航

python函数迭代返回,返回迭代器

Python中的“迭代”详解

Python 函数 - 返回生成器

Python的基础知识之迭代器

其他资讯