函数使用(四)
迭代器(Iterator)
- **定义:**就是可以使用for-in进行遍历,并且可以使用next依次获取元素的对象
- 说明:
- 生成器就是一种特殊的迭代器
- 判断是否是迭代器
1
2
3
4from collections import Iterator
l = (i for i in range(10))
print(isinstance(l, Iterator)) - 字符串,列表,元组,集合,字典等都不是迭代器,但是他们都是可迭代对象。
1 | from collections import Iterator |
1 | if True: |
1 | print:打印、输出 |
1 | hexo clean # 删除生成的文件和缓存 |
在获取网页数据的时候,经常会使用xpath进行数据的提取,对于如下的代码:
案例1:
1 | <div id="test1">大家好!</div> |
使用xpath提取是非常方便的。假设网页的源代码在selector中:
1 | data = selector.xpath('//div[@id="test1"]/text()').extract()[0] |
可以把“大家好!”提取到data变量中去。