- 公布所有抓取网页所需信息
上次我们已经成功获取了单个页面的所有电影的名字,其余的电影信息也如法炮制,上代码先:
1) 添加可以获取其他信息的正则,如下黄色区域显示的部分:
2) 然后在获取的代码中按获取电影名称一样来添加相应的代码:
在写完上面的代码之后,可以再进行一次调试,确保所获得的信息都是自己想要的,并且不存在逻辑错误。
通过获得的每部电影的信息存入到了列表data,然后再通过dataList.append(data)将一部电影的信息列表存到了dataList这个电影集列表里。
获取之后我们可以将该列表中的数据写入到一个Excel文件,这样方便我们后期使用。
2. 保存电影信息到Excel文件
我们添加下面黄色区域的代码,这部分就是将之前保存到dataList列表中的数据保存到Excel文件中。需要特别注意的,也是我们使用xlwt模块的主要代码&#