本教程非常适合刚入门学习Python的同学,用到的库也都非常简单,主要是requests.如果是还没有Python基础的同学可以先学习下基础再来看我们的爬虫教程,不然可能会看不懂,会觉得很难的,也要脚踏实地一步步来嘛!
推荐小白学习零基础学Python这本书.
零基础学Python(编程入门项目实践同步视频)(Python3全彩版)京东月销量好评率99%无理由退换京东配送官方店¥39.9购买好了废话不多说,我们开始直接开始爬虫教程吧.
先导入requests库,如果没有安装的同学可以pipinstallrequests来安装.
2.打开需要下载图片的网址开始分析源代码.这里就不公布网址了,怕以为是打广告的.发现图片的URL地址都是按照数字有规律的排序.只要我们知道了图片的数量,是不是就可以用Python写个for循环代码一张一张的下载图片呢.
3.然后还需要图片的数量,果不然查看源代码发现图片数量,再利用小米lxml库的xpath正则就好了
4.在我们都拿到了每一张图片URL之后,就是下载了,我们已经知道了图片的数量,然后只要用for循环访问每一张图片下载二进制数据保存下来就好了.
总结:这里注意的是需要先新建文件夹,给每一个图片的名称来创造文件夹,图片就以序号来命名.再写个判断来该文件夹有没有被新建,避免重复下载资源浪费.
下面看看代码运行的视频:
00:27需要源代码的同学可以留言获取哦.以后会不定期的给大家分享更多的互联网知识经验.