Python离我们最近的案例可能是春运的时候程序员利用Python各种脚本的抢票源码抢到回家的车票了。
其实,Python能做的不仅仅是抢票哦,今天小编就给大家总结了一些Python爬取各种东西的案例,让你看看Python到底有多强大。
从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。
你需要学习:
基本的爬虫工作原理
基本的