上一章节中,我们通过模拟点击下载了沪深所有沪深个股历史日线数据。该方式有些不够完善,遇到股票代码错误,会抛出异常暂停,需要添加处理异常的代码。修改后的代码如下:
另外,下载一只股票大概需要4,5秒左右的时间,多只股票,需要8,9个小时才能下载完。有没有更好更快的方法呢?有,还是用python爬虫的方式。本章节将进一步介绍如何编写python爬虫程序,获取沪深个股历史日线数据。我们还是按以下步骤进行:1.确定爬取目标网址2.查看网页源代码,确定目标html元素关键节点位置3.设置浏览器为开发者模式4.搜寻关键网址链接5.分析链接地址提交参数6.构造提交网址字符串和请求头7.保存下载的文件
1.确定爬取目标网址我们要爬取目标网址为:http://quotes.money..