入伏的夏天真的太太太太热了!!
一出门感觉分分钟就被融化了!
万万没想到!今年的三伏天从7月11日开始,一共40天!!
也就是说这个痛苦的桑拿天模式还要持续好久!!
头伏:11日-20日,10天;
中伏:21日-8月9日,20天;
末伏:8月10日-8月19日,10天。
这才头伏第四天,已经热得不行了!!
但是!现在正值暑假!
学生党暑假不出去玩,实在是太对不起快乐假期了!
又想出去玩又怕天气太热,真的太难了!
那么如何找到一个天气适合夏日旅游的地方呢?
我们黄帮主特地用Python帮大家简单的分析一波数据,看看最近有哪些地方比较适宜出行。
下面我们开始吧!
获取数据
首先我们需要获得近期各地天气,
这里我们选择天气预报网作为我们的数据来源。
我们先分析下具体网页结构,发现各个地区url仅改变缩写部分,同时在每个页面中提供未来6天天气预报,使用不同的标签进行存放,同时每个省/直辖市中的第一个就是当前省会或直辖市市区。
页面里有7个conMidtab,分别是当天和随后几天的天气信息
可以看到在conMidtab里是该省/直辖市的城市天气,第一个conMidtab2下是省会或市区天气,第3个tr标签起是名称、天气、最高气温和最低气温。
这样就能获得当前省会/市区的天气信息。
数据分析
获得充足数据后,我们对其进行下一步分析。
如何展示各个地区的高温对比呢?
我们推荐使用热力图,可以很清晰的看出温度变化。
这里使用我们上次总结中介绍的seaborn,这个可视化库较多地应用于热力图上,当然许多可视化库都有所包含,有兴趣的话可以自己选择喜欢的可视化库试试哦。
我们将之前获得的数据处理为二维列表,之后转化为np.array格式,之后构建dataframe作为热力图的输入,最后绘制热力图。
多说无益,展示以下代码,有兴趣的同学可以自己尝试尝试。
具体代码最终呈现的效果如下图:
具体代码总结
最后我们得到了整体热力图的情况,可以看出像昆明,拉萨,近期的气温还是很适合出行的。
如果你有相关的出行计划,也可以尝试利用python进行分析,甚至可以加入更多维度的评判。
最后祝拥有快乐暑假的各位同学们!暑假快乐!
具体代码﹀
﹀
﹀
以上就是这周的干货分享,如果想继续看干货,
还想让大佬们输出更多技巧
赶快收藏并转or发我们吧。
点击“guan主”,即可第一时间阅读每周干货哦!