在北京看场雪为什么这么难?

朱小五 凹凸数据

一下雪,北京就成了北平。

11月29日,北京2019年的“初雪”终于来了,

大家花式“秀雪”的视频和图片成功霸占了我的朋友圈。

小五在北京待了快两年,表示看到北京的雪实在是太太太少了。

少到什么程度呢?

印象中一只手可以数出来。

口说无凭,拿数据说话吧~

获取数据

打开某度,搜索“北京历史天气”,随便打开了一个网站(注意避开广告),发现从2011年到昨天的北京历史天气都可以查询到。

那我们下一步就是,

小五,上爬虫!


def get_data(year, month):
    soup = get_soup(year, month)
    all_weather = soup.find('div', class_="wdetail").find('table').find_all("tr")
    data = list()
    for tr in all_weather[1:]:
        td_li = tr.find_all("td")
        for td in td_li:
            s = td.get_text()
            data.append("".join(s.split()))
    res = np.array(data).reshape(-1, 4)
    return res

小五用python爬取得到了北京2011年1月-2019年11月的所有历史天气(包括天气、温度、方向),共3256条数据。 【完整爬虫代码和历史天气数据下载地址见文末】

为什么这么难?

我们接着说回北京初雪这件事,

说实话,查阅了历史数据,发现今年北京的这场雪下的竟然异常的“准时”。

怎么个准时法呢?

北京1961-2018年期间平均初雪日正是11月29日!

根据中国气象报的统计数据,北京近些年似乎降雪越来越晚,2010年后多次出现第二年才降初雪的情况。

我们再看看北京每年到底有多少天降雪吧~

小五统计了北京市2011-2019年的各年下雪天数(只要当天的天气含有小雪、大雪就算下雪天)。

我最后甚至把雨夹雪都算上了,还是改变不了北京的降雪天数确实在逐年下降的事实。

最近的两年,北京每年只有四天下过小雪。

结合前文的初雪日期分布图,我们可以明显看出北京确实下雪越来越晚,而且下雪天数也越来越少了。

难道是气温问题?

再用刚才爬取的北京市历史温度验证一下吧。

爬取得到的当日温度都是4℃/-5℃这种格式的,可以将最低最高温度算术平均作为当日的温度。

这样就可以成功得到北京市的气温走势图√

额,

看的也不是太明显。

由于北方降雪主要是10月-2月期间,所以统计这段时间的日均温度就够了。

秋冬季节的温度确实和当年降雪天数有关系,比如2011年气温高降雪就少,2012年气温低降雪就多。但又不太对,尤其最近几年,无论温度高低降雪都少。

经过小五又一番搜索,终于得知与北京郊区相比,北京城区可能受城市热岛效应影响,城区温度较高,确实不利于水汽的凝结。

但是气温并非是影响北京降雪的主要的因素,还有其他几个重要的原因:

  1. 气候干燥降水少。雪是由大量白色不透明的冰晶(雪晶)和其聚合物(雪团)组成的降水。如果没有足够的水分,是没法形成降雪的。北京入冬以来通常空气极度干燥,所以根本没有足够的水汽凝结成雪。

  2. 冷空气不足。降雪的形成需要冷空气和暖湿气流的共同作用。最近几年过境北京的大多都是比较弱的冷空气,真正强大的冷空气并没有几个,来了也不会持续多久,以至于雨滴根本来不及凝结成冰晶就又融化消散了。

  3. 地形影响。北京西部和北部群山环峙,冷空气很难及时攀越群山与水汽相遇。即便越过山脉,冷空气也会居高而下,直接将水汽一冲而散,故无法凝结成雪。

  4. 没有足够的信风条件。虽然靠近东方的渤海,但可惜北京是典型的季风气候,冬季多西北风,仍然很难将水汽带进来。

学习了一波地理知识的东北er朱小五,终于知道北京看场雪有多难了!

在东北,下大雪是要放假的。

那么北京,何时能下一场和东北一样,纷纷扬扬的鹅毛大雪呢?

平日的北京,太忙了,太快了

下雪后的北京,就真的变成闲适自在,静谧安稳的“北平”了吧!

最后,放张故宫博物馆的“宫猫”镇楼吧~

相关爬虫源码和北京历史天气数据已上传github:https://github.com/zpw1995/aotodata/tree/master/interest/weather

作者:朱小五,互联网公司数据分析师。热衷于Python爬虫,数据分析,可视化,个人公众号《凹凸玩数据》,有趣的不像个技术号~ End