获取数据


打开某度,搜索“北京历史天气”,随便打开了一个网站(注意避开广告),发现从2011年到昨天的北京历史天气都可以查询到。


在北京看场雪为什么这么难?_java


那我们下一步就是,


小五,上爬虫!


def get_data(year, month):
    soup = get_soup(year, month)
    all_weather = soup.find('div', class_="wdetail").find('table').find_all("tr")
    data = list()
    for tr in all_weather[1:]:
        td_li = tr.find_all("td")
        for td in td_li:
            s = td.get_text()
            data.append("".join(s.split()))
    res = np.array(data).reshape(-14)
    return res


小五用python爬取得到了北京2011年1月-2019年11月的所有历史天气(包括天气、温度、方向),共3256条数据。

完整爬虫代码和历史天气数据下载地址见文末


为什么这么难?


我们接着说回北京初雪这件事,


说实话,查阅了历史数据,发现今年北京的这场雪下的竟然异常的“准时”。


怎么个准时法呢?


北京1961-2018年期间平均初雪日正是11月29日!


在北京看场雪为什么这么难?_java_02


根据中国气象报的统计数据,北京近些年似乎降雪越来越晚,2010年后多次出现第二年才降初雪的情况。


我们再看看北京每年到底有多少天降雪吧~


小五统计了北京市2011-2019年的各年下雪天数(只要当天的天气含有小雪、大雪就算下雪天)。


我最后甚至把雨夹雪都算上了,还是改变不了北京的降雪天数确实在逐年下降的事实。


最近的两年,北京每年只有四天下过小雪。


在北京看场雪为什么这么难?_java_03


结合前文的初雪日期分布图,我们可以明显看出北京确实下雪越来越晚,而且下雪天数也越来越少了。


难道是气温问题?


再用刚才爬取的北京市历史温度验证一下吧。


爬取得到的当日温度都是4℃/-5℃这种格式的,可以将最低最高温度算术平均作为当日的温度。


这样就可以成功得到北京市的气温走势图√


在北京看场雪为什么这么难?_java_04


额,


看的也不是太明显。


由于北方降雪主要是10月-2月期间,所以统计这段时间的日均温度就够了。


在北京看场雪为什么这么难?_java_05


秋冬季节的温度确实和当年降雪天数有关系,比如2011年气温高降雪就少,2012年气温低降雪就多。但又不太对,尤其最近几年,无论温度高低降雪都少。


经过小五又一番搜索,终于得知与北京郊区相比,北京城区可能受城市热岛效应影响,城区温度较高,确实不利于水汽的凝结。


但是气温并非是影响北京降雪的主要的因素,还有其他几个重要的原因:


  1. 气候干燥降水少。雪是由大量白色不透明的冰晶(雪晶)和其聚合物(雪团)组成的降水。如果没有足够的水分,是没法形成降雪的。北京入冬以来通常空气极度干燥,所以根本没有足够的水汽凝结成雪。

  2. 冷空气不足。降雪的形成需要冷空气和暖湿气流的共同作用。最近几年过境北京的大多都是比较弱的冷空气,真正强大的冷空气并没有几个,来了也不会持续多久,以至于雨滴根本来不及凝结成冰晶就又融化消散了。

  3. 地形影响。北京西部和北部群山环峙,冷空气很难及时攀越群山与水汽相遇。即便越过山脉,冷空气也会居高而下,直接将水汽一冲而散,故无法凝结成雪。

  4. 没有足够的信风条件。虽然靠近东方的渤海,但可惜北京是典型的季风气候,冬季多西北风,仍然很难将水汽带进来。


学习了一波地理知识的东北er朱小五,终于知道北京看场雪有多难了!

 

在东北,下大雪是要放假的。  


那么北京,何时能下一场和东北一样,纷纷扬扬的鹅毛大雪呢?  


平日的北京,太忙了,太快了


下雪后的北京,就真的变成闲适自在,静谧安稳的“北平”了吧!    



最后,放张故宫博物馆的“宫猫”镇楼吧~


在北京看场雪为什么这么难?_java_06