热议中的房价

4 月 16 日国家统计局发布了 3 月份 70 个大中城市房价波动情况,在当前大背景下,不少城市的房价依然一路狂奔,一时间,房价高又成了热议的话题。

这是个老大难问题,作为一名数据爱好者,我更喜欢用数据说话,今天来数说一线城市北上广深的房价情况。

一线城市二手房房价面面观

房价相关的网站有很多,比如58同城、安居客和链家,网友都说链家房价可信度最高,于是我就爬取了链家网上北上广深近 30w 条二手房信息,并做了一定的数据分析及可视化。

如需房价 csv 文件,在公众号后台回复 链家房价 即可。

先来看看这四个城市的总体分布情况。

数说一线城市二手房房价_房价

从高中我们就被告知,看图要注意看 x、y 轴代表什么含义,第一眼看上去好像广州的曲线峰值最高,稍不注意就会误以为广州房价最贵,事实上,广州房价最为便宜;上图 x 轴表示房价范围,y 轴表示 x 轴对应的房价在所有的房价中所占比重,北京上海深圳的曲线几乎重合,都是比较矮而胖,y 轴峰值对应的 x 轴坐标比较大,大部分房价集中在 50000 附近,而且房价最大值差不多都突破了 150000,在 150000 这一点处的占比约为 0.000001,乘以总数几十w,再乘以宽度,天价二手房不在少数;相比之下,广州的曲线显得瘦而高,更大一部分房价集中在 25000 左右,最大值最小值差异也没有那么大,广州好感+1+1+1。

数说一线城市二手房房价_房价_02

而这幅北上广深的房价统计描述图,无论是从房价的最大值、中位数、平均值中的任意一个方面来看,都用具体数字验证了我们之前的结论。

下面我们重点来看看北京的。

数说一线城市二手房房价_房价_03

从面积饼图可以看出,超过 70% 的北京二手房面积位于 (40,120] 区间,这也是我们生活中所看到的大多数家庭的选择(无论哪个城市);有占比超过 2% 的蜗居房,也有超过 10% 的 160 平米超大户型,目测三室一厅起步,可以说非常土豪了。

数说一线城市二手房房价_房价_04

从建筑类型饼图可以很清楚地看出北京二手房各种建筑类型的占比情况,那么问题来了,什么是板楼和塔楼呢?(以下内容摘自百度百科)

板楼:一般建筑层数不会超过12层。板楼的平面图上,长度明显大于宽度,板楼有两种类型,一种是长走廊式的,各住户靠长走廊连在一起;第二种是单元式拼接,若干个单元连在一起就拼成一个板楼。板楼最大的优势是户型规矩、互视小、通风、日照良好。

塔楼:一般是指高层建筑。从楼房的平面图上理解塔楼和板楼。塔楼的平面图特点是:若干户,一般多于四五户共同围绕或者环绕一组公共竖向交通形成的楼房平面,平面的长度和宽度大致相同,这种楼房的高度从12层以上到35层,超过35层是超高层,塔楼一般是一梯四户到一梯12户。塔楼外观像塔的楼型,平面的长度和宽度大致相同,一般塔楼的同层住户在6户以上。简单描述就是看到建筑显“细长”。

我的理解就是,板楼高度低,层数少,因此建筑密度低,地皮利用率低,所以房价教高;

而塔楼高度相对较高,房价相对较低,但是供水供电、电梯采光等条件相对不如板楼。

一句话,土豪住板楼,而非土豪请往高处走。

你见过几十层的别墅吗?

再来看看北京分区房价

数说一线城市二手房房价_房价_05

注意 x 轴是北京各个区,而且是按照区中心到市中心的距离从小到大排列的,西城区离市中心最近,房价最高,延庆区离市中心最远,房价也差不多最低,从整体来看,距离市中心越远,房价越低(这大概不用分析就能得出来),所以我又定量分析了下。

数说一线城市二手房房价_房价_06

经计算,上图拟合曲线的斜率为 -862元/千米,也就是说,每远离北京市中心 1 千米,二手房房价就约便宜 862 RMB,不过北京市中心的房价高得感人,北京市区半径约 30千米,按照每公里 862 元的减法,有人已经减出了北京市区发现还是买不起房,真是太难了。

知友们对房价的看法

众所周知,知乎云集了全球高学历高智商的精英人赢(下图来自网络)。

数说一线城市二手房房价_房价_07

 

所以我们有必要听听这些人对于当今房价的看法,对此,我爬取了知乎上有关房价的五个话题的回答,分别取前五十个共计250个优质回答,保存到 csv 中。

如需房价话题 csv 文件,在公众号后台回复 知乎房价 即可。

数说一线城市二手房房价_房价_08

数说一线城市二手房房价_房价_09

数说一线城市二手房房价_房价_10

我寻寻觅觅,看了又看,终于找到几个体现知乎水平的回答了,真是文采斐然(为保证知友隐私,皆未贴上知乎 ID,请知友见谅)。

中国房价下跌日,家祭无忘告乃翁。by 陆游。你们要比皮是吧。垂死病中惊坐起,那个小区能抄底?中国房价下跌日,家祭无忘告乃翁。by 陆游。你们要比皮是吧。垂死病中惊坐起,那个小区能抄底?

一顿分析猛如虎,骗赞引流把钱数,爽文读了把掌鼓,韭菜没房心里苦;屌丝也想把身翻,无奈钱包两百三,万恶地产开发商,害我蜗居农民房;咸鱼也想有家住,无奈没钱付首付,女友劈腿高帅富,无奈只能把管撸;为什么有些知乎专家们喜欢长篇大论分析,洋洋洒洒5000字,引经据典各种数据,就是为了论证房价必跌,屌丝们千万别上车。

回归正题,总觉得对这些爬取下来的文本少了点代码分析,二话不说一顿操作,先生成词云。

数说一线城市二手房房价_房价_11

 

这个词云图应该去掉,【就是】【如果】【可以】【现在】这些非相关词的,但是,透过这些纷繁的外表,我们还是分明看到了词云图中清晰可见的四个大字:不会下降。

看来我和全球精英们的看法一致。