在大城市租房成为了每一个来这座城市打拼的年轻人不可避免的一个环节。 而手头相对并不宽裕的他们,房租即是他们每月工资开销的大头,在心仪的地段找到一个性价比相对较高的落脚地,帮助他们节约开销。

这篇报告大致分析了纽约市房租、户型、地理位置等状况。希望通过这些既有数据能对房租有一个大致的判断,从而帮助我们找到“最合适”的出租房。样本数据来源为RentHop租房网站。

 

首先,户型是每个租房客都很关心的问题。

机器学习中纽约市房价算法 纽约的平均房价_聚类

机器学习中纽约市房价算法 纽约的平均房价_人工智能_02

可见,一卫的房型是最为普遍的,其数量要远远超过其他类型的房子。

机器学习中纽约市房价算法 纽约的平均房价_数据结构与算法_03

机器学习中纽约市房价算法 纽约的平均房价_人工智能_04

而在卧室方面,一居以及两居室的小户型则最为常见。

从户型整体情况来看:一室一卫和两室一卫的户型最普遍。

机器学习中纽约市房价算法 纽约的平均房价_机器学习中纽约市房价算法_05

其次,房子的地理位置也是租房客们很关心的一个要素。

我们根据房租的地理位置而不是行政划分来大致地看一下纽约地区房屋地理分类,在这里我们使用了Kmeans算法来进行聚类。

如下所示,这时纽约市房屋出租的全部信息。

机器学习中纽约市房价算法 纽约的平均房价_机器学习中纽约市房价算法_06

我们由简单到复杂,在地理位置上对这些地点进行数学上的分类。

如果我们简单进行3分切割的时候:

机器学习中纽约市房价算法 纽约的平均房价_机器学习中纽约市房价算法_07

如果我们进行10分切割的时候:

机器学习中纽约市房价算法 纽约的平均房价_数据结构与算法_08

我们可以任意地根据房屋的密度对整个市区进行地理上的划分,也可以根据个人的需要对区块大小和数量进行调整。希望这样的划分可以打破行政区域的固定思维,在下一节加入价格这个重要维度的时候尽可能地帮助我们做出正确的决策。

 

再次,我们将要讨论房屋的配套。

这是最为常见的20种房屋配套:

机器学习中纽约市房价算法 纽约的平均房价_地理位置_09

最后,我们要看一下房屋租金的情况。

房租受多种因素影响,包括户型,地理位置,房屋配套等等因素。下面,我们就来逐个分析以上因素对价格的影响。

 

1. 户型和价格

由于房租常常是以整套房子的形式挂在网上的,所以自然卧室的数量越大,整个房租的档位也就越高。但是为了验证这个假设,我们必须要看一下房租的价格是不是会随着卧室数量的增高而增高。

 

经过计算,无论是只计算卧室数量还是卧室和卫生间数量加总在一起进行计算,其和价格的相关性都很小。

 

 

Bedrooms

Totalrooms

Price

Bedrooms

1.000000

0.936217

0.059485

Totalrooms

0.936217

1.000000

0.081037

Price

0.059485

0.081037

1.000000

*Totalrooms=Bedrooms + Bathrooms

 

由此可见,我们根据卧室(或者卧室加卫生间的总数)对价格进行标准化修正是没有问题的。这里以平均每间卧室的单价进行分析,单个房间的价位普遍在1000到3000左右不等。

机器学习中纽约市房价算法 纽约的平均房价_机器学习中纽约市房价算法_10

2. 地理位置和价格

我们可以继续使用聚类的分析方法,在经纬度的基础上,加上价格的维度,会使之前的分布图更加直观有效:

 

在加入价格这个维度之后,我们把分类的层级提高到了20层,旨在增加更多的选择空间。图中相同颜色的房屋可以作为仅考虑地理位置和房租水平的同级别选择。

机器学习中纽约市房价算法 纽约的平均房价_机器学习中纽约市房价算法_11