大家好,今天是周日,来点愉快的。昨天在读书的时候,看到一个案例说美国有一位大哥,为了找到一个合适的女朋友,写了一段代码拿到了婚恋网站的一些妹子数据,然后使用一些模型对数据进行分类,接着根据分类结果找到合适自己的那一类妹子,最后与这一类妹子逐个约会,在约会了近百次之后,终于快乐的结婚了。
我定睛一看,不就爬数据建模分类吗,这些咱也会,虽然有女朋友了,但是为了锻炼技术,我也要操作一番试试,于是找到某婚恋交友网站
接着熟练的F12,查找数据包,再熟练的启动Python,写一段爬虫请求数据,然后对数据进行清洗过滤掉一些没有用的信息,最终拿到下面的数据
对于这组数据,一些描述性分析就不需要做了,回去看看了那位美国猛男是对数据用Kmodes进行分类
因为在喜欢的类型这一列中,妹子们一共喜欢9种类型的男性:稳重内敛、温柔体贴、落落大方、活泼开朗等,于是乎先对一些连续的数据使用Kmeans分分类,看看分几类合适
经过一番操作,根据误差收敛图等指标决定将这些妹子分为4类比较合适,于是开始分类
经过并不漫长的等待之后,可以看到我们也成功的对这些妹子数据成功分类了。现在要做的就是根据自己的类型回去找到属于自己的那一类,比如要是你的性格是稳重内敛,那就可以从数据中取出第二类妹子的id,然后打开相亲网站通过id找到妹子就行
当然对于我这样稳重内敛+温柔体贴+落落大方等标签全占了的靓仔,还需要更多的模型,于此再次打开网站想要操作一番,可是这时候女朋友进来了,看到电脑屏幕上的相亲网站⋯⋯不过由于医院的Wi-Fi还算快,这篇文章还是成功的发出来了