目前在网上流传着一套淘宝邮箱数据库,博主也比较好奇,因此购买来后进行了一番可用性分析。有如下发现,供同行参考。

一、数据真实性确实不容置疑,都是支付宝实名认证的邮箱。真不知道是哪路大神能把这样的邮箱数据采集过来,确实非常厉害。

二、这个数据的储存为txt格式的,而且都是按照字符进行排列存储的,进行过二次处理。

三、数据总量为2500万,发现单个分类的邮箱没有重复,但是不同行业之间的邮箱有重复,一个人买多样产品,这也是正常的。

四、淘宝邮箱数据的有些帐号为非人工帐号,是批量注册的。这个分析的原因可能是×××时,有人批量注册的帐号。

综合以上四点分析,个人觉得这套淘宝邮箱数据库可信但不可全信,给这套数据打个70分吧。