1、数据迁移过程中,验证数据拷贝后大小是否一致;

shell命令:

hadoop fs -count -q 目录 ps: 查看目录下总的大小

dfs -count -q 目录 ps:一样的

hadoop fs -du 目录 ps:查看目录下每个子目录的大小


2、随机森林和GBDT的区别