2019.12.31更新:比赛代码阶段已于10月31日结束,看了下最后的排行榜,A60/1224 | B47(熊霸天下)。

前言

由于马上要开题了,对于本赛题也没啥创新的思路,遂总结结束。

最初的想法便是通过比赛来进行PyTorch的学习,只是一旦加入正在进行的赛题,就会情不自禁的陷入调参的循环,反而浪费体力,不能深入基础。遂此后还应牢记初衷。

实验设备为1个1080Ti。如下是EDA的一些图表:

DF“观云识天”-机器图像算法赛道-天气识别总结_数据


DF“观云识天”-机器图像算法赛道-天气识别总结_日志记录_02


DF“观云识天”-机器图像算法赛道-天气识别总结_数据_03

实验概述

训练所用方法:

  • 数据增强(放缩、随机大小裁剪、翻转),Auto_augment,随机擦除(RandomErasing)
  • 学习率:RAdam,Lookahead
  • 半精度训练(APEX)
  • Random Image Cropping And Patching(RICAP)
  • 模型:EfficientB3、Densenet121、xception等

测试:

  • TTA

其他:

  • 数据分析(EDA,不平衡过采样)
  • 训练日志记录(tensorboardX)
  • ReduceLROnPlateau
  • 集成方案:按类别和按输出概率

结果

线上单模型F1 0.845-0.860左右,集成0.865左右。
线下训练集:验证集=9:1,验证集0.85左右。

​Github地址(PyTorch)​