通用思路

数据增强(Data Augmentation)一定要把握住核心:增强后的数据是「合理的」数据。

常见的思路有以下几种:

  1. 数据变换(Data Transformation),例如裁切、变形。
  2. 数据抖动 / 噪声(Data Jitter / Noise):例如某个特征维度加随机噪声。
  3. 数据压缩(Data Compression):例如 PCA、ZCA。
  4. 数据生成(Data Generation):例如 GAN。

其中前两种思路可能对于不同类型的数据(例如图像、音频数据),其具体做法不同;而后两种思路可能对于不同类型的数据,其做法也是基本类似的。

图像数据

  • 二维空间变换

    • 空间独立:裁剪(Cropping)、翻转(Flipping)、旋转(Rotation)、缩放(Scaling)。
    • 空间交叉:模糊(Blur)、畸变(Distortion)。
  • 随机抖动 / 噪声

    • 噪声类型:随机噪声(Random Noise)、高斯噪声(Gaussian Noise)、椒盐噪声(Pepper and Salt Noise)。
    • RGB 色彩空间:红色(Red)、绿色(Green)、蓝色(Blue)。
    • HSV 色彩空间:色相(Hue)、饱和度(Saturation)、明度(Value)。
    • HSL 色彩空间:色相(Hue)、饱和度(Saturation)、亮度(Lightness)。
    • 其他维度:对比度(Contrast)、锐度(Acutance)。