对比度归一化

预处理

由于原始输入往往以深度学习架构难以表示的形式出现，需要许多较精细的预处理。计算机视觉通常只需要相对少的这种预处理。图像应该被标準化，从而使得它们的像素都在相同并且合理的範围内，比如

或者

，将

中的图像与

中的图像混合通常会导致失败。将图像格式化为具有相同的比例严格上说是一种必要的预处理。

将每个样本置于更规範的形式，减少模型需要考虑的变化量。减少数据中的变化量既能够减少泛化误差，也能够减小拟合训练集所需模型的大小。更简单的任务可以通过更小的模型来解决，而更简单的解决方案泛化能力一般更好。这种类型的预处理通常被设计为去除输入数据中的某种可变性，这对于人工设计者来说是容易描述的，并且人工设计者能够保证不受到任务影响。当使用大型数据集和大型模型训练时，这种预处理通常是不必要的，并且最好只是让模型学习哪些变化性应该保留。例如，用于分类 ImageNet 的 AlexNet 系统仅具有一个预处理步骤：对每个像素减去训练样本的平均值。

对比度表示

在许多任务中，对比度是能够安全移除的最为明显的变化源之一。简单地说，对比度指的是图像中亮像素和暗像素之间差异的大小。量化图像对比度有许多方式。在深度学习中，对比度通常指的是图像或图像区域中像素的标準差。假设我们有一个张量表示图像

，其中，

表示第i行第j列红色的强度，

对应的是绿色的强度，

对应的是蓝色的强度。然后整张图像的对比度可以表示如下：

其中，

是整张图像的平均强度，满足

全局对比度归一化

全局对比度归一化（Global contrast normalization, GCN）旨在通过从每个图像中减去其平均值，然后重新缩放其使得其像素上的标準差等于某个常数

来防止图像具有变化的对比度。这种方法非常複杂，因为没有缩放因子可以改变零对比度图像（所有像素都具有相等强度的图像）的对比度。具有非常低但非零对比度的图像通常几乎没有信息内容。在这种情况下除以真实标準差通常仅能放大感测器噪声或压缩伪像。这种现象启发我们引入一个小的正的正则化参数

来平衡估计的标準差。或者，我们至少可以约束分母使其大于等于

。给定一个输入图像

，全局对比度归一化产生输出图像

，定义为

从大图像中剪下感兴趣的对象所组成的数据集不可能包含任何强度几乎恆定的图像。在这些情况下，通过设定

来忽略小分母问题是安全的，并且在非常罕见的情况下为了避免除以 0，通过将

设定为一个非常小的值比如说

。随机剪裁的小图像更可能具有几乎恆定的强度，使得激进的正则化更有用。

尺度参数

通常可以设定为 1，或选择使所有样本上每个像素的标準差接近 1。

上式中的标準差仅仅是对图像L2 範数的重新缩放（假设图像的平均值已经被移除）。我们更偏向于根据标準差而不是 L2 範数来定义 GCN，因为标準差包括除以像素数量这一步，从而基于标準差的 GCN 能够使用与图像大小无关的固定的 s。然而，观察到 L2 範数与标準差成比例，这符合我们的直觉。我们可以把 GCN 理解成到球壳的一种映射。如图1所示。在图1中，左边是原始的输入数据可能拥有任意的範数；中间是

时候的 GCN 可以将所有的非零样本投影到球上，这里令

，由于使用的 GCN 是基于归一化标準差而不是 L2 範数，所得到的球并不是单位球；右边是

的正则化 GCN 将样本投影到球上，但是并没有完全地丢弃其範数中变化，

和

的取值与之前一样。

对比度归一化

对比度归一化

基本介绍

预处理

对比度表示

全局对比度归一化

局部对比度归一化