读书笔记[Efficient Active Learning for Image Classification and Segmentation using a Sample Selection and Conditional Generative Adversarial Network]

原文链接

Efficient Active Learning for Image Classification and Segmentation using a Sample Selection and Conditional Generative Adversarial Network

简介

这篇文章声称提出了一种更先进的Active Learning的方法可以用在图像分割和分类问题中。然而，全文的重点放在了使用GAN生成fake sample上，对于如何选取fake sample去训练一带而过，感觉有点蹭热度的嫌疑。

introduction

一如既往的抨击之前的AL方法。

现有的AL方法生成的labeled sample太少了
在选取sample时使用了hand crafted features，和cnn的训练特征阈不同（吐槽，Cost-Effective Active Learning for Deep Image Classification了解一下?)

Methods

使用cGAN生成fake sample

他把GAN和cGAN的公式拿了过来凑字数。。。

为了使生成的图像与原图像不同，在训练时加上Lcontent项。

NMI表示normalized mutual information，表示互信息。这里倒是了解了一下图像之间的互信息求法。
传统的互信息定义为：

图像匹配中，可以使用直方图法来定义互信息（即在灰度上分块，然后统计图像出现个色块的频率，计算其entropy H(X)，根据公式，I(X,Y)=H(X)+H(Y)-H(X,Y)，得到互信息）
还有其他的互信息统计方法，包括参数估计，kernel估计等等。

VGG表示图像在feature space的L2差异。

MSG表示图像在pixel space的L2差异。

Bayesian Neural Networks

em…这里啥都没说，就列了个公式，强烈怀疑作者都没有看过这篇paper，只是随便拿来蹭热度了。

实现细节

用VGG16训练Imagenet数据集来做数据提取，然后用labeled sample去调整最后两层分类。
剩下的labeled sample扔进cGAN里生成sample，然后每个class挑16个放进sample pool里做训练。
迭代直到converge

总结

居然发表在MICCAI上。。。找时间看一下贝叶斯neural network吧。