读书笔记[Efficient Active Learning for Image Classification and Segmentation using a Sample Selection and Conditional Generative Adversarial Network]

原文链接

Efficient Active Learning for Image Classification and Segmentation using a Sample Selection and Conditional Generative Adversarial Network

简介

这篇文章声称提出了一种更先进的Active Learning的方法可以用在图像分割和分类问题中。然而,全文的重点放在了使用GAN生成fake sample上,对于如何选取fake sample去训练一带而过,感觉有点蹭热度的嫌疑。

introduction

一如既往的抨击之前的AL方法。

  • 现有的AL方法生成的labeled sample太少了
  • 在选取sample时使用了hand crafted features,和cnn的训练特征阈不同(吐槽,Cost-Effective Active Learning for Deep Image Classification了解一下?)

Methods

使用cGAN生成fake sample

他把GAN和cGAN的公式拿了过来凑字数。。。



为了使生成的图像与原图像不同,在训练时加上Lcontent项。

NMI表示normalized mutual information,表示互信息。这里倒是了解了一下图像之间的互信息求法。
传统的互信息定义为:

图像匹配中,可以使用直方图法来定义互信息(即在灰度上分块,然后统计图像出现个色块的频率,计算其entropy H(X),根据公式,I(X,Y)=H(X)+H(Y)-H(X,Y),得到互信息)
还有其他的互信息统计方法,包括参数估计,kernel估计等等。

VGG表示图像在feature space的L2差异。

MSG表示图像在pixel space的L2差异。

Bayesian Neural Networks

em…这里啥都没说,就列了个公式,强烈怀疑作者都没有看过这篇paper,只是随便拿来蹭热度了。

实现细节

  • 用VGG16训练Imagenet数据集来做数据提取,然后用labeled sample去调整最后两层分类。
  • 剩下的labeled sample扔进cGAN里生成sample,然后每个class挑16个放进sample pool里做训练。
  • 迭代直到converge

总结

居然发表在MICCAI上。。。找时间看一下贝叶斯neural network吧。