0%

BEIT: BERT Pre-Training of Image Transformers

文章主旨

  • 提出了一个新的视觉表征方案BEiT,基于自监督任务MIM:masked image modeling

模型架构

beit.png

  • BEiT 将图像提取vector, 主要是通过自监督的方式实现,主要思路是:利用vector 预测MASK patch

    Image Representations

  • 模型实验