BEIT: BERT Pre-Training of Image Transformers 发表于 2023-03-01 更新于 2023-04-18 分类于 论文阅读 原始论文: BEIT: BERT Pre-Training of Image Transformers 文章主旨 提出了一个新的视觉表征方案BEiT,基于自监督任务MIM:masked image modeling。 模型架构 BEiT 将图像提取vector, 主要是通过自监督的方式实现,主要思路是:利用vector 预测MASK patchImage Representations 模型实验