0%

BEIT: BERT Pre-Training of Image Transformers

发表于 2023-03-01 更新于 2025-11-03 分类于论文阅读

原始论文: BEIT: BERT Pre-Training of Image Transformers

文章主旨

提出了一个新的视觉表征方案BEiT，基于自监督任务MIM:masked image modeling。

模型架构

BEiT 将图像提取vector, 主要是通过自监督的方式实现，主要思路是：利用vector 预测MASK patch
Image Representations
模型实验