互动测验

测试你的知识!

1
在自然语言处理中,自回归模型(如 GPT)与编码器模型(如 BERT)的主要区别是什么?
2
在 Transformer 的自注意力机制中,Query(Q)、Key(K)和 Value(V)矩阵的作用是什么?
3
在 Transformer 架构中,注意力层和前馈层之间的残差连接有什么作用?
4
在实现双语言模型时,导致生成文本质量差的主要限制是什么?
5
Transformer 解码器和编码器中使用的自注意力层的主要区别是什么?
6
在 Vision Transformer(ViT)中,图像在输入 Transformer 之前是如何处理的?
7
Vision Transformer 中的 'class token' 有什么作用?
8
与 Vision Transformer 相比,Swin Transformer 的主要创新是什么?
9
Swin Transformer 中相对位置嵌入的优势是什么?
10
CLIP 模型如何通过文本和图像的联合训练?
Score: 0/10
得分: 0/10