Quel problème principal les connexions résiduelles permettent-elles de résoudre dans les réseaux de neurones profonds ?
2
Dans un block ResNet classique, comment adapte-t-on la connexion résiduelle lorsque le nombre de filtres de sortie est différent du nombre de filtres d'entrée ?
3
Quelle est la différence principale entre un block ResNet de base et un block bottleneck ?
4
Pourquoi la fonction d'activation (comme ReLU) est-elle appliquée après l'addition de la partie résiduelle dans un block ResNet ?
5
Quel effet les connexions résiduelles ont-elles sur la fonction de perte (loss) lors de l'entraînement, selon les études ?