QCM Interactif

Quelle est la principale différence entre la descente du gradient classique et la descente du gradient stochastique (SGD) ?

Quel est l'effet principal de l'ajout du terme momentum dans la descente du gradient stochastique avec momentum ?

Quel problème majeur Adagrad rencontre-t-il lors de l'entraînement d'un modèle ?

En quoi RMSProp améliore-t-il l'optimizer Adagrad ?

Pourquoi Adam est-il souvent recommandé comme optimizer par défaut ?

Score: 0/5