Qu'est-ce que le traitement du langage naturel (NLP) dans le contexte du machine learning ?
2
Dans un modèle bigramme pour la prédiction du prochain caractère, sur quoi se base la prédiction ?
3
Pourquoi ajoute-t-on un caractère spécial '.' au début et à la fin des prénoms dans le modèle bigramme ?
4
Quel est le principal problème de la méthode de comptage pour les N-grammes quand N augmente ?
5
Quel est l'intérêt principal d'utiliser un réseau de neurones avec une couche fully connected pour la prédiction du prochain caractère par rapport à la méthode de comptage ?
6
Que représente la matrice d’embedding \( C \) dans le modèle fully connected inspiré de Bengio et al. ?
7
Quel est l'avantage principal de la fonction d'activation tangente hyperbolique (tanh) par rapport à la sigmoïde dans les couches cachées ?
8
Quelle est la principale motivation d’utiliser un réseau de neurones récurrent (RNN) pour la prédiction de la séquence de caractères ?
9
Quel est un des principaux problèmes que rencontrent les RNN classiques sur les longues séquences ?
10
Quelle est l’innovation principale apportée par la couche LSTM par rapport à un RNN classique ?