QCM Interactif

Quelle est la principale fonction d’un tokenizer dans le contexte des modèles de langage (LLM) ?

Pourquoi les LLM ont-ils souvent des difficultés à effectuer des opérations simples sur les chaînes de caractères, comme inverser un mot ?

Quel est l’avantage principal de l’algorithme byte-pair encoding (BPE) dans la construction d’un tokenizer ?

Pourquoi le tokenizer de GPT-2 rend le modèle moins performant pour le traitement de code Python ?

Quel est l’impact principal d’un tokenizer entraîné majoritairement sur des données en anglais sur les performances d’un LLM dans d’autres langues ?

Score: 0/5