Aller au contenu

🗨️ NLP 🗨️

Ce cours est grandement inspiré de la série de vidéo de Andrej Karpathy "Building makemore" qui traîte les NLP avec une approche de prédiction du prochain token. Le cours aborde d'abord des modèles très simples pour avoir une intuition sur le traîtement de données discrètes avec un réseau neurones puis les modèles se complexifient petit à petit.

Notebook 1️⃣ : Introduction

Ce notebook introduit le concept de natural language processing (NLP), décrit le cours à venir et construit un dataset que l'on utilisera dans les notebooks suivants.

Notebook 2️⃣ : Bigramme

Ce notebook introduit l'architecture bigramme pour la prédiction du prochain caractère dans un objectif de génération de prénoms.

Notebook 3️⃣ : Réseau Fully Connected

Ce notebook implémente l'architecture d'un article scientifique utilisant un réseau fully connected pour la prédication du prochain caractère.

Notebook 4️⃣ : WaveNet

Ce notebook implémente l'architecture d'un article scientifique utilisant un wavenet pour la prédiction du prochain caractère.

Notebook 5️⃣ : RNN

Ce notebook présente le concept de réseau de neurones récurrents et propose une implémentation d'un réseau de neurones récurrents pour la prédiction du prochain caractère à partir des pièces de Molière.

Notebook 6️⃣ : LSTM

Ce notebook introduit l'architecture long short-term memory (LSTM) et l'implémente en pytorch pour la prédiction du prochain caractère.