C’est un domaine à l’intersection du Machine Learning et de la linguistique. Il a pour but d’extraire des informations et une signification d’un contenu textuel. Le Traitement Automatique du Langage naturel (TAL) ou Natural Language Processing (NLP) en anglais trouve de nombreuses applications dans la vie de tous les jours: …
Le Traitement Automatique du Langage naturel (TAL) ou Natural Language Processing (NLP) en anglais trouve de nombreuses applications dans la vie de tous les jours: traduction de texte (DeepL par exemple) correcteur orthographique résumé automatique d’un contenu synthèse vocale classification de texte analyse d’opinion/sentiment
Les grands principes Le TAL est généralement composé de deux à trois grandes étapes: Pré-traitement : une étape qui cherche à standardiser du texte afin de rendre son usage plus facile
Dans cet article, nous allons couvrir les tâches de TAL les plus communes pour lesquelles des outils spécifiques au français existent. Nous utiliserons principalement SpaCy. SpaCy est une jeune librairie (2015) qui offre des modèles pré-entraînés pour diverses applications, y compris la reconnaissance d’entités nommées.
Ce cours vous apprendra à utiliser les bibliothèques de NLP de l’écosystème Hugging Face : ???? Transformers, ???? Datasets, ???? Tokenizers et ???? Accelerate, ainsi que le Hub. C’est totalement gratuit et sans publicité. See full list on huggingface.co
Voici un bref aperçu du cours : 1. Les chapitres 1 à 4 présentent les principaux concepts de la bibliothèque ???? Transformers. À la fin de ces chapitres, vous serez familier avec le fonctionnement des transformers et vous saurez comment utiliser un modèle présent sur le Hub, le finetuner sur un jeu de données, et partager vos résultats sur le Hub 2
À propos des auteurs de ce cours : Abubakar Abid a obtenu son doctorat en apprentissage automatique appliqué à Stanford. Pendant son doctorat, il a fondé Gradio, une bibliothèque Python open sourcequi a été utilisée pour construire plus de 600 000 démos d’apprentissage automatique. Gradio a été rachetée par Hugging Face, où Abubakar occupe désormai
Voici quelques réponses aux questions fréquemment posées : 1. Suivre ce cours mène-t-il à une certification ? Actuellement, nous n’avons pas de certification pour ce cours. Cependant, nous travaillons sur un programme de certification pour l’écosystème Hugging Face. Restez à l’écoute 2. Combien de temps dois-je consacrer à ce cours ? Chaque chapi
Êtes-vous prêt à commencer ? Dans ce chapitre, vous apprendrez : 1. à utiliser la fonction pipeline()pour résoudre des problèmes de NLP comme la génération de texte et la classification, 2. l’architecture d’un transformer, 3. comment faire la distinction entre les différentes architectures d’encodeur, de décodeur et d’encodeur-décodeur ainsi que le