le corpus c'est quoi
Corpus de textes : composer mesurer interpréter
Un corpus est un recueil composite où est regroupée une collection de textes avec une volonté de cohérence (Mayafre 2002) Ainsi un corpus consiste en un regroupement de textes et donc à une addition ou à un cumul de don-nées : ce rassemblement de textes semble fonctionner par agrégation |
TEXTE ET CORPUS
Mais pour d’autres le corpus est en fait issu d’un travail préalable puisque l’ensemble est restreint à ce qui est considéré comme « représentatifé » ; c’est le cas de Riegel (1994) et al qui spécifient de surcroît que les données doivent être « attestées » : « On peut rassembler un ensemble de textes ou d’énoncés |
Quelle est la différence entre Corpus et corpuscule ?
En droit, le corpus renvoie par ellipse, au corpus juris, c'est-à-dire au corps de droit romain tandis qu'en physique corpus n'est guère utilisé et corpuscule qui prend le sens de « particule », constituant discret de la matière n'apparaît guère comme son diminutif.
Qu'est-ce que le corpus de test ?
le corpus de test, qui sert à vérifier la qualité de l'apprentissage à partir du corpus d'apprentissage. Le calibrage des volumes des corpus se discute en fonction du problème, mais il est fréquent d'utiliser les 2/3 du corpus initial pour l'apprentissage et le tiers restant pour effectuer les tests.
Qu'est-ce que le corpus de textes ?
Corpus de textes, textes en corpus. Problématique et présentation. En prenant l’initiative de ce volume de Corpus, nous avions choisi de procéder à un appel assez large, afin de faire le point sur des tendances actuelles des travaux sur corpus ancrés dans la textualité des faits de discours.
Qu'est-ce que le corpus parallèle ?
Exemple, si l'on découpe le corpus initial en 10 sous-corpus, numérotés de 1 à 10 : On appelle corpus parallèle un ensemble de couples de textes tel que, pour un couple, un des textes est la traduction de l'autre.
Définitions
2Au sens trivial si sens trivial il y a , tel, du moins, qu'il est recensé dans les dictionnaires d'usage courant, un corpus est un recueil de pièces ou de documents qui concernent une même matière, discipline ou doctrine. Mais cette acception large et floue se spécifie dans ses usages et se spécialise dans certains secteurs de la connaissance. En
Linguistique
3Dans les sciences du langage cette définition apparaît dans les dictionnaires les plus récents un corpus est un ensemble d'éléments sur lequel se fonde l'étude d'un phénomène linguistique. Le terme a pourtant conservé, en linguistique, un peu de son acception d'origine, d'où une certaine ambivalence. Corpus renvoie effectivement, en un premier s
Analyse
8Le travail sur échantillon se révèle donc être un impératif pratique. Mais pour que l'analyse prétende à quelque validité, on ne saurait se contenter d'un échantillon aléatoire. Tendre un micro et enregistrer quelques heures de discussions dans une salle de réunion ou de café permet sans doute de recueillir quelques éléments intéressants (selon le
Principe
10On distingue donc schématiquement deux phases dans une étude linguistique : la phase d'analyse d'un ensemble fini de données et la phase de confrontation des résultats de cette analyse, c'est-à-dire des hypothèses avancées, à la réalité. Il s'ensuit que le recours explicite au corpus peut intervenir dans une phase liminaire de la recherche au mom
Phonologie
14Soit un phonologue qui se penche sur la notion d'attaque de la syllabe en français. Quand il examine les possibilités qui s'offrent à l'initiale du mot, il se trouve en présence d'un inventaire assez complexe qu'il suspecte d'hétérogénéité. Il est notamment confronté à la question de la clôture des données ; quels sont les mots à prendre en compt
Avantages
15Il est donc relativement aisé de délimiter un échantillon représentatif de données, à condition bien sûr, d'assumer les exclusions. Mais, même dans un cas aussi élémentaire, la partition des données du corpus peut conduire plus loin. journals.openedition.org
Critique
17Le point qui nous intéresse est que le corpus n'est pas un simple sous-ensemble des données de la réalité mais que cet échantillon est déjà travaillé. Il reste que l'analyse ne vaut que ce que vaut le corpus. On a trop souvent critiqué les corpus ad hoc ou les corpus introspectifs pour qu'il soit nécessaire d'y insister ici. journals.openedition.org
Technique
20C'est de proche en proche que le corpus s'élabore, d'hypothèses trop hâtives balayées par les faits en propositions plus subtiles qui cadrent mieux les données, de retouches en retouches et en vérification (indirecte et implicite, évidemment) auprès des témoins. La trame structurelle du parler se dessine ainsi progressivement en même temps que le
Caractéristiques
22Le signe lexical possède une double caractéristique : il se conçoit négativement à l'intérieur d'un paradigme, par rapport aux autres signes susceptibles d'apparaître dans le cadre de celui-ci : cela représente sa « valeur » ; mais il dépend par ailleurs (en tant qu'il constitue l'interface avec le monde) de sa relation au référent, c'est-à-dire
Introduction
25Essayons d'illustrer ce point. En quoi consiste une étude lexicale qui s'attacherait à la notion de toupie en français ? Quel type de corpus serait à même de fournir les éléments susceptibles d'éclairer le propos ? 31La valeur d'un phonème ou d'un morphème grammatical ne dépend pas de sa valeur dans un stade antérieur du système. Il peut être int
Origine
28Faut-il envisager le mot en contexte ? Le dictionnaire propose lancer, fouetter une toupie, toupie à musique, tourner sur lui-même comme une toupie. 29Faut-il prendre en compte le champ morphologique, la famille ? Il semble que le champ se réduise à toupiller « (1) tourner comme une toupie, (2) évider avec la toupie », toupilleur « ouvrier du boi
Étymologie
30Faut-il recourir à des considérations étymologiques ? Le linguiste accoutumé à traiter des problèmes de phonologie, de morphologie ou de syntaxe est réticent. Non que l'analyse diachronique soit exclue de sa sphère d'étude ; mais s'il est clair pour lui que l'étude diachronique et l'étude synchronique se composent pour donner une image en relief
Commentaire
37On n'ira pas plus loin, ici, dans l'analyse du mot toupie et des champs lexicaux dans lesquels celui-ci s'inscrit. Le point que nous entendons souligner est simplement que, dans le cas d'espèce, la construction du corpus servant d'assise à l'étude lexicale entreprise conduit non seulement à opérer des sélections dans les données à disposition mai
DE LA PRESENTATION DU CORPUS - Lettres-Histoire |
A DÉFINIR UN CORPUS 1 Une question qui resurgit dans le |
TEXTE ET CORPUS : |
La question de corpus : cours et exemple Barème : Sur 4 points pour |
CONSTITUER UN CORPUS - Lexicometrica |
La méthodologie de la question sur corpus |
Linguistique de Corpus |
Introduction 1 Présentation du corpus - Université Côte d'Azur |
C'est quoi un corpus en français ?
. En général, on dénombre entre 3 et 5 textes dans un sujet de baccalauréat.
. Il peut y avoir une image parmi les documents.
C'est quoi un corpus exemple ?
. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie, etc.
Comment présenter le corpus ?
. Le corpus va plus loin que le groupement de textes car il peut comporter des images.
. Ces images ne sont pas là à titre d'illustrations.
. Le corpus a une unité en lien avec les objets d'étude.
Comment faire un corpus de texte ?
C'est quoi un corpus ?
- (latin corpus, corps) Définitions de corpus Recueil de documents relatifs à une discipline, réunis en vue de leur conservation : Corpus des inscriptions grecques.
Qu'est-ce que la question de Corpus ?
- La question de corpus est un exercice de synthèse qui repose sur la comparaison de documents. La principale difficulté est la bonne gestion du temps. L’épreuve de corpus ne dure qu’ une heure et consiste à répondre à une question en comparant 3 ou 4 textes de la même époque ou d’époque différentes.
Quelle est la durée de l’épreuve du corpus ?
- 1)Présentation de l’épreuve du corpus L’épreuve de corpus ne dure qu’ une heure et consiste à répondre à une question en comparant 3 ou 4 textes de la même époque ou d’époque différentes. C’est un exercice de synthèse et de comparaison comme le montrent les textes officiels.
Qu'est-ce que l'épreuve de Corpus ?
- L’épreuve de corpus ne dure qu’une heure et consiste à répondre à une question en comparant 3 ou 4 textes de la même époque ou d’époque différentes. C’est un exercice de synthèse et de comparaison comme le montrent les textes officiels. Pour les séries générales: S, ES et L, il y a 1 seule question. Le corpus est noté sur 4 points.
La méthodologie de l'étude du corpus de texte au bac de français est disponible sur : http://www.bac-l.net/document/francais/methodologie-detude-du-corpus-...
CONSTITUER UN CORPUS - Lexicometrica
Soulignons que SGML n'est pas une grammaire des textes possibles, mais un méta-langage permettant de définir la grammaire des différents types de textes20 |
Des corpus représentatifs - Laboratoire ICAR - CNRS
française) dans Frantext fournissent un autre exemple On parlera alors plutôt de base textuelle que de corpus : c'est l'opération de choix raisonné parmi les |
TEXTE ET CORPUS :
Chomsky à l'encontre du « corpus » (comme base pertinente de la description et du raisonnement linguistique), c'est le fait que, pour raisonner sur la langue, il |
Linguistique de Corpus - Cours de linguistique théorique et descriptive
Le corpus est un ensemble homogène et significatif de données linguistiques il est important que les enregistrements soient faits dans des situations |
Introduction à lutilisation des corpus 1 Quest-ce quun corpus?
Quels types de corpus y a-t-il ? ➢ Quelques exemples ➢ A quoi peut servir un corpus ? ➢ Dans quel but doit-on constituer des corpus dans le cadre du Master |
Corpus en bac pro - Lettres-Histoire
Présenter le corpus » n'est pas faire un relevé sur quoi se fonde son unité ○ Les textes confrontent ce que la ville a eu d'impact sur chaque écrivain ▷ |
Introduction 1 Présentation du corpus - Université Côte dAzur
En quoi cet actualisateur du substantif est-il propre au FPC ? Son usage se La question, pour la linguistique de corpus, est double : d'une part, se donner les |