[PDF] Chapitre 1: Théorie linguistique et modélisation de l



Previous PDF Next PDF







Formation Niveau 1 Eléments de théorie wwwaquadomia

Niveau 1 Eléments de théorie www aquadomia com Jusqu’à 4 niveaux 1 avec un guide niveau 4 minimumun guide niveau 4 minimum médian www aquadomia com 20 m



Formation TMI niveau 1 - memoireimplicitecom

Niveau 1 2 – Psychopédagogie et conditionnement 50 théorie, 50 pratique sur 6 week-ends pour un total de 90 heures Théorie de l’attachement : comment agit l’ocytocine sur le cerveau, possibilité d’essayer sur soi



Chapitre 1: Théorie linguistique et modélisation de l

GU est aussi une théorie de l’esprit 1 3 Théorie et modélisation de bas niveau Le savoir pré-requis postulé par la GU n’est en aucun cas un savoir a priori, lequel serait exclu par la démarche scientifique qui est la sienne D’où la question (4) de connaître quels sont les méca-



Formation Niveau 2 Eléments de théorie wwwaquadomia

Niveau 2 Eléments de théorie www aquadomia com 1 bar 2 bars 3 bars 4 bars4 bars 5 bars 6 bars la plongée est une activitéla plongée est une activité sous



Théorie niveau 2 - Peps Up

Par convention Patm = 1 bar au niveau de la mer •Pression hydrostatique Un corps plongé dans un liquide va subir une pression due à l’eau située au-dessus de lui Cette pression est appelée pression hydrostatique => Colonne de 10m d’eau => Phydro = 1bar La pression hydrostatique augmente de 1 bar tous les 10 mètres •Pression



Théorie niveau 3 - Peps Up

1 Alerter les secours (CROSS, VHF canal 16) 2 Administrer de l’oxygène à 100 , débit 15l/min en inhalation ou insufflation 3 Proposer de l’aspirine (500mg maxi) et hydrater la victime 4 Evacuation vers un caisson hyperbare Foramen ovale perméable Chez l'embryon, un orifice (foramen ovale) entre l'oreillette droite et gauche permet



La théorie polyvagale : guide du débutant

La théorie polyvagale : guide du débutant Le Dr Stephen Porges, qui a développé la Théorie Polyvagale, a identifié un ordre biologique de réponses humaines qui s’applique à toutes les expériences humaines En remerciant le Dr Porges pour son travail, ce fascicule explore et explique en termes accessibles la Théorie Poly-vagale



CHAPITRE 2 LA THEORIE DU PRODUCTEUR

Ch 2 - La théorie du producteur 37 N B 1 Raisonnement précédent suppose qu'il existe un niveau de production qui permette un profit positif P Q – CT (Q) > O Ou Q ( P – CM(Q)) > O Existence du profit suppose que le prix de vente du produit est supérieur au coût moyen de production



ELEMENTS DE THEORIE COMPTABLE - ResearchGate

7 4 1 La théorie du propriétaire 7 4 2 La théorie de l'entité Les états financiers dresses a la valeur d'origine indexes sur le niveau général des prix (NGP) 10 1 Nature de l



1 Effort, activation et performance - WordPresscom

l'instauration d'un niveau d'activation jugé optimum pour la réalisation de performances du meilleur niveau 1 3 Le modèle de Gaillard Gaillard (1993) propose un modèle cognitivo-énergétique, dont le principe fondamental est la régulation de l'état énergétique de l'organisme (Figure 8) L'état

[PDF] cours niveau 1 plongée ffessm

[PDF] cours niveau 1 plongee powerpoint

[PDF] cours de plongée niveau 2

[PDF] conclusion tfe

[PDF] examen niveau 1 plongée

[PDF] cours pratique niveau 1 plongée

[PDF] qcm plongée niveau 1

[PDF] modèle note de présentation

[PDF] nouvelle loi organique des finances maroc

[PDF] question sur le maroc

[PDF] etude de marché gratuite décoration

[PDF] le chat de tigali texte

[PDF] le chat de tigali questionnaire

[PDF] le chat de tigali pdf

[PDF] le chat de tigali lecture en ligne

6 Chapitre 1: Théorie linguistique et modélisation de l'apprentissage: arguments pour une approche connexionniste

1. L'apprentissage dans la théorie linguistique générale

Une théorie linguistique se veut en même temps une théorie de l'apprentissage de la langue; ceci

découle du programme inauguré par Chomsky [Chomsky, 1957 ] et de l'actualité de ses questions

fondamentales reprises dans [Chomsky, 1988 ], à savoir: (1) Quel est le système de connaissances

que le locuteur d'une langue donnée détient dans son cerveau (mind)? (2) Comment ces connais- sances se mettent en place? (3) Comment sont-elles utilisées?

Aussi, la réponse à (2) est-elle l'objectif d'une théorie de l'apprentissage universelle. Pour une lan-

gue donnée on parle de "modèle" contraint à expliciter l'apprentissage de toutes et seulement des

formes attestées dans une langue (capacité générative forte). La seule façon de savoir si le modèle

est adéquat est de le rendre explicitement calculatoire 1

Une autre question fondamentale peut être ainsi formulée: (2b) comment se fait-il que les êtres hu-

mains délimitent dans l'ensemble, potentiellement infini, des langues possibles, le sous-ensemble spécifique des langues qu'ils parlent?

Autrement dit, la théorie doit discriminer les langues impossibles (capacité générative faible).

Toutefois, dans le domaine de l'apprentissage il convient de considérer cette exigence avec pré-

caution, car elle revient à affirmer que les enfants serait incapables d'apprendre des langues non-

attestées, or les sciences du langage ne disposent pas (et semble-t-il, l'on n'est pas prêt de disposer)

de données sûres qui fonderaient une telle affirmation.

1.2. Savoir pré-requis et savoir acquis

La thèse bien connue de Chomsky, celle d'un savoir pré-requis, se fonde sur les observations em-

piriques suivantes: - les enfants arrivent à acquérir une grammaire complexe et hautement abstraite dont les

1. Cette exigence de "computational grounding" est formulée plus explicitement dans

[Gupta&Touretzky 1993]. 7 propriétés ne sont pas explicitement déterminées par les données linguistiques.

- l'apprentissage se fait dans des conditions qui sont loin d'être idéales, à partir de données

pauvres et partielles.

- malgré tout, des généralisations sont mises en place rapidement, l'intelligence et l'expé-

rience des enfants n'influent pas sensiblement sur la rapidité de l'apprentissage.

La généralisation à partir des données uniquement (par induction) demanderait l'accès à un en-

semble très large de données, ce qui n'est évidemment pas le cas. Pour expliquer cette évidence,

la théorie postule des principes généraux pré-existants à l'acquisition qui guident le processus

d'apprentissage. Selon la tradition chomskyenne, le système de ces principes, appelé aussi Gram-

maire Universelle (ou GU), est révélateur des capacités cognitives de l'homme; autrement dit, la

GU est aussi une théorie de l'esprit.

1.3. Théorie et modélisation de bas niveau

Le savoir pré-requis postulé par la GU n'est en aucun cas un savoir a priori, lequel serait exclu par

la démarche scientifique qui est la sienne. D'où la question (4) de connaître quels sont les méca-

nismes physiques qui sont à la base des connaissances linguistiques, de leur acquisition et de leur

usage. Les préoccupations des linguistes rejoignent par là celles des neuro-scientifiques notam-

ment sur le problème de la modélisation adéquate de ces mécanismes physiques. Il s'agit à la fois

de trouver le support biologique de codage du savoir pré-requis (génétique?, câblage neuronal?),

ainsi que la nature des changements opérés lors de l'apprentissage. Compte tenu de ce que l'on sait sur le cerveau, les approximations des techniques connexionnistes se présentent comme une démarche cognitivement plausible pour la modélisation.

2. Arguments pour un traitement connexionniste de l'apprentissage

Nous examinons deux groupes d'arguments, le premier repose sur le critère méta-théorique du "ra-

soir d'Occam" et les critères de plausibilité cognitive. Dans le second on évoque les développe-

ments de formats d'analyse en théorie linguistique qui se prêtent naturellement à une formalisation

8 connexionniste.

2.1. Modèles computationnels de l'apprentissage

Un modèle computationnel de l'apprentissage doit être distingué des modèles déclaratifs d'analy-

se (parsing) et de génération auxquels nous a habitué la linguistique computationnelle. Alors que

ces derniers modélisent la performance, l'usage que l'on fait de la langue [Gardent&Baschung

1994], la modélisation de l'apprentissage inclut nécessairement des hypothèses sur les primitives

de la compétence; elle a besoin d'une théorie préalable qui pose ce qui est considéré comme étant

universellement connu et ce qu'il reste à apprendre. D'autre part, un modèle de l'apprentissage est

dynamique, à l'instar des modèles de la performance il construit des représentations intermédiaires

et doit pouvoir identifier et discriminer les fausses pistes.

Techniquement parlant, la modélisation de l'apprentissage consiste à abstraire à partir d'un corpus

de données, un certain nombre de valeurs. Ces valeurs sont associées soit à des primitives de re-

présentation, soit à des opérations sur les représentations, l'une et l'autre étant des primitives con-

ceptuelles de la théorie linguistique préalable.

2.2. Critères d'évaluation des modèles

Les modèles qui seront examinés par la suite ont tous une très bonne couverture des données (>90

%). Il convient donc de poser des critères afin de pouvoir les évaluer. En particulier on se deman-

dera en quoi un modèle connexionniste serait supérieur à son équivalent symbolique. Outre le cri-

tère fondamental de la capacité générative forte on peut poser deux autre séries d'exigences. La

première est compatible avec la procédure d'évaluation proposée par Chomsky pour évaluer les

bonnes grammaires d'une langue selon leur simplicité relative. Mais on peut et l'on doit considérer

aussi la plausibilité cognitive de la modélisation, ce qui constitue la deuxième série de critères.

2.2.1. Exigences théoriques de simplicité

Les exigences théoriques de simplicité appliquées à une théorie de l'apprentissage demanderait

9 aux modèles concurrents (i.e. à performances égales): (A) d'utiliser un inventaire minimum de valeurs à acquérir (B) de stipuler le minimum de savoir pré-requis (C) d'utiliser le minimum de données

2.2.2. Exigences de plausibilité cognitive

Ces critères de plausibilité rencontrent pour partie les exigences de simplicité, mais il convient de

les spécifier de façon distincte: (D) utiliser le même dispositif pour l'apprentissage et pour la production sauf évidence physique contraire. (E) le dispositif doit être conforme aux performances du dispositif biologique (les neuro- nes) en termes de temps de traitement. (F) il doit faire preuve de cohérence avec les données sur l'apprentissage des enfants (D) se pose plus spécifiquement en tant que critique de l'approche symbolique, pour laquelle les

procédures de production sont nettement distinctes de celles impliquées dans l'apprentissage (mo-

dularité). L'argument est que l'état actuel du savoir sur le substrat neuronal dont on dispose, ne

permet pas de fonder la spécificité de l'apprentissage sur une explication physique causale. Enfin, (E), on peut appliquer ce dispositif à toute procédure d'apprentissage connexion- niste ou non. Il convient toutefois de considérer cela avec prudence, car on ne peut pas affirmer

avec certitude que la vitesse de traitement de l'information dans le cerveau soit limitée par les pro-

cessus électro-chimiques connus. On notera à ce propos, la similitude des recherches sur les trans-

ferts énergétiques proches de la supraconductivité qui ont lieu dans les microtubules (polymères

protéiques dans les cellules neuronales); phénomènes qui seraient explicables en termes de Méca-

nique Quantique. Ces recherches inspirent des nouvelles hypothèses sur la causalité physique de

la conscience [Penrose, 1994]. Basées sur un calcul quantique, elles critiquent ouvertement la per-

tinence cognitive des modélisations connexionnistes électrodynamiques. 10

2.3. Systèmes computationnels symboliques

Ces systèmes, qui ont un succès croissant dans les différents domaines du TAL (analyse, généra-

tion, résumé automatique de textes, etc) se révèlent efficaces, mais très improbables du point de

vue cognitif (critères E, D). Aussi, du point de vue de la simplicité ils se montrent souvent com-

plexes et coûteux en données et en mémoire.

2.3.1. Systèmes "guidées par les données"

Un algorithme d'apprentissage qui assigne des valeurs spécifiques à chaque item qu'il traite est

peu économique du point de vue de (A) et (C). Cependant, il existe des approches "basées sur

l'exemple" qui prennent cette option. Un tel système s'appuie sur une large base d'items représen-

tés sous forme de traits (couples argument/valeur) et compare les valeurs pour les nouveaux items

à tous les exemples de la base, afin de les catégoriser selon leurs similarités et leurs différences.

La "Modélisation Analogique" [Skousen, 1989] en est un exemple. L'enjeu de ces systèmes est

d'éviter le recours à des règles explicites, lesquelles sont mises en doute par des études psycho-

linguistiques [Derwing&Skousen 1989]. D'autre part, il porte sur l'élimination de tout recours au savoir a priori . Pour une application concrète à l'apprentissage de l'accentuation on peut consulter

Daelmans [Daelmans et al. 1993].

L'objection cognitive à ce type d'approche est simple: le "processeur" humain n'aurait ni la mé-

moire, ni la rapidité de calcul pour procéder ainsi pour chaque tâche spécifique (syllabation, ac-

centuation, morphologie, etc). L'incohérence de ces approches avec les données sur l'apprentissage des enfants (F) est une autre objection forte.

2.3.2. Systèmes "guidés par la théorie"

Une autre option consiste à spécifier des valeurs pour les opérations (règles ou principes) qui agen-

cent les constituants. L'inventaire des opérations, qui est supposé être connu d'avance, correspond

en fait à un modèle de la compétence fourni par la théorie linguistique.

La théorie des Principes et Paramètres [Chomsky, 1979] et la Théorie de l'Optimalité [Prin-

11 ce&Smolensky 1993] intègrent des modèles d'apprentissage de ce type, respectivement [Dresher&Kaye 1990], [Nyberg, 1991] et [Tesar&Smolensky 1994], [Tesar, 1995].

Le rôle crucial et massif du savoir pré-requis sans explicitation de son ancrage dans le substrat

physique, ainsi que la différenciation des systèmes d'apprentissage et de production constituent le

point faible de ces modèles d'apprentissage.

2.3.3. Exemple d'apprentissage symbolique: l'accent du mot en français

Pour illustrer nos propos sur l'apprentissage dans un système symbolique, considérons l'exemple

de l'accentuation du mot en français selon l'approche Principes et Paramètres (P&P) proposé dans

Dresher et Kaye. L'analyse métrique classique qu'ils utilisent distingue deux types de consti- tuants: - syllabes - ensemble borné de syllabes (mot) Les syllabes ne sont pas identiques, elles sont subdivisées en - syllabes légères [CV] - syllabes lourdes [CVC(C)(C)] - syllabes extramètriques En français, pour apprendre la représentation on doit instancier des valeurs au moins pour ces quatre 1 opérations universelles: P1 : les syllabes se combinent dans une super-structure au niveau du mot (word-tree) ( Oui /Non) P2 : les syllabes se combinent dans des sous-structures ("pieds branchants") ( Oui /Non) P3 : la superstructure (word-tree) est forte à (Gauche/

Droite

P4 : une syllabe extramètrique est à prendre en compte (Oui/ Non

1. L'évidence de langues comme l'Eskimos où il n'y a pas de structure au niveau du mot impose

l'apprentissage de P1. 12

Il va de soi que le savoir pré-requis de l'apprenant doit comporter l'ensemble des opérations pos-

sibles qui sont les principes universels de la grammaire; il en existe une dizaine dans le système

actuel et les auteurs n'excluent pas leur extension.

Même si l'on pose que les valeurs non-marquées (à gauche) ne sont pas apprises, il reste à appren-

dre trois valeurs, dont une seule, (P3), est directement impliquée dans ce qu'on observe à la surface

des mots en français.

2.4. Avantages des systèmes computationnels neuro-mimétiques (connexionnistes)

Dans un système sub-symbolique où l'identité observable des symboles/constituants émerge de

processus dynamiques, on ne distingue pas d'opérations sur les représentations autres que celles

qui fondent la dynamique interne du système. Le savoir pré-requis se limite ici à l'architecture du

dispositif (réseaux connectionnistes) et à quelques règles mathématiques qui spécifient la dynami-

que interne à bas niveau. Aucune opération de haut niveau n'est utilisée explicitement; le système

découvre lui même les paramètres - d'où un net avantage de ce type de système par rapport à la

condition (B). Nous ne donnons pas ici d'exemple sur l'apprentissage connexionniste, ce dernier sera discuté en détails dans la suite de l'exposé.

3. Arguments théoriques linguistiques pour un format connexionniste

On se limitera ici à la théorie phonologique tout en gardant à l'esprit que les propositions pour une

linguistique d'inspiration connexionniste couvrent tous les niveaux d'analyse linguistique [Lakoff, 1988a].

La théorie phonologique connaît depuis quelques années un important débat sur la nature des re-

présentations qu'elle explore et des opérations qu'elle postule sur ces représentations. Une premiè-

re critique vise le format des opérations: les notions classiques de règles ordonnées et de dérivation

sont remises en cause. Cette critique du paradigme dérivationnel a été inaugurée par des travaux

en syntaxe (grammaires d'unification, LFG, GPSG); son intégration dans la théorie phonologique

13

est plus récente, mais aussi plus radicale avec les propositions de la phonologie dite "harmonique"

[Goldsmith, 1990] ou "cognitive" [Lakoff, 1988c].

Une autre critique vise les primitives mêmes de représentation, rejetant les analyses en termes de

constituance seule. Cette approche s'oppose radicalement à la conception syntaxique de la phono- logie. Le Principe de Contour Obligatoire (PCO) en phonologie métrique est une incarnation de cette critique.

On voit facilement la portée de ces innovations théoriques pour la compréhension des systèmes

accentuels et syllabiques, traditionnellement traités avec des systèmes de règles et de dérivations

longues.

Nous faisons un bref examen de ces deux théories, en mettant l'accent sur le format des primitives

(règles, représentations) afin de voir la parenté avec les primitives correspondantes du connexion-

nisme.

3.1. Critique des dérivations. La phonologie "harmonique" ou "cognitive"

L'architecture de la composante phonologique proposée dans Sound Pattern of English [Choms- ky&Halle 1968] faisait l'économie du niveau proprement phonologique 1 introduit par la phono- logie structurale (fig 1.). Les deux niveaux restant devaient être reliés par des règles

dérivationnelles. Cette conception n'avait pas d'autres motivations que la place centrale accordée

à la syntaxe par la doctrine linguistique dominante de l'époque. A ce titre, on se souvient des pro-

positions de la sémantique générative qui amputait par la même logique le niveau proprement syn-

taxique, et de la réaction virulente de l'école du MIT qui s'y opposait avec des arguments en faveur

de l'autonomie du niveau syntaxique. Parmi les arguments on trouvait la critique des longues dé-

rivations menant de la forme logique à la forme de surface. Le niveau phonologique n'a pas été

aussi bien défendu et la phonologie générative avec ses longues dérivations a connu une longévité

bien supérieure à celle de la sémantique générative.

1. Niveau "phonémique" dans la terminologie américaine. Nous utilisons "phonologique", le

terme familier à la tradition européenne venant de Troubetzkoy [Troubetzkoy 1943]. 14

Figure 1: Niveaux d'analyse avant et après SPE

Deux théories récentes, la phonologie harmonique de Goldsmith [Goldsmith 1990] et la phonolo- gie cognitive de Lakoff 1 [Lakoff 1988c, 1993], révisent la suppression du niveau phonologique à

travers une critique des dérivations et plus généralement du format des règles classiques. Consi-

dérons une analyse classique du Mohawk [Halle & Clements 1983] donnée par Lakoff à titre d'exemple de dérivation longue: y e ^ k h r e k ? / (Je vais le repousser.) y ^ k h r e k ? effacement de voyelle y k h r e k ? assignement de l'accent y k h r e k ? changement vocalique y k h r e k e ?

épenthèse

y k h r e g e ? + voisé y k r e g e ? effacement de h [ y k r e g e ?

Les six règles produisent six formes intermédiaires mal formées. L'argument principal de la pho-

nologie cognitive est que ces étapes intermédiaires ne sont pas psychologiquement ou biologique-

ment plausibles, de même que l'application aveugle des règles qui les produisent.

1. La différence des noms des théories importe peu ici. Il s'agit des mêmes propositions à l'origine

faites par Goldsmith.

PhonologiqueMorphophonémique

Phonétique

Phonétique

Morphophonémique

Règles

Règles

Règles

15 L'alternative aux dérivations vient de la conception "harmonique" de la grammaire [Legendre, Miyata, Smolensky, 1990 b]. On définit d'abord un ensemble de Conditions de Bonne Formation

(CBF), entièrement satisfaites par la forme qui surface et plus ou moins satisfaites par les formes

sous-jacentes sur lesquelles vont s'appliquer les opérations (règles). Que les opérations prennent

la forme de règles ou de contraintes comme en Théorie de l'Optimalité, l'effet recherché est l'amé-

lioration de la forme résultante par rapport aux CBF; la raison d'être des opérations est d'améliorer

l'harmonie des formes sous-jacentes. Si l'on convertit une de ces opérations au format familier DS --> CS 1 , on aura la condition supplé- mentaire: CS est plus harmonique que DS. Autrement dit, ce n'est pas la Description Structurale

seule qui guide l'application d'une règle, mais aussi une contrainte externe à une description in-

termédiaire particulière qui veut que le Changement Structural soit "réaliste", et qu'il produise une

nouvelle DS mieux formée.

Cette idée est centrale dans la phonologie cognitive qui l'incorpore dans le format des règles di-

visées en règles inter et intra-niveaux. Les règles inter-niveau sont obligatoirement harmoniques.

Quant à l'architecture des niveaux, on en distingue trois: morpho-phonologique (M), phonologi-

que (W) et phonétique (P), tout comme dans la version structuraliste d'avant SPE (fig.2). La hié-

rarchie apparente vient du fait qu'on ne considère pas les règles inter-niveau (M,P).

1. Description Structurale --> Changement Structural.

M règles inter-niveaux M,W +/- harmoniques règles inter-niveaux M,P +/- harmoniques W P règles intra-niveau harmoniques règles intra-niveau harmoniques règles intra-niveau harmoniques 16

Figure 2: Règles intra et inter-niveaux

L'exemple suivant sur le Mohawk est traité avec deux constructions harmoniques intra-niveau (ac- cent, +voisé) et deux règles inter-niveau (effacement, épenthèse): M: y e k h r e k | | effacement de voyelle (M-W) W: y ^ k h r e k ? assignement d'accent (W) | | | épenthèse (W-P) P: yquotesdbs_dbs16.pdfusesText_22