[PDF] Language Documentation and Standards in Digital Humanities: TEI





Previous PDF Next PDF



CLASSIFICATION SIMPLIFIEE DES ORGANISMES VIVANTS

REGNE VEGETAL les végétaux fabriquent les matières organiques par photosynthèse. Page 2. CLASSIFICATION. DES CHAMPIGNONS. SUPERIEURS anvl.



English?french Dictionary

above : dessus sur



MÉDAILLES 2012

the International Art Medal Federation/Fédération Internationale de la Médaille d'Art - FIDEM XIV and their recent imitator Vivant Denon's.



Untitled

la nature et la biodiversité en Île-de-France et l'ANVL



Untitled

populations les plus vulnérables vivant de la forêt et surtout celles vivant dans la forêt. qui inquiètent les organisations de conservation car.





Language Documentation and Standards in Digital Humanities: TEI

4 feb 2021 recherche français ou étrangers des laboratoires ... 32 I include complex consonants in this CVV classification



MASSIF DE FONTAINEBLEAU Document dobjectifs – Natura 2000

2 feb 1995 piège conservant les animaux vivants sera autorisé. 1.2.2.3. PECHE. Les espèces risquant d'être perturbées sont le Busard des roseaux ...



Travail de bachelor

2 Dans l'organisme vivant. 3 La capacité du cerveau à créer ou à réorganiser des circuits neuronaux. 4 Main ipsilatérale à l'hémisphère sain.



Désirée Kleineberg The expression of “collectivity” in Romance

2022 Désirée Kleineberg published by Walter de Gruyter GmbH

>G A/, i2H@yjRjRNje ?iiTb,ffi?2b2bX?HXb+B2M+2fi2H@yjRjRNje am#KBii2/ QM 9 62# kykR

Bb KmHiB@/Bb+BTHBM`v QT2M ++2bb

`+?Bp2 7Q` i?2 /2TQbBi M/ /Bbb2KBMiBQM Q7 b+B@

2MiB}+ `2b2`+? /Q+mK2Mib- r?2i?2` i?2v `2 Tm#@

HBb?2/ Q` MQiX h?2 /Q+mK2Mib Kv +QK2 7`QK

i2+?BM; M/ `2b2`+? BMbiBimiBQMb BM 6`M+2 Q` #`Q/- Q` 7`QK Tm#HB+ Q` T`Bpi2 `2b2`+? +2Mi2`bX /2biBMû2 m /ûT¬i 2i ¨ H /BzmbBQM /2 /Q+mK2Mib b+B2MiB}[m2b /2 MBp2m `2+?2`+?2- Tm#HBûb Qm MQM-

Tm#HB+b Qm T`BpûbX

GM;m;2 .Q+mK2MiiBQM M/ aiM/`/b BM .B;BiH

>mKMBiB2b, h1A M/ i?2 /Q+mK2MiiBQM Q7

JBti2T2+@JBti2+

C+F "Qr2`b

hQ +Bi2 i?Bb p2`bBQM, C+F "Qr2`bX GM;m;2 .Q+mK2MiiBQM M/ aiM/`/b BM .B;BiH >mKMBiB2b, h1A M/ i?2 /Q+mK2M@ iiBQM Q7 JBti2T2+@JBti2+X *QKTmiiBQM M/ GM;m;2 (+bX*G)X ú+QH2 S`iB[m2 /2b >mib úim/2b- kykyX 1M;HBb?X LLh, X i2H@yjRjRNje

Préparée à tudes

Language Documentation and Standards in Digital

Humanities: TEI and the documentation of

Mixtepec-Mixtec

Soutenue par

Jack BOWERS

le 8 octobre 2020

École doctorale n° 472

Pratique des Hautes Études

Spécialité

Linguistique

Composition du jury :

Guillaume, JACQUES

Directeur de Recherche, CNRS

Alexis, MICHAUD

Chargé de Recherche, CNRS

, ERJAVEC

Senior Researcher,

Enrique, PALANCAR

Directeur de Recherche, CNRS

Karlheinz, MOERTH

Senior Researcher, Austrian Center for Digital Humanities and Cultural Heritage

Emmanuel, SCHANG

Maître de Conférence, Université

Benoit, SAGOT

Chargé de Recherche, Inria

Laurent, ROMARY

Directeur de recherche, Inria

1

1. Introduction to Project 7

2. Introduction to Language 11

2.1 Brief Overview of Mixtepec-Mixtec Language Typology and Features 13

2.1.1 Phonological System 14

2.1.1.1 Consonants 14

2.1.1.1.1 Stops 15

2.1.1.1.2 Nasals 16

2.1.1.1.3 Liquids, Trills, Taps and Flaps 17

2.1.1.1.4 Fricatives 17

2.1.1.1.5 Glides 18

2.1.1.1.6 Affricates 19

2.1.1.1.7 Prenasalized phones 19

2.1.1.1.8 Prespirantized phones 21

2.1.1.1.9 Labialized phones 21

2.1.1.1.10 Intervocalic sonorant gemmination 22

2.1.1.2 Vowels 23

2.1.1.2.1 Close front vowels 24

2.1.1.2.2 Close back rounded vowels 24

2.1.1.2.3 Close-mid front vowels 25

2.1.1.2.4 Close-mid back vowels 25

2.1.1.2.5 Open Central vowels 26

2.1.1.2.6 Vowel Harmony 26

2.1.1.2.7 Passive Nasalization 27

2.1.1.2.8 Passive Glottalization 28

2.1.1.3 Tones 29

2.1.2 Basics of Information Structure 33

2.1.3 Marking Person and Pronouns 34

2.1.3.1 Demonstrative Pronouns and Components 37

2.1.4 Copular and Related Expressions 39

2.1.5 Noun Phrases, Possession and Related Expressions 41

2.1.6 Conjunctions and Adverbs 45

2.1.7 Verbal Inflections: Aspect and Mood 46

2

2.1.7.1 Imperfective 48

2.1.7.2 Perfective 49

2.1.7.3 Potential 50

2.1.7.4 Imperatives 52

2.1.7.5 Habitual 53

2.1.7.6 Modals 53

2.1.7.7 Negation 55

2.1.8 Derivation 57

2.1.8.1 Causative 57

2.1.8.2 Iterative 58

2.1.8.3 Inchoative 58

2.1.8.4 Combinations of Derivatives 59

Final Notes on Linguistic Description 59

3. Mixtepec-Mixtec Documentation Project Origins and Methods 59

4. On the Intersections and Divergences of Language Documentation, Description, Digital

Humanities and Corpus Linguistics 65

4.1 On Language Documentation and Digital Humanities 66

4.2 On Language Description vs Language Documentation 68

4.3 Language Resources and Data 70

4.3.2 Metadata 71

4.3.3 On Data Formats: Files and Markup 73

4.4 Standards 75

4.4.1 Metadata Standards 75

4.4.1.1 OLAC 76

4.4.1.2 IMDI 77

4.4.1.3 TEI 78

4.4.1.4 AILLA 82

4.4.1.5 CMDI 82

4.4.1.6 Issues in Metadata Compatibility and Interchange 83

4.4.2 Standards and Formats for Corpora and Time-aligned Speech 84

4.4.2.1 Time-aligned Transcriptions: Macrostructure 84

4.4.2.1.1 ELAN 87

4.4.2.1.2 Praat 88

4.4.2.1.3 EXMARaLDA 89

4.4.2.2 Time-aligned Transcriptions: Microstructure 90

3

4.4.2.3 ISO 24624:2016 and TEI Representation of Spoken Language Transcription 92

4.4.2.4 Corpora and Annotation 103

4.4.3 Description Data Formats and Standards 118

4.4.3.1 Lexicons and Dictionaries 118

4.4.3.1.1 TEI Dictionaries 119

4.4.3.1.2 Lexical Markup Framework (LMF) 123

4.4.3.1.3 LIFT 125

4.4.3.2 Grammatical and Other Annotation Inventories and Features 127

4.4.3.2.1 ISOcat 127

4.4.3.2.2 Ontologies and Other Annotation Tagsets 128

4.4.3.2.3 TEI and ISO 24610-1 Feature Structures 130

4.4.3.2.3.4 Grammatical and conceptual features in FLEx 133

4.4.3.2.3.5 Controlled Vocabularies in ELAN 135

4.4.4 Tools, Formats, Standards and Interoperability 136

4.4.4.1 Spoken language transcription tools 137

4.4.4.2 Lexicon and Dictionary Creation and Management Tools 144

4.4.4.3 Presentation Formatting 147

4.4.4.4 Interoperability, Interchange and Workflows 150

4.4.4.5 On Issues Related to Choosing Data Structure and Tools for LD 157

4.4.5 Publishing and Obtaining of Existing Language Resources 158

4.5 Ethical Issues in Language Documentation and Linguistics 160

5. Overview of Mixtecan Literature and Resources 162

5.1 Codices 163

5.2 Colonial Mixtec 167

5.4 Brief Overview of Mixtecan Linguistics Literature 167

5.4.1 Other Mixtec Related Projects 168

5.5 Mixtepec-Mixtec Literature 171

6. On the Corpus: Encoding, Annotation, Contents 172

6.1 Audio and Video Repository 172

6.2 Text-based Resources 174

6.2.1 SIL Text Content and Structure 176

6.2.2 Text Document Metadata: 177

6.2.3 SIL Documents: Basic TEI Document Structure 179

6.2.3.1 SIL Document Types: Pedagogical Reference 180

4

6.2.3.2 SIL Document Types: Activity Books 183

6.2.4 Speaker Authored Text 186

6.2.5 Other text resources: Conocelos.MX 187

6.3 Spoken Language Transcriptions and TEI Encoding 190

6.3.1 Praat Annotation Schemes 190

6.3.2 Transcribing Tones 194

6.3.3 TEI Output of Praat Transcriptions 194

6.3.3.1 Timelines and Transcriptions in TEI 195

6.3.3.2 Linking and Representing Phonetic and Orthographic Forms 196

6.3.4 Representing Spoken Resource Metadata 197

6.3.4.1 Provenance of Corpus Files: 198

6.3.4.2 Pathways to Linked Files: 198

6.3.4.3 Metadata for File Creation: 199

6.3.4.4 Speech Event Typology: 200

6.4 Annotation Mechanisms 202

6.4.1 Feature Structures and Annotation Inventory 202

6.4.2 Standoff Annotation: 204

6.4.3 Linking Parallel Content: 205

6.4.4 Translations 206

6.4.5 Grammar, Information Structure and Interlinear Glossed Text 208

6.4.6 Annotating Tone and Morphological Features 211

6.4.7 Annotating Semantics 216

4.6.7.1 Enhancing Grammatical Categories with Semantics 219

4.6.7.2 Applying Semantic Theory to Corpus Annotation 221

4.6.7.3 Final Remarks on Semantic Annotation 227

7. Overview of the Mixtepec-Mixtec TEI Dictionary 229

7.1 Metadata and Linking Resources 229

7.1.1 Lexical Features and Terminology Inventory 230

7.1.2 Bibliographic Sources 231

7.1.3 Personography 232

7.1.4 External Corpus and Media Files 232

7.2 Forms and Grammar 234

7.2.1 Variation, Uncertain, and Conflicting Forms 237

7.2.1.1 Orthographic Variation 237

5

7.2.1.2 Phonetic Variation 239

7.2.2 Entries with Collocates 240

7.2.3 Inflection and Paradigms 241

7.3 Related Entries 243

7.4 Sense 244

7.4.1 Links to External Knowledge Sources 244

7.4.2 Translations 245

7.4.3 Definitions 246

7.4.4 Examples 246

7.4.5 Images 247

7.4.6 Semantics and Cultural Issues in Language Documentation 248

7.4.7 Semantic Relations and Domain 249

7.5 Etymology 252

7.5.1 Inheritance, Cognates and Cross-references 252

7.5.1.1 Reconstructed Forms 253

7.5.1.2 Historically Attested Forms from Alvarado Yucu Ndaa Vocabulary (1593) 254

7.5.1.3 Cognates 255

7.5.2 Borrowing 255

7.5.3 Onomatopoeia 256

7.5.4 Phonological Changes and Multiple Etymological Processes 256

7.5.5 Sense-related Etymologies 257

7.5.5.1 Metaphor 257

7.5.5.2 Metonymy 259

7.5.6 Complex Etymologies: Derivation and Metonymy 261

7.6 Human Oriented Output 262

8. Conclusion 264

9. Bibliography 268

1. Introduction au projet 294

2. Introduction à la langue 298

2.1 Bref aperçu de la typologie et des caractéristiques de la langue mixtèque de Mixtepec 301

2.1.1 Tonalités lexicales 301

304

2.1.3 Marque de la personne et pronoms 305

2.1.3.1 Pronoms démonstratifs et composants 308

6

2.1.4 Copules et mots apparentés (cognats) 310

2.1.5 Syntagmes nominaux, expression de la possession et notions apparentées 312

2.1.6 Conjonctions et adverbes 316

2.1.7 Déclinaisons verbales : aspect et mode 318

2.1.7.1 Imperfectif 319

2.1.7.2 Perfectif 320

2.1.7.3 Potentiel 322

2.1.7.4 Impératifs 323

2.1.7.5 Habituel 324

2.1.7.6 Modaux 325

2.1.7.7 Négation 327

2.1.8 Dérivation 329

2.1.8.1 Causalité 329

2.1.8.2 Itération 330

2.1.8.3 Inchoation 331

quotesdbs_dbs23.pdfusesText_29
[PDF] Classer et nommer les végétaux : Un peu de - Tela Botanica

[PDF] CLASSROOM ENGLISH

[PDF] Le structuralisme ethnologique de Claude Lévi - Strauss

[PDF] Les clauses sociales d 'insertion et l 'ordonnance du 23 juillet 2015

[PDF] Le recueil des Fondamentaux de la Clause Sociale d 'Insertion et de

[PDF] les clauses sociales - Ministère de l 'économie

[PDF] La clause de la nation la plus favorisée : le cas revisé - E-Periodica

[PDF] Lclauses de la nation la plus favorisee - etudes fiscales internationales

[PDF] Traitement de la nation la plus favorisée - Unctad

[PDF] Travail et données personnelles : la géolocalisation des - Cnil

[PDF] Catalog - HM Clause

[PDF] Guide d utilisation - Fujitsu

[PDF] Alphabet Phonétique

[PDF] 3SKey - Instructions de renouvellement du token ? l 'attention - Swift

[PDF] Clés de contrôle - Division euclidienne