[PDF] Extraction automatique des mots-clés à partir de publications





Previous PDF Next PDF



Liste des mots clés

Oppositions neutre de termes. Mot-clé voisin. Antonyme exemple. Abondance abondant ; abondamment copieux ; fructifier ; corne d'abondance ; vaches grasses ;.



Opérateurs booléens

Les opérateurs booléens servent à relier les idées / concepts / mots-clés Par exemple si on cherche avec le mot-clé crim* trouvera les documents avec.



1 METHODOLOGIE POUR LE COMMENTAIRE LITTERAIRE

un exemple tiré du texte à commenter. • et un mot-clé (Sinon le paragraphe est incomplet et manque de force). L'INTRODUCTION.



Nouvelles Technologies Educatives - DocCISMeF : un outil de

sources mais aussi tous les champs de Doc'CISMeF



Cryptographie

Elle transmet le mot crypté à Bruno qui selon le même principe Pour notre exemple



Thèse Chaoued; Résumé et mots clés

RESUME. Cette recherche traite de l'enseignement scientifique. Elle se propose plus particulièrement de porter un regard critique.



Trouver ses mots-clés MeSH sur Hetop

Il existe 4 cas de figures pour trouver le mot-clé MeSH Dans la barre de recherche



Suivi des investissements publics en faveur de la nutrition au niveau

3 juil. 2014 Les mots clés (exemples) pour identifier les domaines sectoriels (et/ou les ministères techniques) sont : santé éducation



Extraction automatique des mots-clés à partir de publications

Les descripteurs linguistiques peuvent être des mots simples (par exemple. « irrigation »)

Extraction automatique des mots-clés à partir de publications scientifiques pour l'indexation et l'ouverture des données en agronomie L es donne´es scientifiques sont parnaturecomplexesetsouvent spe

´cialise´es. C"est par exemple

le cas des donne

´es qui concernent le

domaine agronomique, qui couvrent un large spectre allant de l"e

´tude

biologique des plantes jusqu"auxfacteurs environnementaux et socie´ taux associe s aux pratiques agricoles.

L"indexation des donne

es agronomi- ques est alors utile pour mieux appre hender et cartographier le patrimoine nume rique scientifique disponible au

sein des instituts de recherche endoi:10.1684/agr.2015.0773Pour citer cet article : Roche M, Fortuno S, Lossio-Ventura JA, Akli A, Belkebir S, Lounis T,et. al.,

2015. Extraction automatiquedesmots-clésàpartirdepublicationsscientifiquespourl'indexation

et l'ouverture des données en agronomie.Cah Agric24 : 313-320. doi :10.1684/agr.2015.0773

Résumé

Dans le contexte des masses de donne´es textuelles lie´es a l"agriculture aujourd"hui disponibles, leur indexation devient un enjeu crucial pour les organismes de recherche.

Une manie

re d"indexer au mieux les documents consiste a` en extraire la terminologie. Cet article explore l"utilisation et la combinaison de me thodologies de fouille de textes afin de mettre en exergue, puis de publier dans des syste mes d"open data,les termes les plus adapte ´s issus de documents. Des expe´rimentations mene´es sur des donne´es du CIRAD (Centre de coope ´ration internationale en recherche agronomique pour le de´ velop- pement),montrentlebien-fonde delade´ marchequiapermisd"extrairedestermesa` lafois nouveaux et pertinents.

Mots cle

´s:documentation ; gestion des connaissances ; indexation d"information ; me

´thodes ; traitement des donne´es.

The `mes :me´thodes et outils.Abstract Automatic extraction of keywords from scientific publications for indexing andopen datain agronomy With the large amounts of textual data related to agriculture now available, indexing becomes a crucial issue for research organizations. One way to index documents consists in extracting terminology. This paper investigates the use and combination of text mining methodologies to highlight and publish the most appropriate terms from documents in open datasystems. Experiments conducted on CIRAD data, show the validity of the approach used to extract new and relevant terms. Key words:data processing; documentation; indexing of information; knowledge management; methods.

Subjects:tools and methods.Mathieu Roche

1,2

Sophie Fortuno

1

Juan Antonio Lossio-Ventura

2,3Amira Akli

3

Salim Belkebir

3

Thinhinan Lounis

3

Serigne Toure

3 1

UMR TETIS (Cirad, Irstea, AgroParisTech)

Maison de la T

?el?ed?etection

500, rue Jean-Franc¸ois Breton

34093 Montpellier Cedex 5

France

2

LIRMM (CNRS, Universit?e de Montpellier)

860, rue de St Priest

34095 Montpellier Cedex 5

France

3

Universit?e de Montpellier

Place Eugène Bataillon

34095 Montpellier Cedex 5

France

Tirés à part :M. Roche

313Cah Agric, vol. 24, n85, septembre-octobre 2015

Étude originale

agriculture. Une telle taˆche d"indexa- tionsere

´ve`lecrucialepourmieuxge´rer

les connaissances et favoriser l"ouver- ture des donne

´es agronomiques.

Dans un tel contexte, les donne

´es

textuelles issues des publications scientifiques rece `lent des informations pre

´cieuses que des me´thodes de

fouille de textes (FT,http://www. textmining.biz) peuvent mettre en exergue. Les processus de FT sont souvent compose

´s de deux phases

successives. Dans un premier temps, ces me

´thodes consistent a`extraire les

descripteurs linguistiques les plus significatifs a `partir de documents.

Les descripteurs linguistiques peuvent

e

ˆtre des mots simples (par exemple,

" irrigation »), mais aussi des termes compose

´s (par exemple, " agriculture

familiale »). Nous appellerons de tels descripteurs linguistiques, destermes.

Ces derniers repre

´sentent le mate´riau

de base afin d"associer une certaine se

´mantique aux documents. Par exem-

ple, les termes " riz » et " irrigation » pre

´sents dans un document mettent en

lumie `re une the´matique lie´ea`la " culture ». La deuxie `me phase du processus consiste a `exploiter ces termes pour, par exemple, classer automatiquement les documents dans des cate

´gories (culture, e´levage, etc.).

Cette classification repose sur le pos-

tulat suivant : si des documents posse dentdenombreuxtermesencommun, alors ils peuvent e

ˆtre regroupe´s.

De telles proble

´matiques de classifica-

tion, d"indexation ou d"ouverture des donne

´es (open data) reposent donc,

dans un premier temps, sur l"extrac- tion des termes pertinents issus d"un ensemble de donne

´es textuelles

appele

´corpus. Dans le cadre de cette

e

´tude, nous nous inte´ressons a`la mise

en place d"une me

´thodologie afin

d"extraire automatiquement les termes pertinents a `partir des publications du

CIRAD (Centre de coope

´ration inter-

nationale en recherche agronomique pour le de

´veloppement) et de l"unite´

mixte de recherche TETIS (Territoires, environnement, te

´le´de´tection et infor-

mation spatiale).

Lasectionsuivantede

´critlesme´thodes

d"extraction de la terminologie de la litte

´rature et celles exploite´es dans nos

travaux. Celle d"apre `sde´taille une me

´thode de combinaison de diffe´-

rentes approches afin d"extraire des termes adapte

´s au domaine agrono-

mique. Ensuite,est de ´crite une mesureoriginale de classement des termes qui ont e

´te´exploite´s pour des taˆches

propres a `l"ouverture des donne´es.

Enfin, les re

´sultats de nos approches

sont analyse

´s, puis mis en perspective.

quotesdbs_dbs47.pdfusesText_47
[PDF] mot clé generateur

[PDF] Mot clés de SVT

[PDF] Mot croise

[PDF] Mot croisé ! Très Urgent !

[PDF] Mot croisé de multiple et divisible!

[PDF] mot croisé dictionnaire

[PDF] mot croise la presse

[PDF] Mot croisée prévention sante environnement 2nde

[PDF] Mot Croiser d'espagnole

[PDF] Mot croisés

[PDF] mot croisés en maths

[PDF] Mot croisés Maths niveau 5/4ème

[PDF] mot croisés svp

[PDF] Mot d'excuse pour une classe

[PDF] mot d'amour commencant par l