[PDF] Quest-ce que le text and data mining ?





Previous PDF Next PDF



Quest-ce que le text and data mining ?

Jan 31 2017 Marseille : OpenEdition Press



Quest-ce que le travail scientifique des données ?

Dec 18 2020 SCIENTIFIQUE. DES DONNÉES ? Big data



Cet ouvrage est diffusé en accès ouvert dans le cadre du projet

Oct 30 2016 G. Thierry : Qu'est-ce qu'une archive du Web ? Collection « Encyclopédie numérique »



Quest-ce que la cartographie du web ?

Aug 23 2021 Marseille : OpenEdition Press



Rapport dactivité 2019

modeste plateforme de revues est devenue une Plus que les technologies ce sont les usages qui ont ... de la science ouverte sans infrastructure qui.



6. Le travail scientifique des données dans les sciences sociales

Dec 18 2020 Christine L. Borgman. Qu'est-ce que le travail scientifique des données ? Big data



Les vides juridiques

Apr 18 2016 La justification de ce retrait avancée par le gouvernement est double : ... Le text and data mining au regard du droit d'auteur.



Présentation du Livre blanc

Jul 21 2015 objectifs et la démarche de réalisation de ce Livre blanc sont présentés ... text and data mining » (fouille de texte et de données) : cette ...



Politique nationale de lIST

cette livraison épatante d'Arabesques c'est tout le text and data mining une opération presque aussi ... les livres sont publiés sur OpenEdition Books.



The legal and policy framework for scientific data sharing mining

Sep 21 2017 supporting the exercise of Text and Data Mining: publication under open ... de ce qu'est l'accès libre et règlent la question des accords de ...

Quest-ce que le text and data mining ? Direction de l'Information Scientifique et Technique - CNRS Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique Études et propositions en vue de l'application de la loi

OpenEdition Press

Qu'est-ce que le

text and data mining

DOI : 10.4000/books.oep.1716

Éditeur : OpenEdition Press

Lieu d'édition : Marseille

Année d'édition : 2017

Date de mise en ligne : 31 janvier 2017

Collection : Laboratoire d'idées

EAN électronique : 9782821878426

http://books.openedition.org

Référence électronique

DIRECTION DE L'INFORMATION SCIENTIFIQUE ET TECHNIQUE - CNRS.

Qu'est-ce que le text and data

mining In Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique Études et propositions en vue de l'application de la loi [en ligne]. Marseille : OpenEdition Press, 2017 (généré le 16 mai 2023). Disponible sur Internet : . ISBN

9782821878426. DOI

: https://doi.org/10.4000/books.oep.1716. Ce document a été généré automatiquement le 16 mai 2023.

Qu'est-ce que le text and data

mining ?

1 Le data mining est un concept jeune qui apparaît en 1989 sous un premier nom de KDD

(Knowledge Discovery in Databases, en français ECD pour Extraction de Connaissances à partir des Données).

2 Le terme de " text and data mining » est apparu pour la première fois dans le domaine du

marketing au début des années 1990. Ce concept, tel qu'appliqué aux services

marketing, est étroitement lié au concept du " one-to-one relationship » (Michael Berry et Gordon Linoff, créateurs du data mining dans le marketing), c'est-à-dire à la personnalisation des rapports entre l'entreprise et sa clientèle.

3 Si le domaine d'application du TDM qui intéresse le présent Guide est celui de la

Science, la pratique du TDM est utilisée dans de nombreux secteurs d'activité comme par exemple 1 : le marketing direct : dans ce domaine des techniques de TDM sont par exemple utilisées pour segmenter les bases de données clients et pour prédire leur intention d'achat afin d'optimiser le discours marketing ; la communication : le filtrage anti-spam des courriers électroniques ou encore le système Echelon, système mondial d'interception des communications privées et publiques (SIGINT),

élaboré par les États-Unis, le Royaume-Uni, le Canada, l'Australie et la Nouvelle-Zélande

dans le cadre du traité UKUSA, sont des techniques de TDM ; le secteur bancaire et la finance ; l'assurance et la santé ; les secteurs médical et pharmaceutique.

4 Le développement des pratiques du TDM a vu le jour ses dernières années dans le

domaine scientifique avec le développement des archives ouvertes de type arXiv ou HAL afin d'optimiser la recherche sur ses bases au volume croissant de données.

5 La notion de text and data mining ou encore d'exploration ou de fouille de textes et de

données appliquée au domaine scientifique est aujourd'hui largement utilisée pour

désigner des activités, des outils divers. Il est par conséquent proposé d'analyser la• • • • • Qu'est-ce que le text and data mining ?

Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique1 notion de TDM sous l'angle juridique, technique et économique afin de répondre aux questions suivantes :

Qu'est-ce que le TDM ?

Quelles sont les opérations que le TDM mobilise ?

Dans quels domaines le TDM s'applique-t-il ?

Comment mesurer l'efficience du TDM ?

Le droit du TDM

La consécration légale d'un droit au TDM par une exception

6 Double exception. L'article 38 de la loi (Petite loi) consacre un droit au text and data

mining en introduisant une exception au droit d'auteur et au droit du producteur de base de données selon les termes suivant : Le Code de la propriété intellectuelle est ainsi modifié :

1° Après le second alinéa du 9° de l'article L. 122-5, il est inséré un 10° ainsi rédigé :

" 10° Les copies ou reproductions numériques réalisées à partir d'une source licite, en vue de l'exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à l'exclusion de toute finalité commerciale. Un décret fixe les conditions dans lesquelles l'exploration des textes et des données est mise en oeuvre, ainsi que les modalités de conservation et de communication des fichiers produits au terme des activités de recherche pour lesquelles elles ont été produites ; ces fichiers constituent des données de la recherche ; »

2° Après le 4° de l'article L. 342-3, il est inséré un 5° ainsi rédigé :

" 5° Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès, en vue de fouilles de textes et de données incluses ou associées aux écrits scientifiques dans un cadre de recherche, à l'exclusion de toute finalité commerciale. La conservation et la communication des copies techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. »

7 Absence de définition. Le texte ne pose pas de définition de la notion même

d'exploration ou de fouille de données. L'utilisation de ces deux termes dans un même texte appelle une remarque : l'utilisation du terme " exploration » de textes et de données dans la première partie du texte introduisant une exception au droit d'auteur et celui de " fouille » dans la seconde partie créant une exception au droit du producteur de base de données risque de soulever des problématiques d'interprétation.

Le décret d'application pourrait à titre introductif préciser que les notions

d'exploration et de fouille recouvrent les mêmes pratiques. Le décret d'application pourrait à titre introductif préciser que les notions d'exploration et de fouille recouvrent les mêmes pratiques. Le décret doit à la manière des directives européennes comporter un article " Définition ».

8 Encadrement de la notion. Si les notions même de fouille et d'exploration de textes et

de données ne sont pas définies, le texte pose des limites et un cadre à cette pratique :

Critères Article 38• • • •

Qu'est-ce que le text and data mining ?

Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique2

FondementException au droit d'auteur et au droit du producteur de base de données :droit de copie et de reproduction numérique aux fins de TDM

Périmètre du TDM

Fouille de textes et de données incluses ou associées aux écrits scientifiques

Bénéficiaire de

l'exception

Limites

TDM limité aux besoins de la recherche scientifique / dans un cadre de recherche

But non-commercial

Source licite / accès licite aux textes et données objets du TDM L'introduction d'une exception TDM dans le projet de directive Droit d'auteur dans le marché unique numérique

9 Rapports préliminaires. Le Livre blanc " Une Science ouverte dans une République

numérique » relevait les nombreux rapports, dont certains commandés par la

Commission européenne, qui préconisaient la révision de la directive 2001/29/CE " Droit d'auteur et droit voisin dans la société de l'information » et l'introduction d'un droit au TDM :

le rapport Sirinelli pour le Conseil supérieur de la propriété littéraire et artistique (CSPLA)

" Rapport de la mission sur la révision de la directive 2001/29/CE sur l'harmonisation de

certains aspects du droit d'auteur et des droits voisins dans la société de l'information » de

décembre 2014 demande la " création de nouvelles exceptions au droit d'auteur concernent notamment les activités dites de text and data mining (TDM) »2 ; l'étude du cabinet Wolf & Partners de mars 2014, intitulée " Study on the legal framework of text and data mining »3 pour la Commission européenne ; un groupe d'experts de la Commission européenne a également publié en avril 2014 un rapport intitulé " Standardisation in the area of innovation and technological development, notably in the field of Text and data mining »4 ; le rapport Reda : ce rapport adopté par le Parlement européen le 9 juillet 2015 affirme

" l'impératif d'évaluer avec soin la mise à disposition des techniques analytiques

automatisées des textes et des données (par exemple la "fouille de textes et de données") à

des fins de recherche. » ; le communiqué de presse de la Commission européenne du 9 décembre 2015 présentant les mesures pour améliorer l'accès aux contenus en ligne et présentant sa vision d'un droit d'auteur modernisé. Dans ce cadre, la Commission annonçait avoir " l'intention de travailler

sur les exceptions au droit d'auteur » et notamment de réviser " les règles de l'Union afin de

permettre aux chercheurs d'utiliser plus facilement les techniques de fouille data mining et de text mining pour analyser de grandes séries de données. »

10 Projet de directive. Le projet de directive Droit d'auteur dans le marché unique

numérique (COM(2016) 593 final) a été publié par la Commission européenne le 14 septembre 2016.

11 Par ce projet de directive Droit d'auteur dans le marché unique numérique (COM(2016)593 final)5, la Commission a pour objectif " de moderniser les règles de l'UE sur le droit• • • • • Qu'est-ce que le text and data mining ?

Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique3

d'auteur pour favoriser l'essor et la diffusion de la culture européenne ». " Lespropositions mettront également des outils permettant d'innover à la disposition de

l'enseignement, de la recherche et des institutions du patrimoine culturel »

6. L'objectif

de cette directive est d'adapter les dispositions relatives au droit d'auteur à l'utilisation croissante des technologies numériques notamment dans le domaine de la recherche scientifique, constatant l'application protéiforme des dispositions de la directive

DADVSI et notamment des exceptions

7.

12 Définition TDM. L'article 2 de la directive propose une définition de la notion de text

and data mining : " text and data mining means any automated analytical technique aiming to analyse text and data in digital form in order to generate information such as patterns, trends and correlations. »

13 Exception. L'article 3 introduit une exception au droit d'auteur et au droit du

producteur de base de données en faveur du text and data mining dans les termes suivants :

Article 3 - Text and data mining

1. Member States shall provide for an exception to the rights provided for in Article 2 of

Directive 2001/29/EC, Articles 5(a) and 7(1) of Directive 96/9/EC and Article 11(1) of this Directive for reproductions and extractions made by research organisations in order to carry out text and data mining of works or other subject-matter to which they have lawful access for the purposes of scientific research.

2. Any contractual provision contrary to the exception provided for in paragraph 1 shall be

unenforceable.

3. Rightholders shall be allowed to apply measures to ensure the security and integrity of the

networks and databases where the works or other subject-matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective.

4. Member States shall encourage rightholders and research organisations to define

commonly-agreed best practices concerning the application of the measures referred to in paragraph 3.

14 Cette exception peut être analysée selon les critères suivants (critères utilisés pourl'analyse du texte français) :

Critères Projet de Directive

Fondement

Exception au droit d'auteur et au droit du producteur de base de données : droit de reproduction ou d'extraction aux fins de TDM

Périmètre du TDM

TDM sur des oeuvres ou d'autres objets

Bénéficiaire de

l'exception Les organisations de recherche (la notion est définie de manière large à l'article 2 du projet de directive 8)

Limites

TDM limité aux besoins de la recherche scientifique

But non-commercial

Accès légal aux objets du TDM

15 La Commission justifie les lignes directrices de ce texte de la manière suivante :Text and data mining :

Option 1 consisted in self-regulation initiatives from the industry.• Qu'est-ce que le text and data mining ?

Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique4 Other options consisted in the introduction of a mandatory exception covering text and data mining. In Option 2, the exception only covered uses pursuing a non-commercial scientific research purpose. Option 3 allowed uses for commercial scientific research purpose but limited the benefit of the exception to some beneficiaries. Option 4 went further as it did not restrict beneficiaries. Option 3 was deemed to be the most proportionate one.

16 La Commission précise que l'objectif de ce texte est de fournir une clarification

juridique et un cadre de concurrence équitable afin que les chercheurs européens puissent utiliser des techniques innovantes d'analyse de données ; leur permettant de trouver plus rapidement des solutions novatrices en réponse aux défis majeurs tels que les épidémies mondiales et le changement climatique ; favorisant les collaborations transfrontalières et interdisciplinaires. Cette exception participe au soutien de la compétitivité européenne en favorisant l'open science9.

17 Carlos Moedas, Commissaire européen à la recherche, à l'innovation et à la science, a

justifié la nécessité de cette exception de la manière suivante : " Science needs a copyright law that reflects the reality of the modern age. We must remove barriers that prevent scientists from digging deeper into the existing knowledge base. This proposed copyright exception will give researchers the freedom to pursue their work without fear of legal repercussions, and so allow our greatest minds to discover new solutions to major societal problems. »

18 Si la France et l'Europe se dotent d'un arsenal législatif autorisant l'utilisation de

techniques d'analyse automatiques, il est également intéressant de regarder les dispositions adoptées par d'autres pays. Des périmètres mouvant de la notion de TDM à travers les textes nationaux

19 Le tableau ci-après présente une lecture analytique de la notion de TDM dans les

législations anglaises, américaines, japonaises, autant de législations qui ont intégré

légalement un droit au TDM.

Pays Source Texte

Caractéristiques du

TDM•

• Qu'est-ce que le text and data mining ? Livre blanc - Une Science ouverte dans une République numérique - Guide stratégique5 Royaume-UniLoiArticle 29 Aintroduit en2014 dans leCopyright,Designs andPatents Act(1988)

1029A Copies for text and data analysis for non-commercial research(1) The making of a copy of a work by a personwho has lawful access to the work does notinfringe copyright in the work provided that - (a)the copy is made in order that a person who haslawful access to the work may carry out acomputational analysis of anything recorded inthe work for the sole purpose of research for a non-commercial purpose, and(b)the copy is accompanied by a sufficientacknowledgement (unless this would be impossiblefor reasons of practicality or otherwise).(2) Where a copy of a work has been made underthis section, copyright in the work is infringed if - (a)the copy is transferred to any other person,except where the transfer is authorised by thecopyright owner, or(b)the copy is used for any purpose other than thatmentioned in subsection (1)(a), except where theuse is authorised by the copyright owner.(3) If a copy made under this section issubsequently dealt with - (a)it is to be treated as an infringing copy for thepurposes of that dealing, and(b)if that dealing infringes copyright, it is to betreated as an infringing copy for all subsequentpurposes.(4) In subsection (3) "dealt with" means sold or letfor hire, or offered or exposed for sale or hire.(5) To the extent that a term of a contract purportsto prevent or restrict the making of a copy which,by virtue of this section, would not infringecopyright, that term is unenforceable.Fondement :

Exception

au droit d'auteur aux fins " d'analyse computationnelle »

Périmètre :

les oeuvres et toutes données associéesquotesdbs_dbs31.pdfusesText_37
[PDF] Data Mining & Statistique

[PDF] Cours IFT6266, Exemple d'application: Data-Mining

[PDF] Introduction au Data Mining - Cedric/CNAM

[PDF] Defining a Data Model - CA Support

[PDF] Learning Data Modelling by Example - Database Answers

[PDF] Nouveaux prix à partir du 1er août 2017 Mobilus Mobilus - Proximus

[PDF] règlement général de la consultation - Inventons la Métropole du

[PDF] Data science : fondamentaux et études de cas

[PDF] Bases du data scientist - Data science Master 2 ISIDIS - LISIC

[PDF] R Programming for Data Science - Computer Science Department

[PDF] Sashelp Data Sets - SAS Support

[PDF] Introduction au domaine du décisionnel et aux data warehouses

[PDF] DESIGNING AND IMPLEMENTING A DATA WAREHOUSE 1

[PDF] Datawarehouse

[PDF] Definition • a database is an organized collection of - Dal Libraries