[PDF] Bases de données documentaires et distribuées





Previous PDF Next PDF



CADRE EUROPEEN COMMUN DE REFERENCE POUR LES

Cette version restructurée d'un Cadre européen commun de référence pour des langues : enseignants et apprenants dans la classe mais aussi ...



Guide utilisateurs Portail de larmateur site

4 févr. 2021 Guide à l'attention des armateurs. Version : v1.8.2 ... Saisissez votre adresse électronique reproduisez le code de sécurité



Découvrez et Maitriser Votre Ordinateur

Navigation sur le Web Courrier électronique Rédaction phlr



CNIL

électronique (PSCE) référencé conforme au RGS dans sa version 1.0 pour un usage de chiffrement. • Mettre en place des mécanismes de vérification des 



MANUEL DU RESPONSABLE DE CENTRE DEXAMEN DELF

31 déc. 2021 d'une session d'examen du DELF-DALF. ... 8.2. Contenu . ... Votre gestionnaire à France Éducation international restera à votre disposition ...



Conception et réalisation dun système dinformation sur la formation

D'autre part la production de documents pédagogiques fait partie de ses activités (Ressources Electroniques Pour les. Etudiants



Internet et Entreprise mirages et opportunités ? Pour un plan daction

1 janv. 2004 Un effondrement boursier des entreprises du secteur lié aux télécom et au commerce électronique qui paient les.



Brochure dinfo TSCBF sup 23

22 juil. 2022 Pour l'avancement au grade de de technicien des services culturels et des bâtiments de France de classe supérieure. Session 2023 ...



Brochure dinfo TSCBF ex 2023

22 juil. 2022 Pour l'avancement au grade de technicien des services culturels et des bâtiments de France de classe exceptionnelle. Session 2023 ...



Bases de données documentaires et distribuées

26 sept. 2021 La réponse au quiz pour valider votre compréhension. — La réalisation des exercices proposés en fin de session.

Bases de données documentaires et distribuées

Bases de données documentaires et

distribuées

Version Février 2023

Philippe Rigaux

févr. 07, 2023

Table des matières

1 Introduction3

1.1 Sujet du cours

4

1.2 Contenu et objectifs du cours

5

1.3 Organisation

6

2 Préliminaires : Docker

7

2.1 Introduction à Docker

9

2.2 Docker en ligne de commande

11

2.3 Le tableau de bord (dashboard)

17

3 Modélisation de bases NoSQL

21

3.1 S1 : documents structurés

22

3.2 S2. Modélisation des collections

30

3.3 S3 : Cassandra, une base relationnelle étendue

41

3.4 S4 : MongoDB, une base JSON

51

3.5 Exercices

55

4 Interrogation de bases NoSQL

59

4.1 S1 : HTTP, REST, et CouchDB

59

4.2 S2 : requêtes Cassandra

71

4.3 S3 : requêtes avec MongoDB

75

5 MapReduce, premiers pas

81

5.1 S1 : MapReduce démystifié

82

5.2 S2 : MapReduce et CouchB

90

5.3 S3 :FrameworksMapReduce : MongoDB. . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.4 Exercices

102

6 Cassandra - Travaux Pratiques

107

6.1 Partie 1 : Approche relationnelle

108

6.2 Partie 2 : modélisation spécifique NoSQL

111

7 MongoDB - Travaux Pratiques

113 i

7.1 Manipulation de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.2 Pratique de Map/Reduce

115

7.3 Bonus / Pour aller plus loin

116

8 Introduction à la recherche d"information

119

8.1 S1 : les principes

119

8.2 S2 : Bases documentaires et moteur de recherche

127

8.3 S3 : la pratique : requêtes booléennes

134

8.4 Exercices

138

9 Recherche d"information : l"indexation

141

9.1 S1 : L"analyse de documents

141

9.2 S2 : L"indexation dans ElasticSearch

144

10 Recherche avec classement

157

10.1 S1 : recherche avec classement

157

10.2 S2 : recherche plein texte

160

10.3 S3 : l"algorithme PageRank

166

10.4 Exercices

169

10.5 Implémenter le classement dans un moteur de recherche

173

11 Recherche d"information - TP ElasticSearch

175

11.1 Mise en place d"ElasticSearch

175

11.2 Interrogation

177

11.3 Agrégats

178

11.4 Bonus : Agrégats via mapping spécifique

179

12 Recherche d"information - TP ElasticSearch : pertinence

181

12.1 Elasticsearch et la pertinence

181

12.2 À vous de jouer

186

13 Lecloud, une nouvelle machine de calcul187

13.1 S1 :cloudet données massives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

13.2 S2 : La scalabilité

196

13.3 S3 : anatomie d"une grappe de serveurs

200

13.4 Exercices

204

14 Systèmes NoSQL : la réplication

207

14.1 S1 : réplication et reprise sur panne

207

14.2 S2 : réplication dans MongoDB

217

14.3 S3 : ElasticSearch

221

14.4 S4 : Cassandra

228

14.5 Exercices

236

15 Systèmes NoSQL : le partitionnement

241

15.1 S1 : les bases

241

15.2 S2 : partitionnement par intervalle

248

15.3 S3 : partitionnement par hachage

257

15.4 Exercices

270 ii

16 Calcul distribué : Hadoop et MapReduce275

16.1 S1 : MapReduce

276

16.2 S2 : Une brève introduction à Hadoop

283

16.3 S3 : langages de traitement : Pig

295

16.4 Exercices

301

17 Traitement de données massives avec Apache Spark

305

17.1 S1 : Introduction à Spark

306

17.2 S2 : Spark en pratique

312

17.3 S3 : Traitement de données structurées avec Cassandra et Spark

320

17.4 Exercices

325

18 Traitement de flux massifs avec Apache Flink

327

18.1 S1 : Apache Flink

328

18.2 S2 : l"API de streaming Flink

337

18.3 S3 : Le fenêtrage

345

19 Pig : Travaux pratiques

351

19.1 Première partie : analyse de flux multiples

351

19.2 Deuxième partie : analyse de requêtes

353

20 Projets NFE204361

20.1 Les étapes

362

20.2 Les données

363

20.3 Le système NoSQL

363

20.4 Le rapport

364

21 Annales des examens

365

21.1 Examen du 3 février 2015

365

21.2 Examen du 14 avril 2015

367

21.3 Examen du 15 juin 2015

368

21.4 Examen du 1er juillet 2016 (FOD)

370

21.5 Examen du 1er février 2017 (Présentiel)

374

21.6 Examen du 6 février 2018 (Présentiel)

377

21.7 Examen du 30 juin 2020

381

21.8 Examen du 5 septembre 2020

383

22 Indices and tables

387 iii

iv Bases de données documentaires et distribuées, Version Février 2023

Tout le matériel proposé ici sert de support au cours " Bases de données documentaires et distribuées »

proposé par le département d"informatique du Cnam. Le code du cours est NFE204 (voir le site http: pour des inf ormationspratiq ues).Il es tdonné en Cours présentiel (premier semes tre,mardi soir) Cours à dis tance(second semes tre,a vecsuppor tsaudio visuels)

Par ailleurs, le document que vous commencez à lire fait partie de l"ensemble des supports d"apprentissage

proposés sur le site http:// www.bdpedia.fr .R eportez-vousà ce site pour plus d"e xplications.

Ce cours fait partie d"un ensemble d"enseignements consacrés à l"analyse de données massives, permettant

éventuellement d"obtenir un Certificat de Spécialisation au Cnam. Vous êtes invités à consulter :

Le site du cer tificat:

http:// donneesmassives.cnam.fr/

La fic hedu cer tificat:

http:// formation.cnam.fr/rechercher-par-discipline/ La présentation du cours R CP216sur la f ouillede données dis tribuée http:// cedric.cnam.fr/vertigo/

Cours/RCP216/preambule.html

La présentation du projet de synthèse (U ASB03)q uiconclut le Cer tificatde données massiv es,

http: //cedric.cnam.fr/vertigo/Cours/UASB03/uasb03.htmlTable des matières1 Bases de données documentaires et distribuées, Version Février 2023

2Table des matières

CHAPITRE1Introduction

Supports complémentaires :

Diapositiv es:Présentation du cours

V idéode présentation du cours Les bases relationnelles sont adaptées à des informations bien structurées, décomposables en unités simples

(chaînes de caractères, numériques), et représentables sous forme de tableaux. Beaucoup de données ne

satisfont pas ces critères : leur structure est complexe, variable, et elles ne se décomposent par aisément

en attributs élémentaires. Comment représenter le contenu d"un livre par exemple? d"une image ou d"une

vidéo? d"une partition musicale?

Les bases relationnelles répondent à cette question en multipliant le nombre de tables, et de lignes dans ces

tables, pour représenter ce qui constitue conceptuellement une même " entité ». Cette décomposition en

fragment " plats » (les lignes) est la fameusenormalisation(relationnelle) qui impose, pour reconstituer l"in-

formation complète, d"effectuer une ou plusieurs jointures assemblant les lignes stockées indépendamment

les unes des autres.Note :Ce cours suppose une connaissance solide des bases de données relationnelles. Si ce n"est pas le cas,

vous risquez d"avoir des lacunes et des difficultés à assimiler les nouvelles connaissances présentées. Je vous

quotesdbs_dbs32.pdfusesText_38
[PDF] L avenir de l externalisation des applications : de la tactique à la stratégie

[PDF] Liste des conventions automatiques de valorisation

[PDF] (Transféré par Ordonnance nº 2000-914 du 18 septembre 2000 art. 11 I, II Journal Officiel du 21 septembre 2000)

[PDF] Les priorités de l ACPR L évolution des règles internationales

[PDF] De couverte de ScratchJR sur Ipad. De couverte de Scratch online ou offline

[PDF] SPECIALITE SCIENCES DES MATERIAUX ET NOUVELLES TECHNOLOGIES

[PDF] Fondation ENSIC. Rapport d activité 2010

[PDF] Rapport annuel de gestion 2011-2012. Tiré à part

[PDF] Jeux collectifs situations d'apprentissage

[PDF] Les ressorts de l économie des services : dynamique propre et externalisation

[PDF] Protocole: éléments pratiques

[PDF] EXPÉRIENCE CLIENT. Saison 3 : le e-commerce. Baromètre Akio

[PDF] (AIPP) THEME : LES BONNES PRATIQUES EN MATIERE DE POURSUITES : APPRENDRE. ATELIER 2 : Comment parvenir à l excellence avec un budget restreint?

[PDF] Participer à votre première session des Classes électroniques

[PDF] Petit guide pour envisager les