[PDF] Bases de données documentaires et distribuées





Previous PDF Next PDF



La technologie au volant des voitures de demain

Les secteurs de l'automobile et des technologies de l'information et de la communication. (TIC) convergent à un rythme de plus en plus rapide. ITU News MA.



Présentation dAmazon Web Services - Livre blanc AWS

5 août 2021 AWS gère plus d'1 million de clients actifs répartis dans plus de 240 ... d'audit en vigueur les aides à la conformité AWS s'appuient sur ...



POUR LOBTENTION DUTITRE DE DOCTEUR ES SCIENCES DE

son aide et ses encouragements tout au long des deux années passées à Comme les promotions incitent les consommateurs à acheter plus ou plus tôt que.



Bases de données documentaires et distribuées

26 sept. 2021 Le client Docker est l'utilitaire grâce auquel on transmet au moteur ... et donnez à la base le nom nfe204 (aide : cherchez sur le Web les ...



Pivot Magazine juillet / août 2018

1 juil. 2018 les concerts les plus spectaculaires des dernières années. Qui sont les ... mieux soit acheter les technologies et les mettre à.



Proposition dune typologie des consommateurs intelligents

une grande aide au niveau de l'analyse de mes données ainsi que Madame Myriam avoir plus ; les smarts shoppeurs et les consommateurs collaboratifs. Les.



Les cahiers du programmeur - Java EE 5.pdf

vendre ses animaux en ligne de gérer son catalogue d'articles et sa base de données de clients. De plus



Kit pratique sur les compétences numériques

Nous sommes toujours plus nombreux à être raccor- dés à l'Internet et à utiliser des appareils et des services numériques pour le travail et pour tous les 



Linfluence du bouche à oreille électronique (eWOM) sur le

9 mars 2015 Ses conseils et ses remarques m'ont été d'une aide précieuse à toutes les étapes de la thèse. J'exprime mon respect au Professeur Isabelle Barth ...



Document

1 déc. 2020 aider à résoudre les défis de l'industrie des clients. Communautés. Atos capitalise sur les compétences de ses experts technologiques et ...

Bases de données documentaires et distribuées

Bases de données documentaires et

distribuées

Version Février 2023

Philippe Rigaux

févr. 07, 2023

Table des matières

1 Introduction3

1.1 Sujet du cours

4

1.2 Contenu et objectifs du cours

5

1.3 Organisation

6

2 Préliminaires : Docker

7

2.1 Introduction à Docker

9

2.2 Docker en ligne de commande

11

2.3 Le tableau de bord (dashboard)

17

3 Modélisation de bases NoSQL

21

3.1 S1 : documents structurés

22

3.2 S2. Modélisation des collections

30

3.3 S3 : Cassandra, une base relationnelle étendue

41

3.4 S4 : MongoDB, une base JSON

51

3.5 Exercices

55

4 Interrogation de bases NoSQL

59

4.1 S1 : HTTP, REST, et CouchDB

59

4.2 S2 : requêtes Cassandra

71

4.3 S3 : requêtes avec MongoDB

75

5 MapReduce, premiers pas

81

5.1 S1 : MapReduce démystifié

82

5.2 S2 : MapReduce et CouchB

90

5.3 S3 :FrameworksMapReduce : MongoDB. . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.4 Exercices

102

6 Cassandra - Travaux Pratiques

107

6.1 Partie 1 : Approche relationnelle

108

6.2 Partie 2 : modélisation spécifique NoSQL

111

7 MongoDB - Travaux Pratiques

113 i

7.1 Manipulation de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.2 Pratique de Map/Reduce

115

7.3 Bonus / Pour aller plus loin

116

8 Introduction à la recherche d"information

119

8.1 S1 : les principes

119

8.2 S2 : Bases documentaires et moteur de recherche

127

8.3 S3 : la pratique : requêtes booléennes

134

8.4 Exercices

138

9 Recherche d"information : l"indexation

141

9.1 S1 : L"analyse de documents

141

9.2 S2 : L"indexation dans ElasticSearch

144

10 Recherche avec classement

157

10.1 S1 : recherche avec classement

157

10.2 S2 : recherche plein texte

160

10.3 S3 : l"algorithme PageRank

166

10.4 Exercices

169

10.5 Implémenter le classement dans un moteur de recherche

173

11 Recherche d"information - TP ElasticSearch

175

11.1 Mise en place d"ElasticSearch

175

11.2 Interrogation

177

11.3 Agrégats

178

11.4 Bonus : Agrégats via mapping spécifique

179

12 Recherche d"information - TP ElasticSearch : pertinence

181

12.1 Elasticsearch et la pertinence

181

12.2 À vous de jouer

186

13 Lecloud, une nouvelle machine de calcul187

13.1 S1 :cloudet données massives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

13.2 S2 : La scalabilité

196

13.3 S3 : anatomie d"une grappe de serveurs

200

13.4 Exercices

204

14 Systèmes NoSQL : la réplication

207

14.1 S1 : réplication et reprise sur panne

207

14.2 S2 : réplication dans MongoDB

217

14.3 S3 : ElasticSearch

221

14.4 S4 : Cassandra

228

14.5 Exercices

236

15 Systèmes NoSQL : le partitionnement

241

15.1 S1 : les bases

241

15.2 S2 : partitionnement par intervalle

248

15.3 S3 : partitionnement par hachage

257

15.4 Exercices

270 ii

16 Calcul distribué : Hadoop et MapReduce275

16.1 S1 : MapReduce

276

16.2 S2 : Une brève introduction à Hadoop

283

16.3 S3 : langages de traitement : Pig

295

16.4 Exercices

301

17 Traitement de données massives avec Apache Spark

305

17.1 S1 : Introduction à Spark

306

17.2 S2 : Spark en pratique

312

17.3 S3 : Traitement de données structurées avec Cassandra et Spark

320

17.4 Exercices

325

18 Traitement de flux massifs avec Apache Flink

327

18.1 S1 : Apache Flink

328

18.2 S2 : l"API de streaming Flink

337

18.3 S3 : Le fenêtrage

345

19 Pig : Travaux pratiques

351

19.1 Première partie : analyse de flux multiples

351

19.2 Deuxième partie : analyse de requêtes

353

20 Projets NFE204361

20.1 Les étapes

362

20.2 Les données

363

20.3 Le système NoSQL

363

20.4 Le rapport

364

21 Annales des examens

365

21.1 Examen du 3 février 2015

365

21.2 Examen du 14 avril 2015

367

21.3 Examen du 15 juin 2015

368

21.4 Examen du 1er juillet 2016 (FOD)

370

21.5 Examen du 1er février 2017 (Présentiel)

374

21.6 Examen du 6 février 2018 (Présentiel)

377

21.7 Examen du 30 juin 2020

381

21.8 Examen du 5 septembre 2020

383

22 Indices and tables

387 iii

iv Bases de données documentaires et distribuées, Version Février 2023

Tout le matériel proposé ici sert de support au cours " Bases de données documentaires et distribuées »

proposé par le département d"informatique du Cnam. Le code du cours est NFE204 (voir le site http: pour des inf ormationspratiq ues).Il es tdonné en Cours présentiel (premier semes tre,mardi soir) Cours à dis tance(second semes tre,a vecsuppor tsaudio visuels)

Par ailleurs, le document que vous commencez à lire fait partie de l"ensemble des supports d"apprentissage

quotesdbs_dbs32.pdfusesText_38
[PDF] Sciences expérimentales et technologies (CM2)

[PDF] ECONOMIE SOCIALE : BILAN DE L EMPLOI EN 2010

[PDF] Financement du fonctionnement des équipements d accueil du jeune enfant. La prestation de service unique Mode d emploi

[PDF] Public cible : Directions & équipes Commerciales, Avant-ventes, Directeurs de projets, Consultants.

[PDF] Direction Enfance Jeunesse Service Petite Enfance

[PDF] Escalade NORME DE CLASSEMENT DES VOIES ET DES SITES NATURELS D ESCALADE

[PDF] Structure d accueil de la petite enfance Commune de Bagnes

[PDF] LES RESERVES NATURELLES REGIONALES

[PDF] CAHIER DES CHARGES N 04-2014

[PDF] GUIDE METHODOLOGIQUE

[PDF] Considérations pratiques. concernant l'organisation des classes CHAM instrumentistes

[PDF] Sdem50. Projet de déploiement d infrastructures de recharge sur le département de la Manche. Communauté de communes de Sèves-Taute le 7 octobre 2014

[PDF] L éducation au développement. Définitions et concepts

[PDF] Les besoins d états de référence de l environnement littoral demandés par la Directive Cadre sur l Eau

[PDF] Séance du conseil municipal du 7 Mai 2015 (20h30) Présents Arrivée en cours de séance Absent(s) excusé(s Secrétaire de séance Pouvoir de vote