25 sept 2018 · Les bases relationnelles ont SQL, nous verrons que la recherche L'application cliente de base est l'interpréteur de commandes cqlsh, ce
Previous PDF | Next PDF |
[PDF] Télécharger le cours SQL
Cours SQL ______ Base du langage SQL et des bases de données Auteur Tony Archambeau Site web http://sql sh Date 24 mai 2014 Licence Mis à
[PDF] BigData - Semaine 5
Le cours de cette semaine présente le SGBD Cassandra, conçu pour à SQL, mais beaucoup plus limité et certains aspects sont très prompt$ cqlsh master
[PDF] 1 Cassandra en ligne de commande
à SQL mais il y a quelques spécificités cruciales Ensuite Lancez le shell de Cassandra en tapant cqlsh master Relire le cours concernant l'injection de CSV
[PDF] Intéraction avec une base Cassandra - Chewbiicom
La console pour CQLSH (voir plus bas) devra être ouverte séparément CREATE INDEX fk_Enseignement_Enseignant_idx ON Cours ( Responsable ) ; de SQL Pour la suite des exercices, exprimer en CQL la requête demandée :
[PDF] NoSQL Etat de lart et benchmark - CORE
Les bases de données NoSQL, qui signifie « not only SQL » sont des types de base voient la base de données dans un état cohérent, les données en cours de Ensuite, il était intéressant de voir les deux clients (Cassandra-cli et CQLSH )
[PDF] le modèle de données Cassandra - Cours de bases de données
en mode multi-nœuds Dans ce cours, nous étudions le modèle de données 2 Interpréteur de commandes (cqlsh) • DevCenter (Datastax), le Insertions A la SQL insert into artists (id, last_name, first_name, birth_date) values ('artist1'
[PDF] Bases de données documentaires et distribuées - Cours de bases
25 sept 2018 · Les bases relationnelles ont SQL, nous verrons que la recherche L'application cliente de base est l'interpréteur de commandes cqlsh, ce
[PDF] BasesDonneesLinuxpdf - X-Files
il a beaucoup travaillé avec les bases de données sous Unix/C/C++/SQL Il a cour des grands tels que Oracle, Informix, IBM, Sun, Dell, Compaq et beau- charger sqsh, un outil beaucoup plus agréable pour des fonctionnalités simi- laires
Memento SQL - uniportedung
10 avr 2020 · It will unquestionably ease you to look guide Memento S Q L as you such as Si l'on veut a cher la table elevenotedu cours par notes d ecroissantes, Aide mémoire SQL ©sqlsh Requêtes SQL SELECT * # Sélection des
[PDF] Statistique : Résumé de cours et méthodes 1 - Xm1 Math
[PDF] Première ES - Statistiques descriptives - Variance et écart - Parfenoff
[PDF] Cours de statistiques - 1 ère S - B Sicard
[PDF] I Etude d 'une série statistique : le vocabulaire II - college-therouanne
[PDF] Statistique et calcul de probabilité
[PDF] Cours de Statistiques inférentielles
[PDF] Probabilités et Statistiques, polycopié de L3 - Département de
[PDF] Probabilités et Statistique
[PDF] 10h45-11h: Les statistiques sanitaires et la santé publique Dr - HCP
[PDF] Statistique : Résumé de cours et méthodes 1 - Xm1 Math
[PDF] Statistique : Résumé de cours et méthodes 1 - Xm1 Math
[PDF] Statistique spatiale
[PDF] Statistiques : moyenne, médiane et étendue - KeepSchool
[PDF] Première S - Statistiques descriptives - Variance et écart - Parfenoff
Bases de données documentaires et
distribuéesVersion Février 2023
Philippe Rigaux
févr. 07, 2023Table des matières
1 Introduction3
1.1 Sujet du cours
41.2 Contenu et objectifs du cours
51.3 Organisation
62 Préliminaires : Docker
72.1 Introduction à Docker
92.2 Docker en ligne de commande
112.3 Le tableau de bord (dashboard)
173 Modélisation de bases NoSQL
213.1 S1 : documents structurés
223.2 S2. Modélisation des collections
303.3 S3 : Cassandra, une base relationnelle étendue
413.4 S4 : MongoDB, une base JSON
513.5 Exercices
554 Interrogation de bases NoSQL
594.1 S1 : HTTP, REST, et CouchDB
594.2 S2 : requêtes Cassandra
714.3 S3 : requêtes avec MongoDB
755 MapReduce, premiers pas
815.1 S1 : MapReduce démystifié
825.2 S2 : MapReduce et CouchB
905.3 S3 :FrameworksMapReduce : MongoDB. . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4 Exercices
1026 Cassandra - Travaux Pratiques
1076.1 Partie 1 : Approche relationnelle
1086.2 Partie 2 : modélisation spécifique NoSQL
1117 MongoDB - Travaux Pratiques
113 i7.1 Manipulation de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.2 Pratique de Map/Reduce
1157.3 Bonus / Pour aller plus loin
1168 Introduction à la recherche d"information
1198.1 S1 : les principes
1198.2 S2 : Bases documentaires et moteur de recherche
1278.3 S3 : la pratique : requêtes booléennes
1348.4 Exercices
1389 Recherche d"information : l"indexation
1419.1 S1 : L"analyse de documents
1419.2 S2 : L"indexation dans ElasticSearch
14410 Recherche avec classement
15710.1 S1 : recherche avec classement
15710.2 S2 : recherche plein texte
16010.3 S3 : l"algorithme PageRank
16610.4 Exercices
16910.5 Implémenter le classement dans un moteur de recherche
17311 Recherche d"information - TP ElasticSearch
17511.1 Mise en place d"ElasticSearch
17511.2 Interrogation
17711.3 Agrégats
17811.4 Bonus : Agrégats via mapping spécifique
17912 Recherche d"information - TP ElasticSearch : pertinence
18112.1 Elasticsearch et la pertinence
18112.2 À vous de jouer
18613 Lecloud, une nouvelle machine de calcul187
13.1 S1 :cloudet données massives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
13.2 S2 : La scalabilité
19613.3 S3 : anatomie d"une grappe de serveurs
20013.4 Exercices
20414 Systèmes NoSQL : la réplication
20714.1 S1 : réplication et reprise sur panne
20714.2 S2 : réplication dans MongoDB
21714.3 S3 : ElasticSearch
22114.4 S4 : Cassandra
22814.5 Exercices
23615 Systèmes NoSQL : le partitionnement
24115.1 S1 : les bases
24115.2 S2 : partitionnement par intervalle
24815.3 S3 : partitionnement par hachage
25715.4 Exercices
270 ii
16 Calcul distribué : Hadoop et MapReduce275
16.1 S1 : MapReduce
27616.2 S2 : Une brève introduction à Hadoop
28316.3 S3 : langages de traitement : Pig
29516.4 Exercices
30117 Traitement de données massives avec Apache Spark
30517.1 S1 : Introduction à Spark
30617.2 S2 : Spark en pratique
31217.3 S3 : Traitement de données structurées avec Cassandra et Spark
32017.4 Exercices
32518 Traitement de flux massifs avec Apache Flink
32718.1 S1 : Apache Flink
32818.2 S2 : l"API de streaming Flink
33718.3 S3 : Le fenêtrage
34519 Pig : Travaux pratiques
35119.1 Première partie : analyse de flux multiples
35119.2 Deuxième partie : analyse de requêtes
35320 Projets NFE204361
20.1 Les étapes
36220.2 Les données
36320.3 Le système NoSQL
36320.4 Le rapport
36421 Annales des examens
36521.1 Examen du 3 février 2015
36521.2 Examen du 14 avril 2015
36721.3 Examen du 15 juin 2015
36821.4 Examen du 1er juillet 2016 (FOD)
37021.5 Examen du 1er février 2017 (Présentiel)
37421.6 Examen du 6 février 2018 (Présentiel)
37721.7 Examen du 30 juin 2020
38121.8 Examen du 5 septembre 2020
38322 Indices and tables
387 iii
iv Bases de données documentaires et distribuées, Version Février 2023Tout le matériel proposé ici sert de support au cours " Bases de données documentaires et distribuées »
proposé par le département d"informatique du Cnam. Le code du cours est NFE204 (voir le site http: pour des inf ormationspratiq ues).Il es tdonné en Cours présentiel (premier semes tre,mardi soir) Cours à dis tance(second semes tre,a vecsuppor tsaudio visuels)Par ailleurs, le document que vous commencez à lire fait partie de l"ensemble des supports d"apprentissage
proposés sur le site http:// www.bdpedia.fr .R eportez-vousà ce site pour plus d"e xplications.Ce cours fait partie d"un ensemble d"enseignements consacrés à l"analyse de données massives, permettant
éventuellement d"obtenir un Certificat de Spécialisation au Cnam. Vous êtes invités à consulter :
Le site du cer tificat:
http:// donneesmassives.cnam.fr/La fic hedu cer tificat:
http:// formation.cnam.fr/rechercher-par-discipline/ La présentation du cours R CP216sur la f ouillede données dis tribuée http:// cedric.cnam.fr/vertigo/Cours/RCP216/preambule.html
La présentation du projet de synthèse (U ASB03)q uiconclut le Cer tificatde données massiv es,
http: //cedric.cnam.fr/vertigo/Cours/UASB03/uasb03.htmlTable des matières1 Bases de données documentaires et distribuées, Version Février 20232Table des matières
CHAPITRE1Introduction
Supports complémentaires :
Diapositiv es:Présentation du cours
V idéode présentation du cours Les bases relationnelles sont adaptées à des informations bien structurées, décomposables en unités simples
(chaînes de caractères, numériques), et représentables sous forme de tableaux. Beaucoup de données ne
satisfont pas ces critères : leur structure est complexe, variable, et elles ne se décomposent par aisément
en attributs élémentaires. Comment représenter le contenu d"un livre par exemple? d"une image ou d"une
vidéo? d"une partition musicale?Les bases relationnelles répondent à cette question en multipliant le nombre de tables, et de lignes dans ces
tables, pour représenter ce qui constitue conceptuellement une même " entité ». Cette décomposition en
fragment " plats » (les lignes) est la fameusenormalisation(relationnelle) qui impose, pour reconstituer l"in-
formation complète, d"effectuer une ou plusieurs jointures assemblant les lignes stockées indépendamment
les unes des autres.Note :Ce cours suppose une connaissance solide des bases de données relationnelles. Si ce n"est pas le cas,
vous risquez d"avoir des lacunes et des difficultés à assimiler les nouvelles connaissances présentées. Je vous
recommande au préalable de consulter les cours suivants : le coursBases relationnelles, modèles et lang ages
, pour tout savoir sur la conception d"une base relationnelle et le langage SQL. le coursSy stèmesrelationnels
, pour les aspects systèmes : indexation, optimisation, concurrenced"accès.Cette approche, qui a fait ses preuves, ne convient cependant pas dans certains cas. Les données de nature es-
Bases de données documentaires et distribuées, Version Février 2023de certains objets dont la stucture est très flexible; enfin,l"échange de donnéesdans un environnement dis-
tribué se prête mal à une représentation éclatée en plusieurs constituants élémentaires qu"il faut ré-assembler
pour qu"ils prennent sens. Toutes ces raisons mènent à des modes de représentation plus riches permettant
la réunion, en une seule structure, de toutes les informations relatives à un même objet conceptuel. C"est ce
que nous appelleronsdocument, dans une acception élargie un peu abusive mais bien pratique. 1.1Suje tdu cour s
Dans tout ce qui suit nous désignons donc par le terme générique dedocumenttoute paire(i, v)oùiest
l"identifiant du document etvunevaleur structuréecontenant les informations caractérisant le document.
Nous reviendrons plus précisément sur ces notions dans le cours.La gestion d"ensembles de documents selon les principes des bases de données, avec notamment des outils
de type " cloud ». L"usage est maintenant établi d"appeler ces systèmes " NoSQL » pour souligner leurs
différences avec les systèmes relationnels. Le fait qu"ils ne suivent pas le modèle relationnel est d"ailleurs à
peu près leur seul point commun. De manière générale, et avec de grandes variantes quand on se penche sur
les détails, ils partagent également :la représentation des données sous f ormed"unités d"inf ormationindépendantes les unes des unes, (ce
que nous appelons justementdocument) organisées encollections;des méthodes d"accès aux collections basées soit sur des pr imitivesassez simplis tes,soit sur des
quotesdbs_dbs18.pdfusesText_24