Calcul Haute Performance architectures et modèles de programmation PDF

7. Mémoire et bus.key

Une mémoire stocke des mots de 8 bits (1 octet) et possède 216 cases mémoires. Quelle est la taille totale de la mémoire en kilo-octets (Ko)?. 2. Une mémoire

Chapitre 7 : Les mémoires

Dans une mémoire la taille du bus d'adresses K=14 et la taille du bus de données n=4. Calculer la capacité de cette mémoire ? C=214 = 16384 Mots de 4 bits.

Calcul des capacités de stockage des lisiers.pdf

V (m3) = Volume d'eaux brunes. S (m²) = Surface non couverte. P (m) = Pluviosité moyenne mensuelle hivernale. FS (%) = fraction à stocker.

Gestion de la mémoire

La manière la plus simple de faire de la multiprogrammation consiste à subdiviser la mémoire en n partitions de taille fixe. Chaque partition peut contenir

Capacité mémoire

Caches et mémoire virtuelle. Daniel Etiemble de@lri.fr. L3 Informatique - IFIPS2. 2007-08. Architecture des ordinateurs. D. Etiemble. 2. Capacité mémoire.

COMMENT CALCULER LE VOLUME DES VACCINS ET LA

Toutefois il faut veiller à ce que

8. Memoire et bus.pdf

taille mémoire = nombre d'adresses × taille d'un mot. = 28 × 1octet = 256 octets. 7. Page 8. Question 1. Une mémoire stocke des mots de 8 bits (1 octet) et

Calcul mémoire

http://www.uphf.fr/congres/10annivLAMIH/doc/Delahaye.pdf

Calcul des capacités de stockage des effluents délevage

Le calcul des capacités de stockage est à effectuer pour les effluents qui ne sont et/ou ne peuvent pas être stockés au champ. Espèces animales. Type d'

Calcul Haute Performance architectures et modèles de programmation

de 1000 emplacements mémoires. Pour exploiter la localité spatiale il faut que la distance entre 2 références soit inférieure à la taille de la ligne du cache.

Objectifs Chapitre 7 : Les mémoires

La capacité( taille ) d’une mémoire est le nombre (quantité) d’informations qu’on peut enregistrer ( mémoriser ) dans cette mémoire La capacité peut s’exprimer en : Bit : un bit est l’élément de base pour la représentation de l’information Octet : 1 Octet = 8 bits

Calcul Haute Performance

architectures et modèles de programmationprogrammation

Françoise Roch

1 1

Observatoire

des Sciences de l

Univers de

Grenoble

Observatoire

des

Sciences

de lUnivers de

Grenoble

Mesocentre CIMENT

Un peu de connaissance des architectures est nécessaire

Des architectures

de plus en plus complexes avec différents niveaux de parallélismePremière étape de la paralllélisation :

décoder la relation entre l'architecture et l'applicationAdapter les algorithmes, la programmation aux architectures actuelles,

Comprendrele comportement d'un programme,

Choisirson architecture et son modèle de programmation en fonction de ses besoins Cell

Westmere-EX

Les ingrédients d'un supercalculateur

Processeur

fournit la puissance de calcul

CPU lti

étll tGPU l

CPU mu lti -core, ven t ue ll emen t GPU , ou proc p l us spécialisés

Mémoire/Stockage

Aujourd'hui très hierarchisé

caches, DRAM, SSD, HD, bandes)

Réseaux

Relient les noeuds entre eux

Souvent plusieurs types (MPI, Administration, I/O)

LogicielsLogicielsmiddleware pour l'accès au ressources distribuées MPI, gestion des processus, ...

L'équilibre entre les différents composants est primordial 3

Sommaire

1.Architecture des ordinateurs

L L es processeurs •La mémoire •Les réseaux •Les tendances d'évolution

2.Concepts du parallélisme

•Introduction •Terminologie et classification •Les différents modèles de programmation

3.Conclusion

Modèle de Von Neumann (1945)

La mémoire

:contientle La mémoire contient le programme (instructions) et les données. ié ih éi

Une Un

i t Ar i t h m t i que et Logique: UAL qui effectue les opérations. Une unité de contrôle : chargée du séquençage des opérationsopérations

Une unité d'Entrée/Sortie.

Un pocesseur en 2011

Mémoire

Système

d'Entrées/

Sorties

Bus interface

L3 Core1 L1 inst r Core2 Coren Core0 UAL UAL UAL UAL

Unité de commande

L1 data L 2 6

Caractéristiques d'un processeur

Jeux d'instructions qu'il peut exécuter :

Complexe : CISC(beaucoup d'instr. Complexes

prenant plusieurs cycles d'horloge). Ex: x86 Réduit : RISC(Moins d'instr. Mais n'utilisant quequelques cycles). Ex: PowerPC Nombre de transistors: plus il contient de transistors, plus il est capable d'exécuter d'instructions /seconde 7

Caractéristiques d'un processeur

Nombre de bits pouvant être traités en une instructionVit i l d l'h l tll ét Vit esse max i ma l e d e l'h or l oge augmen t e, p l us l e processeur ex cu t e d'instructions par seconde La fréquence d'horloge détermine la durée d'un cycle.

Chaque

opération utilise un certain nombre de cycles

Chaque

opération utilise un certain nombre de cycles

La fréquence d'horlogeest fonction de :

la technologie des semi-conducteurs, le packaging le packaging les circuits.

Les limites technolo

g i q ues : gq

La consommation électrique etla dissipation thermique d'un processeur sont fonction de sa fréquence d'horloge.

Le temps d'interconnexion ne suit pas la finesse de gravure.Le nb de cycles d'horloge pour interruptions, " cachemiss » ou mauvaise prédiction de branchement augmente.

Comment augmenterla performance des processeurs

Augmenter la fréquence d'horloge(limites

techniques solution coûteuse techniques solution coûteuse Permettre l'exécution simultanéede plusieurs instructions instructions Instruction Level Parallelism : pipelining, instruction superscalaire, architecture VLIW et EPIC.Thread Level Parallelism : multithreading et SMT.

Jeu d'instructions

Améliorer les accès mémoire: différents niveaux de cacheRecourir à un nombre élevé de coeurs de calcul 9

Les composants d'un processeur

1 CPU = plusieurs unités fonctionnelles qui peuvent travailler en parallèle :

une unité de gestion des bus (unité d'entrées-sorties) en interface avec la mémoire vive du système,une unité de commande (unité de contrôle)) qui lit les données arrivant, les décode et les envoie à l'unité d'exécution,

une unité d'exécution qui accomplit les tâches que lui a données l'unité d instruction, composée notamment de d instruction, composée notamment de

une ou plusieurs unités arithmétiques et logiques(ALU) qui assurent les fonctions basiques de calcul arithmétique et les opérations logiques.

une ou plusieurs unités de virgule flottante(FPU) : calculs sur les fl tt t I t ti dlldb lti li ti / dditi fl o tt an t s. I ns t ruc ti on d e ca l cu l d e b ase : mu lti p li ca ti on a dditi on.

La performance crête peut dépendre de la taille des registres et est fonction de la précision voulue (SPDP)de

la précision voulue (SP DP) Exemple : perf crête du processeur intel westmere-EP à 2.26GHz

Processeur à 6

cores

Processeur

6 cores chaque core a 2 unités FPU capables d 'exécuter 2 opérations 64 bits

6 * 2 * 2 * 2.26 = 54.24 Gflops crête en Double Précision

10 Les différentes étapes d'exécution d'une opération Une opération s'exécute en plusieurs étapes indépendantes par des éléments différents du processeur :

IF : Instruction Fecht

ID : Instruction Decode/Register Fecht

/ff dd

EX : Execution

E ff ective A dd ress

MA : Memory Access/ Cache Access

WB Write Back WB Write Back Sur un processeur sans pipeline les instructions sont exécutées les unes après les autres. 11 Exécution simultanée de plusieurs instructions : ILP (pipeling)

Instruction Level Parallelism

quotesdbs_dbs13.pdfusesText_19

[PDF] calcul ces

[PDF] calcul charge partielle

[PDF] calcul chemin optique

[PDF] calcul chiffre d'affaire potentiel zone de chalandise

[PDF] calcul coefficient binomial

[PDF] calcul commerciaux bac pro commerce

[PDF] calcul commerciaux cours

[PDF] calcul concentration en pourcentage

[PDF] calcul cote laval

[PDF] calcul cotisation cnas algerie

[PDF] calcul courbe de remous

[PDF] calcul derreur relative

[PDF] calcul d'incertitude absolue

[PDF] calcul dincertitude de mesure

[PDF] calcul d'incertitude relative

[PDF] Calcul Haute Performance architectures et modèles de programmation

Calcul Haute Performance

Françoise Roch

Observatoire

Univers de

Grenoble

Observatoire

Sciences

Grenoble

Mesocentre CIMENT

Des architectures

Comprendrele comportement d'un programme,

Westmere-EX

Les ingrédients d'un supercalculateur

Processeur

CPU lti

étll tGPU l

Mémoire/Stockage

Aujourd'hui très hierarchisé

Réseaux

Relient les noeuds entre eux

Sommaire

1.Architecture des ordinateurs

2.Concepts du parallélisme

3.Conclusion

Modèle de Von Neumann (1945)

La mémoire

Une Un

Une unité d'Entrée/Sortie.

Un pocesseur en 2011

Mémoire

Système

Sorties

Bus interface

Unité de commande

Caractéristiques d'un processeur

Jeux d'instructions qu'il peut exécuter :

Complexe : CISC(beaucoup d'instr. Complexes

Caractéristiques d'un processeur

Chaque

Chaque

La fréquence d'horlogeest fonction de :

Les limites technolo

Comment augmenterla performance des processeurs

Augmenter la fréquence d'horloge(limites

Jeu d'instructions

Les composants d'un processeur

1 CPU = plusieurs unités fonctionnelles qui peuvent travailler en parallèle :

Processeur à 6

Processeur

6 * 2 * 2 * 2.26 = 54.24 Gflops crête en Double Précision

IF : Instruction Fecht

ID : Instruction Decode/Register Fecht

EX : Execution

MA : Memory Access/ Cache Access

Instruction Level Parallelism