Prototypage rapide dapplications de traitement des images sur PDF

9 févr. 2011 la réduction du cycle de développement ... tomatique

Ordonnancement temps réel multiprocesseur de tâches non

1.7 Réduction de la consommation d'énergie et gestion de la mémoire . La réalisation de systèmes temps réel embarqués complexes que l'on trouve dans les ...

THÈSE SUR LOPTIMISATION DES SYSTÈMES DISTRIBUÉS

La modélisation de systèmes discrets est beaucoup moins facile à réaliser que la 3.7 – Réduction du cycle de développement d'un système temps réel.

Rapport V - Développement durable travail décent et emplois verts

du travail: Création d'emplois verts conséquences sur l'emploi procédé à la simulation d'un scénario illustratif de réduction des émissions au moyen.

Stéphane LECOMTE

modélisation. En fonction des besoins de chaque équipe qui intervienne tout au long du cycle de conception un modèle représente certaines caractéristiques

Simulation des systèmes cyber-physiques

d'architecture directement dans le cycle de développement séparément

Non classifié PAC/AFF/LMP(2002)1 Programme Travailleurs

26 juil. 2002 dans le cadre d'un travail de modélisation visant à établir avec plus ... taxes ou droits sur les combustibles fossiles et la réduction des ...

Trajectoires 2020-2050 vers une économie sobre en carbone

les auditions d'experts et les travaux de modélisation ont conduit à estimer le réaliser les potentiels de réduction identifiés dans chaque secteur.

Plan de programmation des emplois et des compétences

19 févr. 2019 Ainsi toute augmentation de la demande dans des secteurs intensifs en travail va provoquer une hausse des salaires et une diminution du coût du ...

Définition et gestion dune qualité de service pour les applications

De la modélisation à la réalisation : réduction du cycle de développement des applications temps réel distribuées. In Proceedings of the 8th conference on

>7G AB, i2H@yyEe9ERe ?iiTb,ffi?2b2bX?8HXb+B2M+2fi2H@yyEe9ERe am#KBii2/ QM N 62# kyRR >GBb KmHiB@/Bb+BTHBM`v QT2M ++2bb `+?Bp2 7Q` i?2 /2TQbBi M/ /Bbb2KBMiBQM Q7 b+B@

2MiB}+ `2b2`+? /Q+mK2Mib- r?2i?2` i?2v `2 Tm#@

HBb?2/ Q` MQiX h?2 /Q+mK2Mib Kv +QK2 7`QK

i2+?BM; M/ `2b2`+? BMbiBimiBQMb BM 6`M+2 Q` #`Q/- Q` 7`QK Tm#HB+ Q` T`Bpi2 `2b2`+? +2Mi2`bX /2biBMû2 m /ûT¬i 2i ¨ H /BzmbBQM /2 /Q+mK2Mib b+B2MiB}[m2b /2 MBp2m `2+?2`+?2- Tm#HBûb Qm MQM-

Tm#HB+b Qm T`BpûbX

BK8;2b bm` bvbi1K2b 2K>8`[mûb

hQ +Bi2 i?Bb p2`bBQM, #`[mûbX JQ/ûHBbiBQM 2i bBKmHiBQMX lMBp2`bBiû _2MM2b R- kyyNX i2H@yy8e98Re

UNIVERSITE DE RENNES 1

U.F.R. Structure et propriétés de la matière

Section CNU 61

(Génie Informatique, Automatique et Traitement du Signal)

Rapport de synthèse

présenté pour l'obtention de l'Habilitation à Diriger des Recherches par

Jean-François NEZAN

Titre du mémoire

Prototypage rapide d'applications de

traitement des images sur systèmes embarqués Soutenue le 25 novembre 2009 devant le jury composé de :

Lionel TORRES,

Bertrand GRANADO,

Dragomir MILOJEVIC,

Jean-Luc DEKEYSER,

Olivier SENTIEYS,

Olivier DEFORGES, Professeur à l'Université de Montpellier 2,

Professeur à l'ENSEA de Cergy-Pontoise,

Chargé de cours à l'Université Libre de Bruxelles, Professeur à Université des Sciences et Technologies de Lille, Professeur à l'Université de Rennes 1 (ENSSAT),

Professeur à l'INSA de Rennes, Rapporteur

Rapporteur

Président

Examinateur

Table des mati`eres

Table des mati`eresv

1 Introduction1

2 Probl´ematique5

2.1 Contexte technologique................................. 6

2.2 Les processeurs standards ................................ 8

2.2.1 Architecture interne............................... 8

2.2.2 Langages de programmation........................... 9

2.2.3 Utilisation de syst`emes d"exploitation..................... 9

2.2.4 OpenMP..................................... 11

2.3 Les processeurs graphiques . . ............................. 13

2.3.1 Architecture interne............................... 13

2.3.2 Langages de programmation........................... 14

2.4 Les processeurs de traitement du signal........................ 17

2.4.1 Architecture interne............................... 18

2.4.2 Programmation.................................. 21

2.5 Les syst`emes logiques.................................. 22

2.6 Conception de syst`emes................................. 23

2.6.1 Probl´ematique.................................. 23

2.6.2 MCSE/Cofluent . ................................ 24

2.6.3 SystemC/TLM.................................. 25

2.6.4 UML, langage de mod´elisation unifi´e...................... 26

2.6.5 Limitations.................................... 27

2.7 Conclusion et positionnement.............................. 28

2.7.1 Conclusion.................................... 28

2.7.2 Positionnement.................................. 30

iii

3Lam´ethodologie AAA 32

3.1 Mod`ele d"algorithme................................... 33

3.1.1 Terminologie................................... 34

3.1.2 Factorisation infinie............................... 34

3.1.3 Factorisation finie et r´ep´etitions d"op´erations................. 34

3.1.4 Conditionnement................................. 38

3.2 Mod`ele d"architecture.................................. 39

3.3 Transformations de graphes et ad´equation . ...................... 40

3.3.1 Transformations du graphe d"algorithme.................... 40

3.3.2 Ad´equation.................................... 40

3.3.3 Synchronisations entre s´equenceurs....................... 43

3.4 La g´en´eration de macro-code . . ............................ 45

3.4.1 Transformation du macro code......................... 46

3.4.2 Factorisation dans SynDEx........................... 46

3.5 Conclusion sur la m´ethodologie AAA.......................... 50

4 Travaux relatifs `a l"outil SynDEx 51

4.1 Mod´elisation d"applications............................... 51

4.1.1 Codage LAR................................... 52

4.1.2 D´ecodeur MPEG-4 Part2............................ 54

4.1.3 MPEG-4 AVC et SVC.............................. 57

4.1.4 Estimation de mouvement pour l"encodage vid´eo AVC/SVC......... 58

4.2 Optimisations du processus de g´en´eration de code.................. 60

4.2.1 Principe de fonctionnement . . ......................... 60

4.2.2 Organisation des noyaux d"ex´ecutifs en biblioth`eques............. 61

4.2.3 Minimisation de la m´emoire........................... 63

4.2.4 Utilisation de la m´emoire cache......................... 64

4.2.5 Utilisation d"un OS multitache ......................... 67

4.2.6 Conclusion sur la g´en´eration de code...................... 69

4.3 M´ethode de d´eveloppement............................... 70

4.3.1 V´erification fonctionnelle............................ 70

4.3.2 Portage et optimisation monoprocesseur.................... 72

4.3.3 Application distribu´ee temps r´eel........................ 73

4.4 Conclusions du chapitre................................. 74

5 Projet PREESM 76

5.1 Etude des mod`eles de sp´ecification........................... 77

5.1.1 Mod´elisation de l"application.......................... 77

5.1.2 Mod´elisation de l"architecture.......................... 81

5.2 Optimisations des algorithmes de placement/ordonnancement............ 83

5.2.1 Les nouvelles priorit´es de nuds........................ 84

5.2.2 Le fils critique . . ................................ 85

5.2.3 Le retard de communication........................... 85

5.2.4 R´esultats et perspectives............................. 86

5.3 Architecture logicielle de Preesm............................ 87

5.3.1 Graphiti : un ´editeur de graphe g´en´erique................... 89

5.3.2 SDF4J : une biblioth`eque Java pour les transformations de graphes flux de

donn´ees...................................... 90

5.3.3 Preesm : un processus de conception pour la conception de syst`emes logiciels

et mat´eriels.................................... 91

5.4 Conclusion et perspectives sur le projet Preesm.................... 92

6 Normalisation MPEG RVC 95

6.1 Pr´esentation du standard MPEG RVC......................... 96

6.1.1 Motivations.................................... 96

6.1.2 Cadre de d´eveloppement RVC.......................... 97

6.1.3 Le langage RVC-CAL.............................. 98

6.2 RVC dans un contexte multicur............................ 104

6.3 Synth`ese logicielle de r´eseaux d"acteurs CAL..................... 105

6.4 Implantation d"un d´ecodeur MPEG-4 Part2 sur plateforme multicur....... 108

6.5 Conclusion et perspectives sur le projet MPEG RVC . ................ 109

7 Conclusion et perspectives 111

8 Bibliographie114

Revues Internationales avec comit´edelecture..................... 114 Conf´erences Internationales avec comit´edelecture .................. 115 Conf´erences Internationales en tant qu"invit´e ..................... 117 Conf´erences Nationales avec comit´e de lecture . .................... 117 Contributions `a la normalisation MPEG........................ 118 Th`eses soutenues..................................... 118 Th`eses en cours...................................... 118 Liste des sites Internet.................................. 119 Bibliographie . . ..................................... 119

Chapitre 1

Introduction

Mes travaux s"inscrivent dans le contexte g´en´eral des m´ethodes et outils d"aide `a la concep-

tion des syst`emes embarqu´es, et plus particuli`erement dans le domaine des m´ethodes d´edi´ees `a

l"int´egration d"applications de traitement des images sur des architectures multiprocesseurs. Nous

qualifierons desyst`emes embarqu´esles syst`emes ´electroniques qui r´ealisent des fonctionna-

lit´es bien pr´ecises (une application de traitement des images par exemple) sous des contraintes

importantes (autonomie r´eduite, limitation des ressources mat´erielles, consommation ´electrique

restreinte). Ces syst`emes sont partout dans notre vie de tous les jours : t´el´ephones portables,

assistants personnels ou encore lecteurs mp3. Les principales difficult´es soulev´ees par la mise en

uvre de tels syst`emes concernent d"une part la complexit´e croissante des applications `a embar-

quer (il n"est pas rare qu"un t´el´ephone portable ait `aex´ecuter des applications qui n"ont plus

vraiment `avoiravecdelat´el´ephonie, comme de la photo ou de la vid´eo) et d"autre part les

exigences du march´e qui imposent des temps de d´eveloppement toujours r´eduits. Ces syst`emes

requi`erent ´egalement une puissance de calculs toujours plus importante et des contraintes d"em-

barquabilit´e toujours plus difficiles `a satisfaire. Dans de tels syst`emes, la limitation de la puissance

de calcul est souvent palli´ee par l"utilisation de circuits sp´ecifiques d´edi´es. Cependant, cette solu-

tion est difficilement compatible avec un temps de d´eveloppement court. De plus, elle est rendue

peu flexible de par l"impossibilit´e de reconfiguration du composant. Une alternative peut etre

apport´ee par l"utilisation de composants logiciels de type processeur, ou mat´eriels de type cir-

cuit logique programmable : ils ont en effet l"avantage d"etre programmables et le plus souvent reconfigurables. Un enjeu important pour la conception des syst`emes actuels, et notamment les

syst`emes embarqu´es, concerne alors la prise en compte du parall´elisme induit par ces architectures

mat´erielles. Ces architectures peuvent apporter une acc´el´eration importante des temps de calcul,

mais font apparaıtre de nouveaux probl`emes dans la d´efinition d"une implantation efficace de par

leurs aspects parall`eleseth´et´erog`enes.

Le parall´elisme est une caract´eristique importante des plateformes de calcul actuelles, et ce

depuis les processeurs multicurs jusqu"aux circuits logiques programmables. Pour parall´ eliser

des calculs, de nombreuses approches peuvent etre utilis´ees. Il est possible par exemple d"asso-

cier plusieurs calculateurs en r´eseaux, ou bien de d´evelopper des processeurs int´egrant plusieurs

unit´es de calcul, ou encore d"utiliser des architectures d´edi´ees de type logique programmable ou

enfin de construire des solutions sur mesure (ASIC). Dans le cadre logiciel (architecture `a base

de processeurs), le paradigme de programmation s´equentielle jusqu"`apr´esent utilis´e n"est plus

adapt´e dans le contexte des architectures parall`eles. Sp´ecifier un programme parall`ele n´ecessite

alors la d´efinition d"un mod`ele plus appropri´e. Dans le cadre mat´eriel (logique programmable),

2CHAPITRE 1. INTRODUCTION

l"utilisation de langages sp´ecifiques, comme les langages VHDL ou Verilog, apporte ´egalement des

limitations : les algorithmes doivent en effet etre compl`etement r´e´ecrits par des sp´ecialistes de la

logique programmable. Le programme est alors d´ecrit de mani`ere parall`ele, mais ne peut en aucun

cas etre utilis´e pour un processeur. Dans le cadre de la conception logicielle/mat´erielle conjointe

(appel´e co-design), aucun des langages actuels ne propose donc de solution appropri´ee. Nos travaux se situent dans le domaine du prototypage rapide. Ce domaine de recherche se

r´ef`ere `a des m´ethodologies permettant de passer d"une description d"entr´ee de l"application, `a

une implantation ex´ecutable [KL02] et peuvent ainsi fournir des solutions pour la conception mat´erielle/logicielle. Les objectifs du prototypage rapide sont : -lar´eduction du cycle de d´eveloppement, -las´ecurisation du d´eveloppement, - l"exploration des solutions mat´erielles.

Ces trois points expriment une meme demande, `a savoir un niveau d"abstraction le plus ´elev´e

possible pour les descriptions d"entr´ee des m´ethodes de prototypage rapide. Pour y r´epondre, nos

travaux de recherche se sont dirig´es vers la m´ethodologie AAA (Ad´equation Algorithme Architec-

ture) qui cherche la construction automatique et optimis´ee de programmes parall`eles `a partir de

repr´esentations de l"application et de l"architecture `a un haut niveau d"abstraction. Pour expo-

ser le parall´elisme potentiel d"une application, une description sous la forme d"un graphe flux de

donn´ees (dataflow programming) est utilis´ee. Le parall´elisme est ensuite exploit´e pour g´en´erer

automatiquement une implantation de l"application en utilisant le maximum de parall´elisme dis- ponible sur l"architecture cible. La m´ethodologie AAA vise ainsi `a trouver la meilleure mise en

correspondance appel´eead´equationentre le graphe qui mod´elise l"application et le graphe qui

mod´elise l"architecture multi-composants. Le programme parall`ele r´esultant est garanti sans in-

terblocage (deadlock) et l"ordre d"ex´ecution desop´erations(lesnuds du graphe,´egalement

appel´esacteurs ) ainsi que l"allocation de la m´emoire sont d´etermin´es `a la compilation. Avant de pouvoir ´etudier les performances des algorithmes de placement/ordonnancement au-

tomatique, il est donc n´ecessaire de r´ealiser la mod´elisation d"applications `a l"aide de mod`eles

flux de donn´ees. Le premier objectif de nos recherches est alors de mod´eliser des applications

complexes de traitement des images et ainsi mettre en ´evidence les caract´eristiques de ces diff´erents mod`eles pour le placement/ordonnancement automatique. Les applications de traite-

ment des images peuvent etre caract´eris´es comme des syst`emes r´eactifs, temps-r´eel, embarqu´es

et d´eterministes. Les syst`emesr´eactifsconstituent une classe de syst`emes informatiques qui ont

pour principale caract´eristique de r´eagir continuellement `a leurs environnements ext´erieurs. Ils

re¸coivent de celui-ci des flots d"informations sur leurs ports d"entr´ee, effectuent les traitements

requis, et produisent des flots d"informations sur leurs ports de sortie. Un syst`eme est qualifi´ede

temps-r´eellorsqu"il doit respecter certaines contraintes temporelles impos´ees par les fonctionna-

lit´es de l"application `a mettre en uvre. Un syst`eme temps r´eel doit satisfaire deux contraintes

importantes. La premi`ere, non restrictive aux syst`emes temps-r´eels, concerne l"exactitude logique

du r´esultat. La deuxi`eme contrainte, cette fois-ci propre aux syst`emes temps-r´eels, concerne l"exac-

titude temporelle. Le syst`eme doit etre capable de donner un r´esultat dans une limite de temps

impartie. Un syst`emeembarqu´eest un syst`eme informatique dans lequel le calculateur est en-

glob´e dans un syst`eme plus large, directement situ´e`a l"int´erieur meme de l"environnement qu"il

controle comme par exemple dans le cas d"un t´el´ephone mobile ou encore d"une fus´ee spatiale.

Le caract`ere embarqu´e d"une application induit de fortes contraintes qui peuvent etre li´ees `ala

limitation en puissance de calcul, `alam´emoire disponible limit´ee ou encore aux ressources r´eduites

en ´energie. Enfin, un syst` eme estd´eterministesi son comportement est pr´edictible d`es la phase 3 de conception. Cet aspect est particuli`erement important dans le sens o`u il permet de mettre en uvre des techniques de placement/ordonnancement optimis´ees d`es la phase de conception de l"application et particuli`erement dans la compilation. Si le domaine de l"analyse et la compression vid´eo correspond `a tous ces crit`eres, il en va de

meme pour le domaine de la communication num´erique. Nous avons ainsi ´etendu nos recherches

`a ce domaine, en particulier dans le cadre du projet r´egion PALMYRE ou dans le cadre de notre collaboration avec Texas Instruments.

Il existe ainsi un certain nombre de mod`eles flux de donn´ees dans la litt´erature. Certains sont

tr`es expressifs et bien adapt´es `a la description d"algorithmes. Cependant, leur analyse automatique

reste complexe, les rendant difficiles `a exploiter pour trouver des implantations multiprocesseurs

efficaces et sures. Certains autres mod`eles sont moins expressifs mais peuvent etre utilis´es dans

des algorithmes de placement/ordonnancement et pour des ex´ecutions sur des architectures mul-

ticurs. La phase de placement correspond `alas´election du processeur charg´edel"ex´ecution pour

chacune des parties d"un algorithme. L"ordonnancement consiste en la s´election sur un proces-

seur donn´e de l"ordre d"ex´ecution de chacune des parties de l"algorithme ayant ´et´e plac´ees sur ce

processeur. Les algorithmes de placement/ordonnancement sont NP-complets : une solution peut

etre v´erifi´ee exacte, mais la recherche de la solution optimale par le test de toutes les solutions

potentielles ne peut etre r´ealis´ee en un temps born´e. De ce fait, les algorithmes de placement/or-

donnancement consistent `a explorer un sous-ensemble des solutions et `a converger vers une solution optimis´ee en un temps born´e et raisonnable. Comme nous le verrons dans ce document, nous ´etions initialement des utilisateurs du logiciel SynDEx. Ce logiciel met en uvre un algorithme de placement/ordonnancement `a partir d"un

mod`ele flux de donn´ees sp´ecifique. Les b´en´efices et les lacunes de cette approche ont ´et´e mis en

´evidence dans mes travaux de th`ese (1999-2002) sur une ´etude des algorithmes de d´ecompression

Mpeg-4 Part2. D`es lors, nous avons travaill´e sur l"optimisation du code g´en´er´e par le logiciel

SynDEx (th`ese de Mickael Raulet) et sur les diff´erentes mani`eres de mod´eliser une application

(th`ese de Fabrice Urban). Face `a des besoins toujours plus importants, nous avons ´et´e amen´es

a modifier les mod`eles flux de donn´ees au cur meme du logiciel (th`ese de Ghislain Roquier).

Durant la p´eriode 2002-2007, les travaux ont essentiellement vis´e`aam´eliorer et appliquer `a des

applications complexes l"outil SynDEx, d´evelopp´e`a l"INRIA Rocquencourt dans l"´equipe AOSTE.

Depuis 2007, nous avons commenc´eled´eveloppement d"un nouvel outil de prototypage d´enomm´e Preesm (Parallel and Real-time Embedded Executives Scheduling Method). Une th`ese a

´et´e soutenue en 2009 par Pengcheng Mu, et d"autres sont en cours dans ce contexte (Maxime pelcat,

Jonathan Piat). Le but de cet outil libre est de proposer un environnement global de prototypage

permettant de confronter diff´erents mod`eles de repr´esentation d"applications flux de donn´ees, d"ar-

chitectures, pour diff´erentes techniques de placement/ordonnancement. La m´ethodologie peut etre

utilis´ee dans une phase de d´efinition de l"architecture cible (virtual prototyping) grace au place-

ment/ordonnancement automatique d"une application sur une architecture multi-composant. Une

fois l"architecture cible choisie, la g´en´eration de code r´ealise les synchronisations et les transferts

de donn´ees de mani`ere automatique tout en assurant `a l"utilisateur une implantation optimis´ee

de ces op´erations complexes. Il en r´esulte une m´ethode de conception unifi´ee:unmeme outil est

utilis´e tout au long de la conception. Tous ces ´el´ements concourent `a la diminution des temps

de d´eveloppement pour des syst`emes embarqu´es. Ce travail montre comment, `a l"heure actuelle,

est mise en place notre propre suite logicielle pour le prototypage rapide, et comment elle pourra

´evoluer pour r´epondre aux futurs d´efis susceptibles de se poser `a l"issue de ces recherches.

Parall`element, l"´equipe s"est ´egalement investie dans le comit´e de normalisation MPEG, et plus

4CHAPITRE 1. INTRODUCTION

particuli`erement dans le groupe MPEG RVC (Reconfigurable Video Coding). MPEG est un groupe de travail de l"ISO/CEI (Organisation Internationale de Normalisation/Commission Electrotech-

nique Internationale) charg´edud´eveloppement de normes internationales pour la compression, la

d´ecompression, le traitement et le codage des images anim´ees, de donn´ees audio et de leur combi-

naison. Les pr´ec´edents standards vid´eo MPEG ´etaient d´efinis sous forme de simples descriptions

textuelles, puis ces textes ont ´et´e associ´es `a des logiciels de r´ef´erence. Ces documents constituent

les bases pour la conception d"applications fond´ees sur ces technologies. De nombreuses limita-

tions apparaissent cependant dans cette m´ethode de conception et le groupe RVC doit d´efinir un

nouveau processus charg´e de les combler. Pour cela, RVC offre des m´ethodes de repr´esentation

haut niveau pour des applications de codage vid´eo devant faciliter `a la fois la description, la

r´eutilisation de fonctions de base, ou encore la g´en´eration automatique de code pour des cibles

mat´erielles et logicielles. Ces objectifs rejoignent parfaitement les ´etudes men´ees dans l"´equipe, et

nous permettent de contribuer sur les aspects descriptions des d´ecodeurs vid´eo et outils associ´es.

Le savoir-faire du laboratoire dans le cadre des standards de compression et de d´ecompression

vid´eo a ´et´e motiv´e notre implication au sein du groupe de travail MPEG RVC en 2007. De plus,

le formalisme choisi dans MPEG RVC pour mod´eliser des solutions de d´ecodage vid´eo et faisant

lui aussi appel `aunmod`ele flux de donn´ees, est proche de ceux que nous avons pu ´etudier depuis

1999. La mod´elisation d"applications sous la forme de graphes flux de donn´ees fait elle aussi partie

de notre savoir-faire depuis 1999. La vision `a plus long terme est l"utilisation de la norme RVC comme entr´ee dans le processus de prototypage rapide. Dans le cadre RVC, trois th`eses sont en cours au laboratoire IETR (Matthieu Wipliez et Nicolas Siret) dont une en collaboration avec l"INT (J´erome Gorin, encadr´e par Mickael Raulet pour l"IETR).

Suite `a cette introduction constituant le chapitre 1, le pr´esent rapport est constitu´e de sept

autres chapitres. Le chapitre 2 dresse une analyse pr´ecise de la situation actuelle en termes de pro-

grammation au sens g´en´eral du terme, et pr´ecise comment les approches flux de donn´ees peuvent

constituer une alternative pour la conception des futurs syst`emes embarqu´es. Le chapitre 3 d´etaille

les mod`eles utilis´es dans le contexte AAA (et l"outil SynDEx) dans lequel nos recherches se si- tuent. Puis dans le chapitre 4 sont pr´ esent´es les travaux men´es sur le logiciel SynDEx, travaux permettant d"utiliser ce logiciel de placement/ordonnancement pour la conception de syst`emes em-

barqu´es d´edi´es et optimis´es. Le chapitre 5 notre mise en place du logiciel Preesm zfin de d´epasser

les limitations observ´ees lors de l"utilisation du logiciel SynDEx. Nous pr´esenterons ensuite, dans

le chapitre 6, notre contribution `a la mise en uvre du nouveau standard MPEG RVC. La conclu- sion montrera dans le chapitre 7 comment ces travaux devront converger. Enfin, pour clore ce

document, le chapitre 8 r´ef´erence les diverses sources bibliographiques utilis´ees dans ce rapport

ainsi que la liste de mes publications.

Chapitre 2

Probl´ematique

Ce chapitre a pour but de pr´esenter le contexte de nos travaux. Notre objectif est de passer le

plus rapidement possible de la d´efinition d"une nouvelle technique de traitement des images `a une

implantation optimis´ee sur un syst`eme ´electronique embarqu´e. L"augmentation des r´esolutions des

images, ainsi que la n´ecessit´e de mettre en uvre des techniques de plus en plus complexes, im-

pliquent une utilisation optimis´ee des ressources disponibles (ressources en calculs et en m´emoire)

sur le syst`eme embarqu´e. Une telle optimisation n´ecessite g´en´eralement plusieurs mois de travail

pour une ´equipe de plusieurs ing´enieurs, ce temps comme la taille de l"´equipe ´etant tr`es variables

en fonction conjointement de la complexit´e de l"application, de l"exp´erience de l"´equipe dans le

domaine et du niveau de performance souhait´e pour le syst`eme final. Notre objectif est donc d"au-

tomatiser cette phase d"implantation afin d"en diminuer au maximum la complexit´eetdoncle temps n´ecessaire `asar´ealisation.

Ce chapitre pr´esente ainsi l"´etat de l"art des solutions li´ees `a la conception de syst`emes em-

barqu´es et met en ´evidence le besoin d"une m´ethodologie de conception appropri´ee, sur laquelle

s"appuient nos travaux. Pour cela, ce chapitre rappelle le contexte technologique de nos travaux, puis les solutions actuelles pour la programmation de composants : les processeurs standards, les processeurs graphiques (GPU), les processeurs de traitement du signal (DSP) et les syst`emes de

logique programmable (FPGA) seront abord´es. Serront pr´esent´ees ensuite les m´ethodes et outils

permettant de concevoir des syst`emes complexes constitu´es de plusieurs composants. Enfin, nous verrons comment nos travaux de recherche se positionnent dans ce contexte. 5

6CHAPITRE 2. PROBL´EMATIQUE

2.1 Contexte technologique

Pour saisir le contexte technologique, il est n´ecessaire d"appr´ehender quels sont les leviers tech-

nologiques qui permettent d"accroıtre la puissance de calcul dans un processeur. L"´el´ement de base

dans un processeur est la porte ´el´ementaire. Plusieurs transistors sont associ´es avec notamment

une capacit´e pour former cette porte ´el´ementaire. Sans entrer dans tous les d´etails, la puissance

consomm´ee par un processeur peut etre mod´elis´ee par l"´equation d´efinie dans [Mud01] par

P=A.C.V

2 .f+t.A.V.I cc f+V.I fuite ,(2.1) o`u:

- A : activit´e du processeur (nombre de portes ´el´ementaires modifi´ees lors d"un coup d"horloge),

- C : capacit´e des portes ´elementaires, - V : tension d"alimentation du processeur, -f:fr´equence de cadencement du processeur, - t : temps d"utilisation du processeur, -I cc : courant de court-circuit (lors du basculement d"une porte ´el´ementaire), -I fuite : courant de fuite (consommation du composant lorsque l"horloge est d´esactiv´ee). Le premier terme de l"´equation 2.1 est appel´elapuissance dynamiqueet d´epend directement de la fr´equence d"utilisationfet de la tension d"alimentation V du processeur. Le second terme est appel´epuissance statiqueet le dernierpuissance de fuite. Cette ´equation reste valable

pour toutes les technologies CMOS utilis´ees pour la fabrication des processeurs. Les technologies

CMOS sont actuellement encore les plus int´eressantes en termes d"int´egration. Tous les param`etres de cette ´equation ´evoluent cependant en fonction de la technologie CMOS utilis´ee. Ainsi, pour diminuer la consommation d"un processeur, il est possible de jouer sur la technologie des composants en am´eliorant notamment les param`etres C,I cc etI fuite , ou encore

de diminuer le nombre de portes ´el´ementaires et leurs transitions (param`etre A). Il est ´egalement

possible de faire varier la tension d"alimentation V. Ceci implique cependant des am´eliorations sur la technologie des composants car il est impossible de diminuer V sans diminuer la fr´equence maximale d"utilisation, les deux ´etant li´es selon l"´equation f max =(V-V threshold 2

V,(2.2)

o`uV threshold est la tension de seuil entre le niveau haut (un logique) et le niveau logique bas (z´ero logique). L"´equation 2.2 montre ainsi, que les deux param`etres f max et V influent sur la d´efinition des

tensions qui caract´erisent les niveaux bas et haut. Ces deux param`etres sont li´es car il faut pouvoir

passer d"un ´etat vers l"autre entre deux coups d"horloge (param`etre f max ) tout en concervant suffi- samment d"´ecart en tension pour distinguer les deux niveaux logiques (param`etre (V-V threshold Dans le domaine de l"embarqu´e qui nous int´eresse particuli`erement, la consommation maxi-

male est g´en´eralement fix´ee `a quelques Watts. La puissance consomm´ee par un processeur sera

transform´ee en chaleur, chaleur qu"il est n´ecessaire de dissiper afin de ne pas d´et´eriorer le compo-

sant. On utilise le plus souvent `a cet effet un dissipateur thermique car celui ci ne n´ecessite pas

d"alimentation contrairement `a un ventilateur qui consomme de l"´energie pour la dissipation.

Depuis les ann´ees 1970 et jusqu"en 2005 environ, laloi de Moorea souvent ´et´ev´erifi´ee.

2.1. CONTEXTE TECHNOLOGIQUE7

Cetteloiest en fait une pr´evision empirique selon laquelle les puissances de calcul pouvaient etre

doubl´ees tous les six mois. Depuis cette ´epoque, le principal levier utilis´ea´et´e de miniaturiser

la technologie CMOS. En plus de proposer des composants de plus en plus r´eduits en termes dequotesdbs_dbs23.pdfusesText_29

[PDF] Etude d 'un cycle frigorifique avec compresseur - Eduscol

[PDF] Machine frigorifique : corrigé

[PDF] Etude d un cycle frigorifique avec compresseur - Eduscol

[PDF] gymnastique au sol ? l 'école, dossier enseignants - Académie de

[PDF] Annexe - FICHE ELEMENTS - Niveau 2

[PDF] CYCLE 3 EPS COMPETENCES et ACTIVITE GYMNIQUE - Lyon

[PDF] Un cycle clé en main pour le cycle 3

[PDF] Situation d 'apprentissage : SA 3 S 'organiser pour faire progresser la

[PDF] Cycle de lutte entier

[PDF] Le cycle menstruel

[PDF] Les irrégularités du cycle en préménopause - RQASF

[PDF] orogènes et bassins - UFR STEP

[PDF] La synchronisation des cycles ovarien et utérin - Lyon

[PDF] Pour un cycle de préparation physique au collège - EPS Education

[PDF] Guide du candidat prépa final 2013 _1 - ecole superieure des

[PDF] Prototypage rapide dapplications de traitement des images sur

2MiB}+ `2b2`+? /Q+mK2Mib- r?2i?2` i?2v `2 Tm#@

HBb?2/ Q` MQiX h?2 /Q+mK2Mib Kv +QK2 7`QK

Tm#HB+b Qm T`BpûbX

BK8;2b bm` bvbi1K2b 2K>8`[mûb

UNIVERSITE DE RENNES 1

Section CNU 61

Rapport de synthèse

Jean-François NEZAN

Titre du mémoire

Prototypage rapide d'applications de

Lionel TORRES,

Bertrand GRANADO,

Dragomir MILOJEVIC,

Jean-Luc DEKEYSER,

Olivier SENTIEYS,

Professeur à l'ENSEA de Cergy-Pontoise,

Professeur à l'INSA de Rennes, Rapporteur

Rapporteur

Rapporteur

Président

Examinateur

Examinateur

Table des mati`eres

Table des mati`eresv

1 Introduction1

2 Probl´ematique5

2.1 Contexte technologique................................. 6

2.2 Les processeurs standards ................................ 8

2.2.1 Architecture interne............................... 8

2.2.2 Langages de programmation........................... 9

2.2.3 Utilisation de syst`emes d"exploitation..................... 9

2.2.4 OpenMP..................................... 11

2.3 Les processeurs graphiques . . ............................. 13

2.3.1 Architecture interne............................... 13

2.3.2 Langages de programmation........................... 14

2.4 Les processeurs de traitement du signal........................ 17

2.4.1 Architecture interne............................... 18

2.4.2 Programmation.................................. 21

2.5 Les syst`emes logiques.................................. 22

2.6 Conception de syst`emes................................. 23

2.6.1 Probl´ematique.................................. 23

2.6.2 MCSE/Cofluent . ................................ 24

2.6.3 SystemC/TLM.................................. 25

2.6.4 UML, langage de mod´elisation unifi´e...................... 26

2.6.5 Limitations.................................... 27

2.7 Conclusion et positionnement.............................. 28

2.7.1 Conclusion.................................... 28

2.7.2 Positionnement.................................. 30

3Lam´ethodologie AAA 32

3.1 Mod`ele d"algorithme................................... 33

3.1.1 Terminologie................................... 34

3.1.2 Factorisation infinie............................... 34

3.1.3 Factorisation finie et r´ep´etitions d"op´erations................. 34

3.1.4 Conditionnement................................. 38

3.2 Mod`ele d"architecture.................................. 39

3.3 Transformations de graphes et ad´equation . ...................... 40

3.3.1 Transformations du graphe d"algorithme.................... 40

3.3.2 Ad´equation.................................... 40

3.3.3 Synchronisations entre s´equenceurs....................... 43

3.4 La g´en´eration de macro-code . . ............................ 45

3.4.1 Transformation du macro code......................... 46

3.4.2 Factorisation dans SynDEx........................... 46

3.5 Conclusion sur la m´ethodologie AAA.......................... 50

4 Travaux relatifs `a l"outil SynDEx 51

4.1 Mod´elisation d"applications............................... 51

4.1.1 Codage LAR................................... 52

4.1.2 D´ecodeur MPEG-4 Part2............................ 54

4.1.3 MPEG-4 AVC et SVC.............................. 57

4.1.4 Estimation de mouvement pour l"encodage vid´eo AVC/SVC......... 58

4.2 Optimisations du processus de g´en´eration de code.................. 60

4.2.1 Principe de fonctionnement . . ......................... 60

4.2.2 Organisation des noyaux d"ex´ecutifs en biblioth`eques............. 61

4.2.3 Minimisation de la m´emoire........................... 63

4.2.4 Utilisation de la m´emoire cache......................... 64

4.2.5 Utilisation d"un OS multitache ......................... 67

4.2.6 Conclusion sur la g´en´eration de code...................... 69

4.3 M´ethode de d´eveloppement............................... 70

4.3.1 V´erification fonctionnelle............................ 70

4.3.2 Portage et optimisation monoprocesseur.................... 72

4.2.5 Utilisation d"un OS multitache ......................... 67

5.2.1 Les nouvelles priorit´es de nuds........................ 84

6.2 RVC dans un contexte multicur............................ 104

6.4 Implantation d"un d´ecodeur MPEG-4 Part2 sur plateforme multicur....... 108