Comment fonctionne la vision par ordinateur ? Les systèmes de vision par ordinateur utilisent la technologie de l'intelligence artificielle (IA) pour imiter les capacités du cerveau humain qui sont responsables de la reconnaissance et de la classification des objets.
L'objectif principal est de détecter ou de reconnaître un objet dans une image.
D'autre part, la vision par ordinateur vise à analyser, identifier ou reconnaître des modèles ou des objets dans les médias numériques, y compris les images et les vidéos.
La vision par ordinateur est un domaine de l'intelligence artificielle (IA) qui permet aux ordinateurs et aux systèmes de dériver des informations significatives à partir d'images numériques, de vidéos et d'autres entrées visuelles, et de prendre des mesures ou de faire des recommandations sur la base de ces
VisionIntroductionVisionparordinateurEdmond.Boyer@imag.frEdmondBoyerM2IICAO-UFRIMA1VisionIntroduction1GénéralitésVisionparordinateur(ComputerVision):utiliserunordinateurpourinter-préterlemondeextérieurautraversd'images.Images!ObjetsTraitement-Analysed'images(ImageProcessing).Reconnaissancedesformes(PatternRecognition).Visionparordinateur(ComputerVision).Réalitéaugmentée,mixte.Synthèsed'images(ComputerGraphics):utilisationd'unordinateurpourgénérerdesimages.Objets!Images+Unregroupementdesdeuxdomainess'opèresurcertainsproblèmescom-muns:Visualisationdemodèles.Constructiondemodèles.Réalitéaugmentée.Synthèsed'imagesàpartird'images.Objectifdumodule:Présenterdifférentsconceptsettechniquesassociésàcedomaineetlesillustrerautraversd'applicationspratiques(!programmation).EdmondBoyerM2IICAO-UFRIMA2VisionIntroduction2PrincipeEntréeProgrammeSystème d'acquisitionDecisionModèle(cameras numeriques)Lesdifférentesphasesdel'analysed'uneimage:1.Acquisition2.Traitementdebasniveaux:ltrageetextractiond'indices.3.Traitementdehautniveaux:reconnaissancedesformes,reconstruction,calculsdepositions,calculsdemouvements.Lesélémentsimpliqués:1.desprimitivesimages:pixels,pointsd'intérêts,segments,contours.2.descaractéristiquesphoto-métriques:niveauxdegris,decouleurs.3.descaractéristiquesgéométriques:caméras,mouvements.4.descaractéristiquesstatistiques.EdmondBoyerM2IICAO-UFRIMA3VisionIntroduction3Lesniveauxdecomplexitédel'analysed'imagesLeniveaudecomplexitédel'analysed'uneimagedependdedifférentsparamètresdont:lesprimitivesprisesencompte,ledegrédelamodélisationrecherchéainsiquelagéométriequidoitêtredéterminée.Lesguressuivantesillustrentplusieursdecesniveaux.Figure1:Niveau1:améliorerlescaractéristiquesd'uneimage.Lesprimitivessonticilespixelsdontlesvaleurssontmodiéesparltrage.EdmondBoyerM2IICAO-UFRIMA4VisionIntroductionFigure2:Niveau2:extrairedescaractéristiques,lesprimitivessonticidescon-toursetdespointsd'intérêts.NécessiteFigure3:Niveau2:extrairelefonddel'avantplan.Nécessiteunmodèle(statis-tiqueparex.)pourlespixelsdufond.EdmondBoyerM2IICAO-UFRIMA5VisionIntroductionFigure4:Niveau3:suivredesprimitives(tracking).Figure5:Niveau4:incrusterdesobjets(réalitéaugmentée).Nécessitelescarac-téristiquesgéométriquesdelacaméra.(occultations )EdmondBoyerM2IICAO-UFRIMA6VisionIntroductionFigure6:Niveau4:enleverdesobjets(réalitédiminuée).Figure7:Niveau5:stéréovision.Nécessitelagéométriededeuxcamérasetdestechniquesdemiseencorrrespondance.EdmondBoyerM2IICAO-UFRIMA7VisionIntroductionFigure8:Niveau6:acquisitiondemodèles(tempsréel).EdmondBoyerM2IICAO-UFRIMA8VisionIntroduction4Brefhistorique1492Projectionperspectiveetcentrale(LeonarddeVinci).17-18èGéométrieprojective(Desargues,Pascal,Monge).19èGéométrieprojectivepremiertraité(Poncelet).1839Premièrephotographie(Daguerre),Daguerreotype:plaquephotosensible(argentique)encuivre(imagepositive).1849Iconométrie(Lausedat,lePèredelaphotogrammétrie):premièreutilisa-tiondephotospourlaréalisationdecartestopographiques.1850-1900Techniquesgéométriquesétendueàlaphoto(photogrammétrie).1900-1950Utilisationdesimagesaériennesassociéesàdessystèmesmécaniquespoureffectuerdesmesures(photogrammétrie).>1950Laphotogrammétrieutilisel'ordinateuretnonplusdessystèmesmécaniques.1969PremiercapteurCCD(Bell).1970Calibrationdecaméraàl'aidedepointsderéférencespardesméthodesnumériques.1970-1980Développementdelavisionarticielle,techniquesd'améliorationd'images.1980-1990Extractiondeprimitives(contours,pointsd'intérêts),caractéristiquesdif-férentielles.Visionactive.Applicationsindustrielles(vidéo-contrôle).1990-2000Géométriedeplusieurscaméras(imagerienon-métriques).Applicationsmédicales.Apparitiondelaréalitéaugmentée,mixte.Systèmesd'indexationetderecherched'images.2000-Méthodestempsréel,virtualisation.Développementsdesapprochesstatis-tiques.EdmondBoyerM2IICAO-UFRIMA9VisionIntroduction5Matériel5.
1) CamérasTV(tubevidicon)L'imageestfocaliséesuruneciblephotoconductrice.Lacibleestbalayéeparunfaisceaud'electrons,produisantuncourantélectriqueproportionnelàl'intensitédelalumièreenchaquepoint.signalvideoensortie,inconvénients:persistanceentredeuxprises,résolutionlimitée,ciblenonplate.Figure9:Schémad'unecaméravidicon(http://micro.magnet.fsu.edu/primer/digitalimaging/digitalimagingdetectors.html)5.
2) CamérasCCDCharged-coupleddevices:unematricedecellulesphotosensibles,chaquecel-luleaccumuledeschargesenfonctiondelalumièreincidentequ'ellereçoit.Leschargessontensuitetransportéesparcolonnessurlecapteur.objectifcapteur CCDEdmondBoyerM2IICAO-UFRIMA10VisionIntroductionmoinsdedistorsiongéométriquesignalvidéopluslinéaireparrapportàl'intensitélumineuse.résolutionimportante,camérasnumériqueslesmeilleuresactuellement.trèspopulaire.Figure10:Photod'uncapteurCCD5Mpixels(Kodak)Captured'imagescouleursPlacerunltredevantlecapteureteffectuertroisacquisitionssuccessives(lent).UtilisertroisCCDs(cher).UtiliserdeuxCCDs,unpourlachrominanceavecunltreetunautrepourlaluminance.DecodageBayer:EdmondBoyerM2IICAO-UFRIMA11VisionIntroductionFigure11:Lesystèmetri-CCDFigure12:LamosaïqueBayer5.
3) CamérasCMOSLeprincipeestlemêmequepourlescapteursCCD.Ils'agitd'unematricedecellulesphotosensibles.Ladifférenceprincipaleestquechaquecellulepeutêtreadresséeindividuellement,etl'informationtransmiseestlaquantitédelumièreinstantanéeetnonaccumulée.MêmesilescapteursCCDdominentencorelemarchédelaphotonumériquedequalité,ilyademoinsenmoinsdedifférenceentrelescapteursCCDetCMOSquecesoitentermesdequalited'imagesoudecoutdefabrication.EdmondBoyerM2IICAO-UFRIMA12VisionIntroduction6Formatsdechiersd'imagesUneimageestuntableaudepixels:Ncols - 1Nligs - 100Uneimageeststockéesoitdansunchiersouslaformedetexte,soitdanslamémoiredel'ordinateursouslaformed'unvecteur:210 1ère ligne(Ncols-1) (Nligs-1)*Ncols-1valeurdu pixel 0Lesopérationsdebasesconcernantuneimagesontlalecture(chier!mé-moire)etl'écriture(mémoire!chier).Lesinformationsnécessairesàlama-nipulationd'uneimagesont:nombredelignes,nombredecolonnes,formatdespixels(bit,niveauxdegris,niveauxdecouleurs),compressionéventuelle.Ilexisteunemultitudedeformatsdechierspermettantdestockercesinfor-mationsainsiqueletableaudesvaleurs.Enparticulier:Lesformatssimples:chierstextescomportantunentêtecontenantlesdi-mensionsdel'imageetleformatdespixels.Exemples,lesformatsPNM(portableEdmondBoyerM2IICAO-UFRIMA13VisionIntroductionanymap):PBM(portablebitmap),PGM(protablegrayscalemap),PPM(portablepixmap).Leschierscorrespondantssontconstituésdesélémentssuivants:1.Un"nombremagique"pouridentierlestypeduchier:P1ouP4pourPBM,P2ouP5pourPGMetP3ouP6pourPPM.2.Uncaractèred'espacement(blanc,TABs,CRs,LFs).3.Lalargeurdel'image(valeurdécimale,codéeenASCII)suivied'uncarac-tèred'espacement,lalongueurdel'image(valeurdécimale,ASCII)suivied'uncaractèred'espacement.4.UniquementpourPGMetPPM:l'intensitémaximum(valeurdécimalecompriseentre0et255,codéeenASCII)suivied'uncaractèred'espacement.5.Largeurhauteurnombres.CesnombressontsoitdesvaleursdécimalescodéesenASCIIetséparéespardesespacementsdanslecasdesformatsP1,P2,P3,soitdirectementlesvaleursbinairessur1ou2octetsdanslecasdesformatsP4,P5,P6.Danscederniercas,iln'ypasdecaractèresd'espacemententrelesvale