[PDF] Les bases mathématiques du perceptron





Previous PDF Next PDF



Fondamentaux des mathématiques 1

L'objectif de ce cours est de faire une transition entre les connaissances en analyse et algèbre accumulées au lycée et les bases qui formeront un des 



TECHNIQUES MATHÉMATIQUES DE BASE

Est-il nécessaire de réfléchir à ses méthodes de travail pour valider l'enseignement « TECHNIQUES MATHÉMATIQUES DE BASE » ? Bases. S'il existe n vecteurs 1. 2.



Quelques notions mathématiques de base

Quelques notions mathématiques de base. Christophe Chesneau https://chesneau.users.lmno.cnrs.fr/. Caen le 28 Septembre 2017. Page 2. Page 3. Table des matières.



MATHÉMATIQUES DE BASE (MIS 101 cours 2007-2008)

MATHÉMATIQUES DE BASE (MIS 101 cours 2007-2008). Alain Yger. 30 mai 2012. Page 2. Page 3. Table des matières. 1 Bases de logique et théorie des ensembles.



[PDF] Algèbre - Exo7 - Cours de mathématiques

La première partie débute par la logique et les ensembles qui sont des fondamentaux en mathématiques. Ensuite vous étudierez des ensembles particuliers : les 



Bases de mathematiques pour la geologie et la geographie. Cours

19 janv. 2016 Cet ouvrage est un manuel de cours et d'exercices corrigés permettant d'acquérir et de consolider les bases de mathématiques nécessaires à la ...



MATHÉMATIQUES de base

MATHÉMATIQUES de base. Enseignement secondaire ordinaire. Humanités générales Il doit notamment comparer les graphiques des fonctions exponentielles et ...



Les bases mathématiques du perceptron

12 févr. 2022 Le ≪ perceptron ≫ est un concept introduit `a la fin des années 1950 par Frank Rosenblatt comme un ≪ syst`eme nerveux hypothétique ≫ ...



LALGÈBRE LINÉAIRE POUR TOUS

Rappelons que l'on n'apprend des mathéma- tiques qu'en faisant des exercices c'est-à-dire en triturant les objets mathématiques dans notre cerveau pour bien en 



Chapitre IV Bases et dimension dun espace vectoriel

vecteurs ne sont pas colinéaires ils forment une famille libre et génératrice de



Fondamentaux des mathématiques 1

L'objectif de ce cours est de faire une transition entre les connaissances en analyse et algèbre accumulées au lycée et les bases qui formeront un des 



MATHÉMATIQUES DE BASE (MIS 101 cours 2007-2008)

30 mai 2012 1 Bases de logique et théorie des ensembles ... les transformations physiques (comme la transformation de Fourier incarnation mathématique.



TECHNIQUES MATHÉMATIQUES DE BASE

TECHNIQUES MATHÉMATIQUES. DE BASE. COURS ET EXERCICES. Semestre de printemps 2015. THIERRY FACK. PROFESSEUR DE MATHÉMATIQUES À LYON 1 



Apprentissages mathématiques de base : Nombres numération

mathématiques de base : Nombres numération



Quelques notions mathématiques de base

Soient A et B deux ensembles. L'égalité de A et B se note A = B (prononcer "A égal B"). Elle est caractérisée par l'équivalence : A = B si et seulement si



MAÎTRISER LES BASES DES MATHÉMATIQUES

Utilisation de l'outil Internet. Travail en individuel et en sous-groupes



Bases mathématiques pour les sciences BMS

Il faut pour cela bien expliciter le langage mathématique de la logique Ce cours correspond à l'enseignement dispensé dans l'UE Bases de Mathématiques ...



Les bases mathématiques du perceptron

Les bases mathématiques du perceptron. Sylvie Benzoni-Gavage. 12 février 2022. 1 Introduction. Le ? perceptron ? est un concept introduit `a la fin des 



Mathématiques financières COURS

Dans ce cours nous nous contenterons d'explorer les bases des mathématiques financières qui peuvent être qualifiées de "calculs bancaires"



Chapitre IV Bases et dimension dun espace vectoriel

Définition de base. Une famille ? de est une base de si et seulement si ? est libre et génératrice de . 2. Bases et coordonnées.

Les bases mathematiques du perceptron

Sylvie Benzoni-Gavage

12 fevrier 2022

1 Introduction

Le perceptronest un concept introduit a la n des annees 1950 par Frank Rosenblatt comme un systeme nerveux hypothetique, inspire de ce que l'on savait a l'epoque de la maniere dont le cerveau humain percoit le monde exterieur [5]. Ce concept avait ete mis en application dans une machine electronique concue pour la reconnaissance d'images (bien avant l'avenement de l'imagerie numerique!). M^eme si le

Mark 1 perceptronn'a pas

tenu toutes ses promesses [3], il a en quelque sorte signe la naissance de ce que l'on appelle l'intelligence articielle(IA). De fait le perceptron se trouve encore aujourd'hui a la base desalgorithmes d'apprentissage utilises en IA. Plus precisement, il s'agit declassier des donnees1selon unevaleur booleenne: par exemple vrai ou faux, oui ou non, positif ou negatif, blanc ou noir, ... cela n'a pas d'importance pourvu qu'il n'y ait que deux valeurs possibles

2. C'est ainsi que nalement une

IA apprenda reconna^tre si une image represente un chat ou pas, si un resultat d'analyse medicale indique que le patient est malade ou pas, etc. On entend beaucoup parler dedonnees, dans toutes sortes de domaines. L'important pour le traitement informatique des donnees est qu'elles soient representees par desvaleurs numeriques. Plus precisement, chaque donnee peut ^etre representee par plusieurs valeurs numeriques, et le type de valeurs numeriques doit ^etre le m^eme pour tout lejeu de donnees considere. Si l'on considere par exemple des donnees sous forme d'images numeriques en couleur, de taille xe en nombre de pixels, chaque donnee peut ^etre constituee des niveaux de rouge, de vert et de bleu sur chaque pixel. S'il y anpixels, une donnee est alors representee par 3nvaleurs numeriques. Autrement dit, dans cet exemple les donnees se trouvent dans un espace de dimension 3n. Classierdes donnees revient a les separer en deux groupes, c'est-a-dire a aecter une valeur booleenne a chacune d'entre elles. Sur l'exemple des images, une intelligence humaine est en principe capable de dire pour chaque image si elle represente un chat ou non. Alors la

valeur booleenne sera oui dans le premier cas et non dans le second.1. Il serait peut-^etre plus correct de dire

classer. On dit aussietiqueterdes donnees.

2. On parlera plus loin dedichotomie.

1 Unalgorithme d'apprentissage supervisea pour objet de classier correctement un jeu de donnees par rapport aux valeurs booleennes connues, pour ensuite determiner la va- leur booleenne de nouvelles donnees. Toujours sur l'exemple des images, l'algorithme s'en- tra^ne sur un jeu d'images connues puis ilreconna^tsi une nouvelle image represente un chat ou non. L'idee qui sous-tend le perceptron (du moins dans la presentation que nous en faisons ici, de fait assez eloignee de celle de Rosenblatt) est de separer les jeux de donnees d'entra^nement de maniere geometrique. Pour xer les idees, si les valeurs booleennes de ces donnees sont les signes + et, l'idee est de separer les donnees aectees du signe + de celles avec le signepar une frontiere geometrique la plus simple possible dans l'espace ou elles se trouvent. Comme indique precedemment, il s'agit par exemple d'un espace de dimension 3npour des images en couleur anpixels. M^eme si l'on ne voit guere a priori comment separer geometriquement les images de chat des images de non-chat, la separation geometrique des donnees est une idee simple et feconde, a la base des techniques d'IA, dont on detaille quelques aspects dans ce qui suit. La partie 2 est consacree d'une part a l'etude des conditions dans lesquelles un jeu de donnees peut ^etre separe geometriquement par une frontiere simple, a commencer par une frontiere plane, et d'autre part a la combinatoire associee. On y explique notamment le fait qu'un espace de dimensionda une certainecapacitea accueillir des donnees separables. Cette capacite est un seuil critique du nombreNde donnees separables dont on montre qu'il est de l'ordre de 2dlorsqueNest grand. C'est peut-^etre le resultat le plus marquant dans l'article fondateur [2] du theoricien de l'information Thomas Cover. La partie 3 decrit et demontre un autre resultat de Cover : la convergence de l'algorithme d'apprentissage appele perceptron learning algorithm(PLA), qui permet de determiner la frontiere separant des donnees connues pour ^etre separables. C'est ce genre d'algorithme qui permet a une IA de reconna^trela valeur booleenne d'une nouvelle donnee : il sut en eet de determiner de quel c^ote de la frontiere elle se situe. Si les algorithmes d'aujourd'hui sont plus compliques et de plus en plus sophistiques, les bases mathematiques du perceptron sont accessibles a des etudiant·es de licence. L'objectif de cette note est d'en donner une presentation adaptee a des etudiant·es de mathematiques.

La lectrice et le lecteur interesse·es seront alors arme·es pour aborder des presentations plus

technologiques et/ou des developpements plus recents en matiere d'intelligence articielle (reseaux de neurones, apprentissage profond...).

2 Classication de donnees

Mathematiquement parlant, unjeu de donneesest un ensemble ni de points dans un espace de dimension nie. Par exemple cet ensemble peut ^etre constitue d'un certain nombre de donnees quantitatives concernant une population donnee : chaque point correspond alors a un individu de cette population et pour chacun d'entre eux on considere par exemple l'^age, la taille, le poids (la masse), la valeur de son compte en banque. Sur cet exemple legerement provocateur, la dimension de l'espace est 4 (car il y a quatre valeurs par individu), et l'on 2 voit que les donnees sont de nature bien dierente puisqu'elles se mesurent dans des unites dierentes (respectivement en annees, centimetres, kilogrammes et euros, par exemple). D'un point de vue pratique les donnees sont en general dans un espace ane, au sens ou une valeur nulle de l'une de ces donnees n'a pas forcement un sens intrinseque : penser par exemple a des temperatures en degres Celsius ou Fahrenheit, unites de mesure liees par une relation ane. Cependant on ne perdra pas de generalite a considerer des jeux de donnees dans un espace vectoriel, qu'on identiera simplement aRds'il est de dimensiond. Chaque donnee est alors un vecteur deRd(dans l'exemple donne au debut de cette partie, c'est un vecteur dont les composantes sont l'^age, la taille, la masse et la fortune de l'individu), mais on parlera souvent encore de point par abus de langage. Dans ce contexte, un jeu deN donnees est un sous-ensemble niX=fx1;;xNgde points deRd. Pour des raisons diverses on s'interesse aclassierles donnees. Cela signie que l'on considere une valeur booleenne supposement attachee a chaque donnee. Si l'on poursuit sur notre exemple, cette valeur booleenne peut ^etre le fait d'^etre citadin ou non (a condition de denir precisement ce que cela signie), ce que l'on peut representer par un signe + ou(un individu citadin est aecte du signe + et un non citadin du signe, ce choix etant parfaitement arbitraire). Du point de vue mathematique, un jeu de donneesX= fx1;;xNgest classie si l'on peut associer a chaqueelementxiun signe + ou. Autrement dit, la classication d'un jeu de donneesXRdest determinee par une application deX dans l'ensemble a deux elementsf;+g. Une telle application s'appelle alors unedichotomie deX. Le denombrement des dichotomies releve d'un calcul rapide : pour chaquexideux choix de signe sont possibles, et les choix sont independants les uns des autres. Au nal (quitte a s'en convaincre par une recurrence immediate surN), on obtient que le nombre de dichotomies d'un jeu deNdonnees est 2N. Ce nombre est independant de la dimension de l'espace dans lequel se trouvent ces donnees. SiNest grand, le nombre de dichotomies est colossal. On conna^t l'histoire de l'echiquier de Sissa, qui montra aux depens de son roi que 2

64grains de riz depassaient tres largement

toute la production du royaume (la valeur precise etant 2

64= 18 446 744 073 709 551 616).

OrN= 64 est un nombre tres modeste au regard des enjeux actuels de traitement de donnees. Les donnees recueillies actuellement par les geants du numerique se comptent par milliards. Pour un jeu d'un milliard de donnees par exemple, le nombre de dichotomies est 2

109>(103)106= (10100)300 000(ungogola la puissance trois cent mille!).

2.1 Dichotomies lineairement separables

L'idee de base du perceptron est de s'interesser a des dichotomies particulieres de jeux de donnees, pour lesquelles les donnees aectees du signeet celles aectees du signe + se separent facilement en deux camps. Comme sur un terrain de foot avant le coup de siet sonnant le debut du match, on peut imaginer des dichotomies pour lesquelles les points et + sont separes par une ligne en dimension deux, et plus generalement un hyperplan en dimension quelconque. On peut aussi imaginer la separation des donnees par une ligne courbe et plus generalement 3 par une hypersurface, ce qui est m^eme plus naturel pour des donnees de nature dierente (comme dans notre exemple avec des ^ages, des tailles, des masses et des sommes d'argent), mais restons pour le moment sur les separations lineaires. Denition 1.Une dichotomief:X! f;+gd'un jeu de donneesXRdest dite lineairement separablesi les ensemblesX:=f1()etX+:=f1(+)sont separes par un hyperplan, c'est-a-dire s'il existew2Rdtel que X fx2Rd;wx<0getX+ fx2Rd;wx>0g; ou le pointdesigne le produit scalaire usuel deRd. Remarque 1.On pourrait egalement considerer des dichotomies separables par unhyperplan ane, d'equationwx=bavecbnon nul.3Cependant, cela ne modierait pas la theorie, quitte a augmenter la dimension de l'espace. En eet, il surait de considerer les donnees f(1;x1);;(1;xN)gdansRd+1, que l'on chercherait a separer par un hyperplan(b;w)?. Une caracterisation des dichotomies lineairement separables peut s'exprimer a l'aide de la notion d'enveloppe convexe. Rappelons qu'unconvexedeRdest un sous-ensembleCtel que pour tout couple (x;y) d'elements deCle segment [x;y] :=fz=x+ (1)y;2[0;1]g d'extremitesxetyest inclus dansC. L'enveloppe convexeconv(Y) d'un sous-ensemble YdeRdest le plus petit convexe contenantY. Elle est caracterisee par le theoreme de

Caratheodory, qui montre que

conv(Y) =( z2Rd;9(yj)2Yd+1;9(j)2[0;1]d+1;z=d+1X j=1 jyj;1 =d+1X j=1 j) Theoreme 1.Soitfune dichotomie d'un jeu de donneesXdeRd. Elle est lineairement separable si et seulement si les enveloppes convexes deX=f1()etX+=f1(+)sont disjointes. Demonstration.Supposons qu'il existex2conv(X)\conv(X+). D'apres le theoreme de

Caratheodory il existe alors (x

j)2Xd+1et ( j)2[0;1]d+1tels que x=d+1X j=1 jx j=d+1X j=1 jx+ j;1 =d+1X j=1 j: Sifetait lineairement separable il existeraitw2Rdtel pour toutj,wx j<0 etwx+ j>0, ce qui entra^nerait a la foiswx<0 (car au moins l'un des jest strictement positif) et wx>0 (car au moins l'un des+ jest strictement positif). Par suite, sifest lineairement separable on a necessairement conv(X)\conv(X+) =;. Reciproquement, si conv(X)\conv(X+) =;, le theoreme de Hahn-Banach assure que conv(X) et conv(X+) sont strictement separables par un hyperplan, donc a fortioriXet X

+aussi, ce qui signie que la dichotomiefest lineairement separable.3. C'est d'ailleurs souvent le cas en science des donnees, oubs'appelle unbiais, ou encore unseuil.

4 On cherche maintenant et surtout a denombrer les dichotomies lineairement separables d'un jeu de donnees xe. Ceci revient a compter le nombre d'elements def;+gNobtenus comme unN-uplet (f(x1);:::;f(xN)) oufest une dichotomie lineairement separable du jeu de donneesX=fx1;;xNg Rd. NotonsC(N;d) ce nombre, qui depend a priori deX. On remarque tout d'abord que le decompte, c'est-a-dire le calcul deC(N;d), risque d'^etre tres complique si les vecteursxisonttrop liesentre eux. Imaginons par exemple que deux d'entre eux soient colineaires et de m^eme sens. Il n'y a alors pas de dichotomie lineairement separable qui aecte des signes opposes a ces deux elements deX. An de pas avoir a tenir compte de tous les cas particuliers possibles, on fera toujours l'hypothese que le jeu de donnees est en position generaleselon la denition suivante. Denition 2.Un jeu de donneesXdansRdest diten position generalesi toute famille d'au plusdelements deXest libre. On va voir queC(N;d) ne depend pas deXlorsqueXest en position generale. On se convainc sans trop de mal queC(N;d) est strictement inferieur a 2den general. Considerons par exemple le casd= 2 etN= 3. Alors les trois vecteursx1,x2,x3sont lies, et d'apres l'hypothese qu'ils sont en position generale, deux quelconques d'entre eux sont independants. On peut donc supposer sans perte de generalite (quitte a permuter les indices) quex2s'ecrit x

2=a1x1+a3x3

aveca1a36= 0. On peut alors toujours mettre en evidence deux dichotomies (sur les 23= 8 dichotomies possibles) qui ne sont pas lineairement separables. Car on est forcement dans l'un des trois cas suivants, pour n'importe quel vecteurwnon nul. Si a1a3>0, on ne peut pas avoir (wx1;wx2;wx3) = (;+;) ni (;+;). Si a1<0< a3, on ne peut pas avoir (wx1;wx2;wx3) = (;;+) ni (+;+;). Si a3<0< a1, on ne peut pas avoir (wx1;wx2;wx3) = (;+;+) ni (+;;). Theoreme 2(Cover [2]).Le nombreC(N;d)de dichotomies lineairement separables d'un jeu deNdonnees en position generale dansRdest donne par

C(N;d) = 2d1X

k=0 N1 k ;(1) ou N1 k =(N1)!k!(N1k)!sik6N1;0sinon: Remarque 2.La formule(1)montre en particulier que pour toutd>N, le nombreC(N;d) est maximal et egal a2N, car dans ce cas

C(N;d) = 2N1X

k=0 N1 k = 2(1 + 1) N1 par la formule du bin^ome. 5 La demonstration du theoreme 2 pourra se faire par recurrence surNlorsque nous aurons montre la formule

C(N+ 1;d) =C(N;d) +C(N;d1):(2)

Notons que celle-ci est exactement la m^eme que pour les coecients du bin^ome C dN=N d qui verient en eet N+ 1 d =N d +N d1 :(3) Seule l'initialisation change, ce qui montre a quel point (pour qui ne serait pas familier du raisonnement par recurrence) cette etape est importante! Ici l'initialisation demarre a N= 1 (on ne considere pas une absence de donnees comme un cas interessant). Quel que soitd>1, on a deux dichotomies pour une seule donneex1dansRd, et elles sont toutes deux lineairement separables (il sut de considerer n'importe quel hyperplan ne contenant pasx1), c'est-a-dire queC(1;d) = 2 pour toutd>1. Remarque 3.Parmi les autres valeurs faciles a calculer, il y a le casd= 1. En eet, il y a exactement deux dichotomies lineairement separables deNpoints non nuls deR: celle qui prend le m^eme signe qu'eux, et celle qui prend le signe oppose. DoncC(N;1) = 2pour tout N>1. Remarque 4.Gr^ace aux valeursC(1;d) = 2pour toutd>1etC(N;1) = 2pour tout N>1, la formule de recurrence(2)permet d'etablir un tableau analogue a celui de Pascal. Nquotesdbs_dbs46.pdfusesText_46
[PDF] les bases des mathématiques pdf

[PDF] les bases du calcul littéral

[PDF] les bases du grafcet

[PDF] les bases en maths 3eme

[PDF] Les basse de l'orthographe

[PDF] Les batteries de casseroles

[PDF] les béatitudes texte

[PDF] les beatles biographie courte en anglais

[PDF] les bénéficiaires de la valeur ajoutée

[PDF] les besoins alimentaires de l'homme 6ème evaluation

[PDF] Les besoins d'eau

[PDF] Les besoins de l'organisme

[PDF] les besoins de maslow

[PDF] Les besoins de muscles en activité

[PDF] les besoins des clients