[PDF] Big Data Machine Learning : quest-ce que la science des données





Previous PDF Next PDF



Une introduction au Machine Learning

DE QUOI PARLE-T-ON ? < Intelligence artificielle (IA/AI). < Machine Learning / Apprentissage automatique. < Deep Learning / Réseaux de neurones.





PRÉSENTATION DU MACHINE LEARNING

30 juil. 2018 Dans le cas d'un programme informatique qui est celui qui nous intéresse dans cet ouvrage



Introduction au Machine learning et à la classification supervisée

? Statistique. ? Intelligence artificielle (AI). ? Machine Learning (ML). ? Big Data. ? Data Science. ? Deep Learning (DL). ? ?? ... Page 7 ...



Présentation PowerPoint

1 août 2017 Les algorithmes de Machine Learning utilisent donc ... Différence Machine Learning /. Data Mining ... Ex : Dans la population française :.



Introduction à lapprentissage automatique

Certaines figures sont plus lisibles en couleurs dans le document pdf en ligne. L'apprentissage automatique (en anglais machine learning ...



MACHINE LEARNING AVEC SCIKIT-LEARN

Lorsqu'on leur parle de « Machine Learning » que l'on traduit en français par. « apprentissage automatique »



Machine learning et Data Mining - Introduction

? fouille de données (data mining). ? intelligence artificielle. ? statistique. ? ? domaines différents avec des intersections plus ou moins grandes.



Deep learning cest quoi?

12 août 2019 Le machine learning est une technique d'apprentissage automatisé. Cela permet à l'ordinateur de « décider » sans.



Big Data Machine Learning : quest-ce que la science des données

18 jan. 2017 4. Quel Machine Learning pour les Big Data? 5. Les Big Data le Machine learning et la loi. 6. Enseignement des sciences des données.



[PDF] Introduction au Machine Learning Chloé-Agathe Azencott

Dans ce livre nous considérons que le machine learning est la science de l'apprentissage automatique d'une fonction prédictive à partir d'un jeu d'observations 



[PDF] machine-learning - RIP Tutorial

À propos You can share this PDF with anyone you feel could benefit from it downloaded the latest version from: machine-learning



[PDF] Introduction à lapprentissage automatique - Loria

G Thomas Mathematics for machine learning Univ of California at Berkeley 2018 https://gwthomas github io/docs/math4ml pdf Pour faciliter la lecture 



[PDF] Version 035930 - Machine Learning Statistiques et Programmation

30 mai 2022 · Dénomination française : algorithme des centres mobiles 1 Page 6 Machine Learning Statistiques et Programmation Version 0 3 593 0



[PDF] Machine Learning - Ensimag 3A IF

L'apprentissage machine ou apprentissage automatique de réseaux de neurones (nous le verrons dans le contexte des dits “extreme learning machines” 



[PDF] Salim Lardjane Université Bretagne Sud

4 jan 2021 · classique en Machine Learning et en Statistique • Dans scikit-learn il est inclus dans le module datasets • On peut le charger à l'aide 



[PDF] Machine Learning Statistiques et Programmation cours et

25 nov 2018 · Cours Machine Learning Statistiques et Programmation gratuit en PDF Table des matières Introduction; Clustering; Bases de Machine 



[PDF] Les différents algorithmes de lIA

Le Deep Learning de Google Photos comporte par exemple 30 couches Une autre évolution massive est celle des réseaux de neurones convolutifs Le machine 



[PDF] Introduction – Pourquoi devez-vous lire ce livre - UAC ONLINE

Installer Python Anaconda : le meilleur outil de Machine Learning apprentissage en vous fournissant des exemples de traductions français-

:
Big Data Machine Learning : quest-ce que la science des données

Big Data, Machine Learning :

qu'est-ce que la science des donnees ?

Journee de l'IREM, BordeauxAurelien Garivier

18 janvier 2017

Institut de Mathematiques de Toulouse

LabeX CIMI

Universite Paul Sabatier

Plan de la presentation

1. Un monde numerique

2. Qu'est-ce que le machine learning ?

3. Le phenomene Big Data

4. Quel Machine Learning pour les Big Data?

5. Les Big Data, le Machine learning et la loi

6. Enseignement des sciences des donnees

2

Un monde numerique

Un monde numerique

Nous vivons aujourd'hui dans une "ere du numerique": Les donnees sont partout : sondages, indices de popularite, scores electoraux, statistiques economiques voire sportives... Nous produisons nous-m^emes des donnees de notre plein gre : photos, interactions sur les reseaux sociaux, objets connectes... sans le vouloir vraiment : recherches sur Internet, traces laissees par nos actions (achats, reseaux sociaux ...), ou en echange de services (pas si) gratuits. 4

Un monde numerique

Notre vie est de plus en plus dirigee par ce monde numerique : Societe de consommation (prediction des go^uts et des achats) Notre relation avec les banques, assurances (scoring pour determiner credit, avantages) Algorithmes pour la carte scolaire, pour l'orientation scolaire...

Surveillance policiere...

Choix d'un conjoint par sites de rencontre...

Voitures qui roulent seule et reagissent a leur environnement ...

Tout cela gr^ace avec des algorithmes...

5

Un monde numerique : le mythe du Big Data

Des chires tous les jours dans tous les media, chires sur lesquels s'appuie la pensee : Economie quantitative, psychologie quantitative mais aussi decisions politiques.6

Un monde numerique : points positifs

Une donnee quantitative (un

nombre) ca ne se discute pas c'est serieux c'est facile a interpreter c'est synthetique ..7

Un monde numerique : points positifs

Une donnee quantitative (un

nombre) ca ne se discute pas c'est serieux c'est facile a interpreter c'est synthetique ..Bref ...c'est ecace! 7

Points negatifs

Peut-on faire mentir les nombres ?

Disraeli : Il y a les mensonges, les gros mensonges, et les statistiques. Par manque de temps , de connaissances, on s'expose a des erreurs d'interpretation. Necessite de comprendre l'usage de la statistique et leur signication : la verite mathematique est-elle verite au sens usuel ? HG. Wells : Le jugement statistique sera un jour aussi necessaire a l'exercice de base des fonctions du citoyen que la capacite de lire et d'ecrire. 8 La science historique des donnees : la statistique La statistique est l'etude de la collecte de donnees, leur analyse, leur traitement, l'interpretation des resultats et leur presentation an de rendre les donnees comprehensibles par tous. C'est a la fois une science, une methode et un ensemble de techniques.

Source : Wikipedia

La statistique est utilisee dans presque tous les domaines de l'activite humaine : sciences sociales, economie, medecine, biologie, industrie ... Mais aujourd'hui, Open Data, Big Data, Big Science... changent les regles du jeu. 9

Qu'est-ce que le machine learn-

ing ?

Plan de la presentation

1. Un monde numerique

2. Qu'est-ce que le machine learning ?

Intelligence articielle

Machine Learning

3. Le phenomene Big Data

4. Quel Machine Learning pour les Big Data?

5. Les Big Data, le Machine learning et la loi

6. Enseignement des sciences des donnees

11

Intelligence Articielle (IA) : denition

Intelligence des machines

simuler les capacites cognitives des humains (big data: les humains apprennent en utilisant des sources de donnees tres abondantes et diverses). une machine mime les fonctions cognitives que les humains associent a l'esprit humain, tels queapprendreouresoudre un probleme.Machine intelligente ideale = agent rationnel exible quipercoitson environnement et quiprend des

decisionsqui maximisent ses chances de succes pour un but donne.Fonde sur le postulat que l'intelligence humaine

peut ^etre decrite si precisement qu'on peut construire une machine la simulant.12

Intelligence Articielle: Tension

Buts operationnels

Robots autonomes pour realiser des t^aches pas trop specialisees En particulier, vision + comprehension et production de langage (naturel)Tension entre les objectifs operationnels et les buts philosophiques Au fur et a mesure que les machines accomplissent de plus en plus de t^aches, des competences qu'on pensait relever de l'intelligence sont progressivement retirees de la liste. Par exemple, la reconnaissance de caracteres n'est plus consideree comme relevant de l'IA, mais comme une technologie de routine. Parmi les competences encore classees en IA, il y a le jeu de go ou les voitures autonomes...13

AI: principaux themes

Principaux objectifs de l'IA:

raisonnement connaissance planication apprentissage traitement des langues naturelles perception intelligence "generale"

Approches centrales de l'IA:

approche symbolique traditionnelle (cf. logique) methodes d'inspiration statistique soft computingS'appuie sur: informatique mathematiques linguistique philosophie neurosciences psychologie (articielle)

Outils:

optimisation mathematique logique algorithmes d'inspiration probabiliste theorie des jeux14

Plan de la presentation

1. Un monde numerique

2. Qu'est-ce que le machine learning ?

Intelligence articielle

Machine Learning

3. Le phenomene Big Data

4. Quel Machine Learning pour les Big Data?

5. Les Big Data, le Machine learning et la loi

6. Enseignement des sciences des donnees

15

Machine Learning (ML): Denition

Arthur Samuel (1959)

Champ d'etude qui donne aux ordinateurs la capacite d'apprendre sans avoir ete programmes explicitementTom M. Mitchell (1997) On dit qu'un programmeapprend d'une experience Epar rapport a une classe de t^aches T et a une mesure de performance P si sa performance sur T, mesuree par P, augmente avec l'experience E.16 ML: Apprendre des donnees et faire des predictions Les algorithmes construisent un modele a partir d'exemplesdonnes en entree, dans but de faire despredictionsou de prendre des decisions... ...plut^ot que de suivre strictement une suite statique d'instructions : c'est utile quand il serait impossible ou inecace de concevoir et de programmer de tels algorithmes.Analyse de donnees (Data Analytics) Le Machine Learning est utilise pour concevoir des modeles complexes et des algorithmes qui conduisent eux-m^eme a des predictions - le mot commercial est souventpredictive analytics. www.sas.com: "Produce reliable, repeatable decisions and results" and uncover "hidden insights" through learning from historical relationships and trendsin the data. evolution a partir de la reconnaissance de motifs (pattern recognition) de la computational learning theory en IA.17

Machine Learning: problemes-types

ltrage de spams, classication de textes reconnaissance de caracteres (OCR) moteurs de recherche plateformes de recommandation outils de reconnaissance de la parole vision par ordinateur bio-informatique, analyse du genome, medecine (predictive) Pour chacune de ces t^aches, il est possible mais inecace d'ecrire des programmes explicitement destines a resoudre les buts recherches. Il appara^t beaucoup plus fecond d'apprendre a des machines a inferer elles-m^eme les bonnes regles de decision. 18

Disciplines connexes

Statistique computationnelle: centre sur la prediction obtenue par l'usage de modeles statistiques necessitant des calculs numeriques intensifs (ex: methodes bayesiennes) Apprentissage statistique: ML base sur des methodes statistiques, avec un point de vue statistique (garanties probabilistes: consistence, inegalites oracles, minimax...) !plus axes sur lacorrelation, et moins sur lacausalite Data Mining(apprentissage non supervise) centre plut^ot sur l'analyse exploratoire des donnees et la decouverte de proprietes inconnues des donnees. Importance des methodes basees sur lesprobabiliteset les statistiques!Data Science(Michael Jordan) Liens tres forts avec l'optimisation mathematique, qui fournit des methodes, des concepts et des applications au ML. 19

Classication supervisee : cadre statistique

Denition (terme anglais)ex: reconnaissance de chires Input spaceX6464 imagesOutput spaceYf0;1;:::;9gJoint distributionP(x;y)? Prediction functionh2 HRiskR(h) =P(h(X)6=Y)Samplef(xi;yi)gni=1MNIST dataset

Empirical risk

Rn(h) =1n

P n i=11fh(xi)6=yigLearning algorithm n: (X Y)n! HNN,boosting... Expected riskRn() =En[R(n)]Empirical risk minimizer hn= argminh2H^Rn(h)Regularized empirical risk minimizer hn= argminh2H^Rn(h) +C(h)20

Minimisation du risque empirique

Inegalite de Hoeding: avec probabilite au moins 1,

R(h)^Rn(h)s1

2nlog2

Probleme: vrai pourchaquehxemaispas pour^hn!

Ex: Prediction of 10 lancers de Pile ou Face

Ex: regression polynomiale!sur-apprentissage

Fleau de la dimension

21

Minimisation structurelle du risque

!loi des grands nombresuniforme| inegalite de Vapnik-Chervonenkis : siHa unedimension de VCdH, alors sup h2H

R(h)^Rn(h)O

s1

2nlog2

+dHn lognd H

Structure:

H=[ mH m Ex: polyn^omes/splines de degrem, arbres de decision de profondeurm,...

Decompotion du risque en biais{variance

Minimisation structurelle du risque :

hn= argmin h2H^Rn(h) +K(h) ou ^hn= argmin

K(h)C^Rn(h)

22

Structural Risk Minimization Tradeo

Source: Bottou et al. tutorial on optimization

23

Machine Learning et Statistique

L'analyse de donnees (inference, description) est le but des statistiques depuis longtemps. Le Machine Learning a des buts plusoperationels(ex: la consistence est importante en statistique mais moins en ML).

Les modeles (quand il y en a) sontinstrumentaux.

Ex: modele lineaires (jolie theorie mathematique) vs Random Forests (utilisation massive de modeles pauvres et sans signication propre). Machine Learning pour les big data: plus de separation entre modelisation stochastique et optimisation (contrairement aux statistiques classiques). En ML, les donnees sont souvent la a priori (malheureusement). Pas de frontiere infranchissable (la statistique aussi evolue). 24

Le phenomene Big Data

SurlesiteduCNRS

04/03/14 12:30Big Data, la déferlante des octets | CNRS le journal

Page 1 sur 10file:///Users/Mokrane-CNRS/Desktop/Big%20Data,%20la%20déferlante%20des%20octets%20%7C%20CNRS%20le%20journal.webarchive

Donner du sens à la science

Suivre

RechercherSe connecter/S'inscrire

Types

MES THÈMES

Partager l'article

Rechercher

&[Src: Bouzeghoub,Mastodons: Une approche interdisciplinaire des Big Data] 25
quotesdbs_dbs28.pdfusesText_34
[PDF] understanding machine learning from theory to algorithms

[PDF] apprentissage automatique pdf

[PDF] master machine learning algorithms pdf

[PDF] introduction au machine learning

[PDF] machine learning cours pdf

[PDF] machine learning book pdf

[PDF] les boucles en algorithme exercice corrigé pdf

[PDF] la boucle tant que algorithme pdf

[PDF] les tableaux en algorithme pdf

[PDF] algorithmique et programmation 3eme

[PDF] programmation mblock

[PDF] tuto mblock

[PDF] mbot programmation

[PDF] algorithme nombre d or

[PDF] algobox suite arithmétique