[PDF] Introduction data science - Data science Master 2 ISIDIS





Previous PDF Next PDF



Big Data et ses technologies

La garantie de cohérence des données ne peut pas changer dans le cours de vie d'une application sans une ré-architecture fondamentale Page 78. Technologies - ...



Initiation aux Big Data

Organisation du cours. ?Cours 1: Introduction aux Big Data et. Map/Reduce. ?Cours 2: NOSQL et MongoDB. ?Cours 3: TP MongoDB. ?Cours 4: Les BD graphes.



Chapitre 1 - Définitions et objectifs du cours

Big Data ou Data Science? Certains considèrent que l'analyse des données et l'apprentissage numérique incluent forcé- ment les méthodes et technologies pour 



BigData - Semaine 1

Pourquoi ce cours ? Selon LinkedIn les compétences les plus recherchées depuis plusieurs années sont : 1) Cloud and Distributed Computing (Hadoop



Cours Big data et deep learning

Le Big Data a une nature complexe qui nécessite des technologies puissantes et des algorithmes avancés pour son traitement et stockage. Ainsi il ne peut être.



Introduction data science - Data science Master 2 ISIDIS

Data science. Data scientist. Big data. Processus en data science. Bibliographie. Le cours et les supports reposent principalement sur ces sources.



3I026 - Introduction à lIntelligence Artificielle et Data Science*10pt

13 jan. 2017 2 IA et Data Science ... le cours doit être lu et travaillé avant d'aller en TME ... create and house its Institute for Data Science.



MINEURE « DATA SCIENCE »

Mineure « Data Science » Frédéric Pennerath. Objectifs et modalité du cours. « Théorie et pratique en science des données ». Un volet « théorique » :.



Intégration des données et ETL

Data. Source extract transform load. Target /. Data. Warehouse is the fundamental difference between “ETL” and “ELT” in the world of big data? 2017.



Data science : fondamentaux et études de cas

La data science est l'art de traduire des problèmes industriels sociaux

Introduction data science

Data science

Master 2 ISIDIS

S ebastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/ ~verel

Universite du Littoral C^ote d'Opale

Laboratoire LISIC

Equipe OSMOSE

Data scienceData scientistBig dataProcessus en data science

Information

But, evaluation, objectifs, support de cours, bibliographie : cf. siteweb Data scienceData scientistBig dataProcessus en data science

Bibliographie

Le cours et les supports reposent principalement sur ces sources bibliographiques :Data Science : fondamentaux et etudes de cas

Machine Learning avec Python et R

Eric Biernat, Michel Lutz, 2015.

Data scienceData scientistBig dataProcessus en data science

Bibliographie

Big Data et Machine Learning

Manuel du data scientist Pirmin Lemberger, Marc Batty, 2015. Data scienceData scientistBig dataProcessus en data science

Bibliographie

Que les auteurs en soient remercies chaleureusement! Data scienceData scientistBig dataProcessus en data science

Contenu General

A

Machine lea rning:

Bases du data scientist

regression lineaire, logistique, bayesien naif, etc.Les outils avances random forest, gradient boosting, SVM, etc.Concepts generaux grandes dimensions, evaluation de modeles, etc. B

Hado opavec Map-reduce : Systeme HDFS

Map-reduce : exemples de bases

Map-reduce : exemples avances

Framework pig

C NoSQL p ourle big data : Presentation, dierence SQP/noSQL Quelques implementations : Hbase, Sqoop, Hive, etc.

Machine learning en big data (mahout, Mllib)

Data scienceData scientistBig dataProcessus en data science

Resoudre des problemes

ah! resoudre des problemes...

Panne d'une voiture

Connaitre l'opinion sur un sujet dans les reseaux sociaux

Prevoir la consommation electrique

Data scienceData scientistBig dataProcessus en data science

Une denition

Data science

"Demarche empirique qui se base sur des donnees pour apporter une reponse a des problemes" Data science : fondamentaux et etudes de cas, E. Biernat, M.

Lutz, Eyrolles, 2015.

Data scienceData scientistBig dataProcessus en data science

Le metier de Data scientist

Data scientist

Apparu en 2008, DJ. Patil et Je Hammerbacher de Facebook et LinkedIn, ce sont appeles "data scientist"Generalise a partir de 2012 : "Data scientist : The sexiest Job of the 21th Century", T.H. Davenport, DJ. Patil, Harvard Buissiness Review, oct. 2012.R^ole du data scientist gagne en importance dans les entreprises :Augmentation (explosion!) du volume des donnees non structurees (big data)Dans les 10 prochaines annees, prol data scientist sera tres recherche Data scienceData scientistBig dataProcessus en data science

Les competences

On peut aussi aller lire un post de Alex Woodie :

http://www.datanami.com/2015/01/07/ Data scienceData scientistBig dataProcessus en data science

Les jobs

Exercices

Sur google trends : observer l'usage de "data scientist" Rechercher des ores d'empli prols "big data", "business intelligence"...Consulter le referentiel metier de l'apec "data scientist" Data scienceData scientistBig dataProcessus en data science

Big data

Undelugede donneesSource des donnees :

Activite humaine

emails, photos, video, logs, likes, etc.Activite des machines capteurs en tout genre, compteurs en tout genre (electrique, etc.), vehicules, electro-menagerOpen data des institutions, des entreprises horaires, statistiques sur les regions, geolocalisation, etc.open API de twitter, google, etc. http://www.programmableweb.com/Le web! Avertissement, data science ne se reduit pas au big data Data scienceData scientistBig dataProcessus en data science

Big data

Undelugede donneesSource des donnees :

Activite humaine

emails, photos, video, logs, likes, etc.Activite des machines capteurs en tout genre, compteurs en tout genre (electrique, etc.), vehicules, electro-menagerOpen data des institutions, des entreprises horaires, statistiques sur les regions, geolocalisation, etc.open API de twitter, google, etc. http://www.programmableweb.com/Le web! Avertissement, data science ne se reduit pas au big data Data scienceData scientistBig dataProcessus en data science

Causes economiques

Les co^uts baisses exponentiellement

Capacite de stockage

Capacite de calcul

Bande passante

)Emergence de data centers : Google, Amazon, LinkedIn,

Yahoo!, OVH, etc.

Data scienceData scientistBig dataProcessus en data science

How big?

Internet :>10 PoData center :>100 ToDisque dur :10 ToRAM :<100 Go Frontiere big data : lorsque les donnees ne peuvent ^etre traitees en temps "raisonnable" ou "utile"Calculer le temps necessaire pour lire un disque dur de 1 To a

100Mo=s?Attention : donnees6= information

Data scienceData scientistBig dataProcessus en data science

How big?

Internet :>10 PoData center :>100 ToDisque dur :10 ToRAM :<100 Go Frontiere big data : lorsque les donnees ne peuvent ^etre traitees en temps "raisonnable" ou "utile"Calculer le temps necessaire pour lire un disque dur de 1 To a

100Mo=s?Attention : donnees6= information

Data scienceData scientistBig dataProcessus en data science

Les fameux 3V (Gartner)

Schema d'apres "Big data et Machine Learning", Dunod, 2015. Data scienceData scientistBig dataProcessus en data science

Champs d'application

Nombreux champs d'applications actuels et futurs

Tous les domaines de la science :

climat, physique, epidemiologie, medical, etc.En politique

Campagne Obama, etc.Secteur prive :

Relation clients, marketing cible, frequentation, etc.Secteur public : amelioration des services, adaptation aux besoins, etc. Beaucoup de perspectives en vue!Nouveaux besoins, nouveaux outils... Data scienceData scientistBig dataProcessus en data science

Quelques remarques ethiques

Attention aux droits sur les donnees :

a qui appartient les donnees, leur exploitations, etc.Toutes les donnees ont un co^ut

Une donnee peut ^etre juste mais l'analyse fausse

Une analyse de donnees n'est jamais neutre au sens objective!

Une donnee n'est jamais neutre :

Une donnee est recoltee et exploitee dans un but precis Data scienceData scientistBig dataProcessus en data science

Demarche en data science

Demarche globale

1Imaginer un produit, ou une question

2Collecter les donnees

3Preparer les donnees

4Concevoir un modele predictif

5Visualiser les resultats

6Optimiser le modele (calibration)

7Deploiement, industrialisation

Le gros volume de donnees n'est pas une contrainte mais une opportunite! Data scienceData scientistBig dataProcessus en data science

Contenu General

A

Machine lea rning:

Bases du data scientist

regression lineaire, logistique, bayesien naif, etc.Les outils avances random forest, gradient boosting, SVM, etc.Concepts generaux grandes dimensions, evaluation de modeles, etc. B

Hado opavec Map-reduce : Systeme HDFS

Map-reduce : exemples de bases

Map-reduce : exemples avances

Framework pig

C NoSQL p ourle big data : Presentation, dierence SQP/noSQL Quelques implementations : Hbase, Sqoop, Hive, etc.

Machine learning en big data (mahout, Mllib)

quotesdbs_dbs50.pdfusesText_50
[PDF] big data formation pdf

[PDF] big data pdf en francais

[PDF] big data pour les nuls pdf

[PDF] big data tutorial pdf

[PDF] bilan admission post bac lyon

[PDF] bilan apb 2016

[PDF] bilan arjel 2016

[PDF] bilan biochimique sang

[PDF] bilan biochimique sang pdf

[PDF] bilan cm2 systeme solaire

[PDF] bilan comptable marocain excel

[PDF] bilan comptable marocain exemple

[PDF] bilan comptable marocain exercice corrigé

[PDF] bilan dune macrocytose

[PDF] bilan de cycle eps