Big Data et ses technologies
La garantie de cohérence des données ne peut pas changer dans le cours de vie d'une application sans une ré-architecture fondamentale Page 78. Technologies - ...
Initiation aux Big Data
Organisation du cours. ?Cours 1: Introduction aux Big Data et. Map/Reduce. ?Cours 2: NOSQL et MongoDB. ?Cours 3: TP MongoDB. ?Cours 4: Les BD graphes.
Chapitre 1 - Définitions et objectifs du cours
Big Data ou Data Science? Certains considèrent que l'analyse des données et l'apprentissage numérique incluent forcé- ment les méthodes et technologies pour
BigData - Semaine 1
Pourquoi ce cours ? Selon LinkedIn les compétences les plus recherchées depuis plusieurs années sont : 1) Cloud and Distributed Computing (Hadoop
Cours Big data et deep learning
Le Big Data a une nature complexe qui nécessite des technologies puissantes et des algorithmes avancés pour son traitement et stockage. Ainsi il ne peut être.
Introduction data science - Data science Master 2 ISIDIS
Data science. Data scientist. Big data. Processus en data science. Bibliographie. Le cours et les supports reposent principalement sur ces sources.
3I026 - Introduction à lIntelligence Artificielle et Data Science*10pt
13 jan. 2017 2 IA et Data Science ... le cours doit être lu et travaillé avant d'aller en TME ... create and house its Institute for Data Science.
MINEURE « DATA SCIENCE »
Mineure « Data Science » Frédéric Pennerath. Objectifs et modalité du cours. « Théorie et pratique en science des données ». Un volet « théorique » :.
Intégration des données et ETL
Data. Source extract transform load. Target /. Data. Warehouse is the fundamental difference between “ETL” and “ELT” in the world of big data? 2017.
Data science : fondamentaux et études de cas
La data science est l'art de traduire des problèmes industriels sociaux
Introduction data science
Data science
Master 2 ISIDIS
S ebastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/ ~verelUniversite du Littoral C^ote d'Opale
Laboratoire LISIC
Equipe OSMOSE
Data scienceData scientistBig dataProcessus en data scienceInformation
But, evaluation, objectifs, support de cours, bibliographie : cf. siteweb Data scienceData scientistBig dataProcessus en data scienceBibliographie
Le cours et les supports reposent principalement sur ces sources bibliographiques :Data Science : fondamentaux et etudes de casMachine Learning avec Python et R
Eric Biernat, Michel Lutz, 2015.
Data scienceData scientistBig dataProcessus en data scienceBibliographie
Big Data et Machine Learning
Manuel du data scientist Pirmin Lemberger, Marc Batty, 2015. Data scienceData scientistBig dataProcessus en data scienceBibliographie
Que les auteurs en soient remercies chaleureusement! Data scienceData scientistBig dataProcessus en data scienceContenu General
AMachine lea rning:
Bases du data scientist
regression lineaire, logistique, bayesien naif, etc.Les outils avances random forest, gradient boosting, SVM, etc.Concepts generaux grandes dimensions, evaluation de modeles, etc. BHado opavec Map-reduce : Systeme HDFS
Map-reduce : exemples de bases
Map-reduce : exemples avances
Framework pig
C NoSQL p ourle big data : Presentation, dierence SQP/noSQL Quelques implementations : Hbase, Sqoop, Hive, etc.Machine learning en big data (mahout, Mllib)
Data scienceData scientistBig dataProcessus en data scienceResoudre des problemes
ah! resoudre des problemes...Panne d'une voiture
Connaitre l'opinion sur un sujet dans les reseaux sociauxPrevoir la consommation electrique
Data scienceData scientistBig dataProcessus en data scienceUne denition
Data science
"Demarche empirique qui se base sur des donnees pour apporter une reponse a des problemes" Data science : fondamentaux et etudes de cas, E. Biernat, M.Lutz, Eyrolles, 2015.
Data scienceData scientistBig dataProcessus en data scienceLe metier de Data scientist
Data scientist
Apparu en 2008, DJ. Patil et Je Hammerbacher de Facebook et LinkedIn, ce sont appeles "data scientist"Generalise a partir de 2012 : "Data scientist : The sexiest Job of the 21th Century", T.H. Davenport, DJ. Patil, Harvard Buissiness Review, oct. 2012.R^ole du data scientist gagne en importance dans les entreprises :Augmentation (explosion!) du volume des donnees non structurees (big data)Dans les 10 prochaines annees, prol data scientist sera tres recherche Data scienceData scientistBig dataProcessus en data scienceLes competences
On peut aussi aller lire un post de Alex Woodie :
http://www.datanami.com/2015/01/07/ Data scienceData scientistBig dataProcessus en data scienceLes jobs
Exercices
Sur google trends : observer l'usage de "data scientist" Rechercher des ores d'empli prols "big data", "business intelligence"...Consulter le referentiel metier de l'apec "data scientist" Data scienceData scientistBig dataProcessus en data scienceBig data
Undelugede donneesSource des donnees :
Activite humaine
emails, photos, video, logs, likes, etc.Activite des machines capteurs en tout genre, compteurs en tout genre (electrique, etc.), vehicules, electro-menagerOpen data des institutions, des entreprises horaires, statistiques sur les regions, geolocalisation, etc.open API de twitter, google, etc. http://www.programmableweb.com/Le web! Avertissement, data science ne se reduit pas au big data Data scienceData scientistBig dataProcessus en data scienceBig data
Undelugede donneesSource des donnees :
Activite humaine
emails, photos, video, logs, likes, etc.Activite des machines capteurs en tout genre, compteurs en tout genre (electrique, etc.), vehicules, electro-menagerOpen data des institutions, des entreprises horaires, statistiques sur les regions, geolocalisation, etc.open API de twitter, google, etc. http://www.programmableweb.com/Le web! Avertissement, data science ne se reduit pas au big data Data scienceData scientistBig dataProcessus en data scienceCauses economiques
Les co^uts baisses exponentiellement
Capacite de stockage
Capacite de calcul
Bande passante
)Emergence de data centers : Google, Amazon, LinkedIn,Yahoo!, OVH, etc.
Data scienceData scientistBig dataProcessus en data scienceHow big?
Internet :>10 PoData center :>100 ToDisque dur :10 ToRAM :<100 Go Frontiere big data : lorsque les donnees ne peuvent ^etre traitees en temps "raisonnable" ou "utile"Calculer le temps necessaire pour lire un disque dur de 1 To a100Mo=s?Attention : donnees6= information
Data scienceData scientistBig dataProcessus en data scienceHow big?
Internet :>10 PoData center :>100 ToDisque dur :10 ToRAM :<100 Go Frontiere big data : lorsque les donnees ne peuvent ^etre traitees en temps "raisonnable" ou "utile"Calculer le temps necessaire pour lire un disque dur de 1 To a100Mo=s?Attention : donnees6= information
Data scienceData scientistBig dataProcessus en data scienceLes fameux 3V (Gartner)
Schema d'apres "Big data et Machine Learning", Dunod, 2015. Data scienceData scientistBig dataProcessus en data scienceChamps d'application
Nombreux champs d'applications actuels et futurs
Tous les domaines de la science :
climat, physique, epidemiologie, medical, etc.En politiqueCampagne Obama, etc.Secteur prive :
Relation clients, marketing cible, frequentation, etc.Secteur public : amelioration des services, adaptation aux besoins, etc. Beaucoup de perspectives en vue!Nouveaux besoins, nouveaux outils... Data scienceData scientistBig dataProcessus en data scienceQuelques remarques ethiques
Attention aux droits sur les donnees :
a qui appartient les donnees, leur exploitations, etc.Toutes les donnees ont un co^utUne donnee peut ^etre juste mais l'analyse fausse
Une analyse de donnees n'est jamais neutre au sens objective!Une donnee n'est jamais neutre :
Une donnee est recoltee et exploitee dans un but precis Data scienceData scientistBig dataProcessus en data scienceDemarche en data science
Demarche globale
1Imaginer un produit, ou une question
2Collecter les donnees
3Preparer les donnees
4Concevoir un modele predictif
5Visualiser les resultats
6Optimiser le modele (calibration)
7Deploiement, industrialisation
Le gros volume de donnees n'est pas une contrainte mais une opportunite! Data scienceData scientistBig dataProcessus en data scienceContenu General
AMachine lea rning:
Bases du data scientist
regression lineaire, logistique, bayesien naif, etc.Les outils avances random forest, gradient boosting, SVM, etc.Concepts generaux grandes dimensions, evaluation de modeles, etc. BHado opavec Map-reduce : Systeme HDFS
Map-reduce : exemples de bases
Map-reduce : exemples avances
Framework pig
C NoSQL p ourle big data : Presentation, dierence SQP/noSQL Quelques implementations : Hbase, Sqoop, Hive, etc.Machine learning en big data (mahout, Mllib)
quotesdbs_dbs50.pdfusesText_50[PDF] big data pdf en francais
[PDF] big data pour les nuls pdf
[PDF] big data tutorial pdf
[PDF] bilan admission post bac lyon
[PDF] bilan apb 2016
[PDF] bilan arjel 2016
[PDF] bilan biochimique sang
[PDF] bilan biochimique sang pdf
[PDF] bilan cm2 systeme solaire
[PDF] bilan comptable marocain excel
[PDF] bilan comptable marocain exemple
[PDF] bilan comptable marocain exercice corrigé
[PDF] bilan dune macrocytose
[PDF] bilan de cycle eps