Chapitre 7: Séries chronologiques
Analyse d'une série chronologique. Estimation des composantes. Prédiction. Chapitre 7: Séries chronologiques. Arnaud Rousselle. GEA 1. Arnaud Rousselle.
Chapitre 1 : Généralités sur les séries chronologiques.
Définition : On appelle série chronologique ou chronique une suite (Yt) Dans un modèle additif on suppose que les 3 composantes : tendance
Séries Chronologiques
le mod`ele multiplicatif. La variable Xt s'écrit au terme d'erreur pr`es comme le produit de la tendance et d'une composante de saisonnalité :.
Introduction aux séries chronologiques
04-Nov-2007 Définition. La composante saisonnière ou mouvement saisonnier représente des effets périodiques de période connue p qui se reproduisent de façon ...
Modélisation et prévision Séries chronologiques - Séance 1
St périodique de période p. ?? éventuellement plusieurs composantes périodiques superposées. Exemple : comp. annuelle + comp. trimestrielle.
Introduction aux séries temporelles tendance et composante
Moyenne mobile La moyenne mobile est une méthode simple permettant d'extraire les composantes basses fréquences d'une série temporelle autrement dit sa tendance
Fiche technique Stat – 03 : Séries chronologiques tendances et
15-May-2010 Ce coefficient porte le nom de coefficient saisonnier. 3) Les composantes d'une série chronologique. Si on considère une fonction y = F(t) ...
Chapitre 5 :Série chronologique
b) Le mouvement saisonnier : cette composante notée ( ). s t
Séries chronologiques
On consid`ere qu'une série chronologique (Xt) est la résultante de différentes composantes fondamentales : 1 la tendance (ou trend) (Zt) représente
Séries chronologiques (avec R) (Cours et exercices)
06-Jan-2020 (3) Tester maintenant le lissage exponentiel de Holt-Winters avec composante saisonnière ad- ditive puis multiplicative (seulement pour les ...
MAP-STA2 : Séries chronologiques
Yannig Goude
yannig.goude@ edf.fr2015-2016
le temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d"échantillonnage. Par exemple, les
données du nombre de requétes google "rubgy world cup" par semaine (source h ttps://www.google.fr/trends/2004200620082010201220142016
0 20 4060
80
100
Nb Queries
la production horaire d"un panneau photovoltaïque, l"indice des prix à la consommation des ménages Français
(source INSEE: h ttp://www.insee.fr/fr/bases-de-donnees/ ) au pas mensuel, la consommation électriquerésidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France en
milliards d"euros depuis 1970 (sources: h ttps://www.data.gouv.fr/fr 1 oct. 03oct. 05oct. 07 0.0 0.4 0.8Solar Production
2000200520102015
100115
Ind. Prix (INSEE)
sept. 03sept. 13sept. 23 0.2 0.6Consumption (kw)
19701980199020002010
0 150Transac.ImmoDécomposition d"une série temporelle
L"objectif principal de l"analyse d"une série temporelle est la prévision de ses futures réalisations. Afin de
réaliser cet objectif, une premiére étape de modélisation de la série est nécessaire. Cette étape consiste à
sélectionner, parmi une famille de modèles correspondant à des approximations de la réalité, celui qui décrit
le mieux la série en question. Quelques exemples de modéles de série temporelle: •les lissages exponentiels•les modéles de régression (régression linéaire, modéles non-paramétriques...)
•les modéles du type ARIMA •les modéles de données fonctionnelles Une série temporelleYtest communément décomposée en: •une tendanceTtcorrespondant à une évolution à long terme de la série, par exemple: -tendance linéaire:Tt=a+bt -tendance quadratique:Tt=a+bt+ct2 -tendance logarithmique:Tt=log(t)•une saisonnalitéStcorrespondant à un phénoméne périodique de période identifiée
•une erreurεtqui est la partie aléatoire de la série (idéalement stationnaire) 2On ajoute parfois une autre composante, le cycleCtqui correspond à un phénoméne répétitif régulier (donc
prévisible) de période inconnue ou changeante.Cette décomposition peut-étre additiveYt=Tt+St+εtou multiplicativeYt=Tt?St?εt. Il est également
possible de combiner ces deux décompositions:Yt= (Tt+St)?εtouYt= (Tt?St) +εt...Nous nous intéressons ici à la modélisation de la composante déterministe de la série:TtetSt.
Rq: un passage aulogpermet de se ramener à un modéle additif si le modéle étudié est totalement multiplicatif.
Exemple:
janv. 1900janv. 1950janv. 2000 0 2 4 6 8 janv. 1900janv. 1950janv. 2000 -5 0 510Modélisation de la partie déterministe
La tendance
Il existe différents procédés permettant d"anlyser puis/ou de corriger la tendance d"une série temporelle.
Moyenne mobile
La moyenne mobile est une méthode simple permettant d"extraire les composantesbasses fréquences d"une série temporelle autrement dit sa tendance. Elle est également connue comme une
méthode de lissage car elle agit comme un filtre passe bas et donc élimine le bruit.Le calcul de la moyenne mobile dépend d"un paramètrelappelé la largeur de fenêtre. Ce paramétre correspond
au nombre d"observations inclues dans le calcul de la moyenne glissante éffectuée. Pluslest grand plus le
lissage est important (jusqu"à atteindre la fonction constante égale à la moyenne).La moyenne mobile se calcule ainsi:
3 ?yt=12l+ 1t+l? i=t-ly tEt en r, une des nombreuses alternatives est la fonctionfilter:MA<-filter(X,filter= array(1/10,dim=10),method = c("convolution"),
sides = 2 circular = FALSEMA<-xts(MA,order.by=Date)
plot(X,type=?l?) lines(MA,col=?red?)janv. 1900janv. 1920janv. 1940janv. 1960janv. 1980janv. 2000 0 2 4 6 8 XRemarquons que la moyenne mobile est un estimateur non-paramétrique de la tendance, au sens ou nous ne
supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale).Différenciation
Pour nettoyer une série de sa tendance et/où de sa saisonnalité, nous pouvons procéder par différenciation. Celà fonctionne pour des séries à tendance polynomiale. NotonsΔl"opérateur de différenciation:Δyt=yt-yt-1. L"opérateur de différenciation d"ordrekcorrespondant est:Δkyt= Δ(Δk-1yt) Propositionsoit un processusytadmettant une tendance polynomiale d"ordrek: y t=k? j=0a jtj+εt 4 alors le processusΔytadmet une tendance polyomiale d"ordrek-1.Preuveà faireIl en découle que pour éliminer une tendance polynomiale d"ordrekon peut effectuer une différenciation
d"ordrek.La fonction permettant de différencier une série temporelle est la fonctiondiffdont voici un exemple
d"utilisation sur l"indice des prix à la consommation des ménages:par(mfrow =c(1,2 )) prix.ts <-ts(dataPRIX$PrixConso,frequency = 12 )Acf(prix.ts,na.action = na.omit)
diff.prix.ts <-diff(prix.ts,lag = 1 ,differences = 1 )Acf(diff.prix.ts,na.action = na.omit)
-0.2 0.2 0.4 0.6 0.8 1.0 Lag ACFSeries: prix.ts
1224-0.2 0.0 0.2 0.4 0.6 Lag ACF
Series: diff.prix.ts
1224plot(prix.ts,col = "blue" )
plot(diff.prix.ts,col = "orangered2" ) 5 Time prix.ts 51015100
105
110
115
120
125
Time diff.prix.ts 51015
-1.0 -0.5 0.0 0.5
1.0Estimation paramétrique de la tendance
Après avoir représenté la série, il est souvent possible d"inférerune représentation paramétrique de sa tendance. Dans ce cas, on procède par régression (linéaire le plus
souvent mais potentiellent non-linéaire) pour estimer cette tendance. Par exemple, dans le cas d"un processusyadmettant une tendance polynomiale d"ordrek:yt=?k j=0ajtj+εt, un estimateur de la tendance pourra être obtenu ainsi: T=X?a ouXest la matrice dont les colonnes sont les vecteurs(1,...,tj)et: ?a= (X?X)-1X?Y avecY= (y1,...,yt)En pratique, la fonctionlmounlmdans le cas non linéaire permet d"estimer ce type de tendance.time <-c(1:nrow(dataPRIX))
dataPRIX$time <- time reg <-lm(PrixConso ~time + I(time^2) +I(time^3),data = dataPRIX) par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, reg$fitted,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -reg$fitted, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 62000200520102015
100105
110
115
120
125
Ind. Prix. Conso. Ménages (INSEE)
2000200520102015
-1 0 1 2 Ind. Prix. - detrendEstimation non-paramétique de la tendance Dans certains cas, une représentation paramétrique de la tendance n"est pas évidente. Le modèle sous-jacent à ce type de données est: y t=f(t) +εtoùfest une fonctionrégulièresur laquelle on ne fait pas d"hypothèse paramétrique,t= 1,2,..,n. On ne
fait pour l"instant pas d"hypothèses précises surεt, considérés comme stationnaires. On pourra dans ce cas
considérer une estimation non-paramétrique de cette tendance. Plusieurs approches sont possibles.
Estimateur à noyaux
définitionon appelle noyau une fonctionK:Rd→Rtelle que?K2<∞et?K= 1définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On appelle estimateur à noyau def
associé à la fenêtrehet au noyauKla fonction?fhdéfinie par: fh(x) =? n t=1ytK(x-th n t=1K(x-thc"est une estimation non-paramétrique de la tendance de la série. La régularité de cet estimateur dépend de
hla taille de fenêtre du noyau. exemple de noyaux: •gaussien:K(x) = exp(-x2/)/2pi 7 •epanechnikovK(x) =34 •tricubeK(x) =7081 •logistiqueK(x) = 1/(exp(x) + 2 + exp(-x)) •quartic:K(x) =1516 •triweight!:K(x) =3532 0.0 0.2 0.4 gaussien x -3-2-10123 0.0 0.6 uniforme x -3-2-10123 0.0 0.6 triangle x -3-2-10123 0.0 0.4 epanechnikov x8 -3-2-10123 0.0 0.4 0.8 tricube x -3-2-10123 0.05 0.20 logistique x -3-2-10123 0.0 0.6 quartic x -3-2-10123 0.0 0.6 triweight xUne fonction permettant d"effectuer une régression à noyau en r estksmoothdu packagestatsdisponible
dans la distribution r de base.Un exemple d"utilisation sur les données de l"indice des prix à la consommation des ménages:noyau <-ksmooth(dataPRIX$time, dataPRIX$PrixConso,kernel = c("normal"),
bandwidth = 10 par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, noyau$y,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -noyau$y, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 92000200520102015
100105
110
115
120
125
Ind. Prix. Conso. Ménages (INSEE)
2000200520102015
-1.0 -0.5 0.0 0.5 1.0Ind. Prix. - detrendPolynômes locaux
définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On noteWt(x) =K(x-th n t=1K(x-th )(on ne fait pas apparaitre ici la dépendance àhpour simplifier).On appelle estimateur polynomial local de degréqdefassocié à la fenêtrehet au noyauKla fonction?fh
définie par: fh(x) =argminPn t=1W t(x)||yt-P(xt-x)||2 avecP(x) =?q j=0ajxjun polynôme de degrésq.Le principe est donc, pour chaque valeur dex(ici le temps car on estime une tendance ou une composante
périodique de la série), on estime une fonction polynômiale approximant le mieux les données localement, la
notion de voisinage dépendant encore dehla taille de fenêtre. Autrement formulé, il s"agit d"estimer sur les
données un développement limité de la fonctionf.On remarque que pourq= 0on retrouve l"estimateur à noyau précédant qui consiste à résoudre?n
t=1Wt(x)||yt-a||2.La fonction r implémentant les polynômes locaux est la fonctionloessdont voilà un exemple d"utilisation:lo <-loess(PrixConso ~time, data = dataPRIX, degree = 2 ,span = 0.7 )
plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col =quotesdbs_dbs46.pdfusesText_46[PDF] les composantes du système d'information marketing
[PDF] les composants d'un journal
[PDF] les composants d'un appareil photo
[PDF] les composants de lordinateur et leurs roles
[PDF] les composants de lordinateur pdf
[PDF] les composants de l'ordinateur wikipédia
[PDF] les composants de lunité centrale
[PDF] les composants de l'unité centrale d'un ordinateur
[PDF] les composants du laits et du fromage
[PDF] Les composants du prix
[PDF] Les composants électroniques
[PDF] les composants externes dun ordinateur
[PDF] les composants internes d'un ordinateur
[PDF] les comptes de la bécasse au champs