Introduction aux séries temporelles tendance et composante PDF

Chapitre 7: Séries chronologiques

Analyse d'une série chronologique. Estimation des composantes. Prédiction. Chapitre 7: Séries chronologiques. Arnaud Rousselle. GEA 1. Arnaud Rousselle.

Chapitre 1 : Généralités sur les séries chronologiques.

Définition : On appelle série chronologique ou chronique une suite (Yt) Dans un modèle additif on suppose que les 3 composantes : tendance

Séries Chronologiques

le mod`ele multiplicatif. La variable Xt s'écrit au terme d'erreur pr`es comme le produit de la tendance et d'une composante de saisonnalité :.

Introduction aux séries chronologiques

04-Nov-2007 Définition. La composante saisonnière ou mouvement saisonnier représente des effets périodiques de période connue p qui se reproduisent de façon ...

Modélisation et prévision Séries chronologiques - Séance 1

St périodique de période p. ?? éventuellement plusieurs composantes périodiques superposées. Exemple : comp. annuelle + comp. trimestrielle.

Introduction aux séries temporelles tendance et composante

Moyenne mobile La moyenne mobile est une méthode simple permettant d'extraire les composantes basses fréquences d'une série temporelle autrement dit sa tendance

Fiche technique Stat – 03 : Séries chronologiques tendances et

15-May-2010 Ce coefficient porte le nom de coefficient saisonnier. 3) Les composantes d'une série chronologique. Si on considère une fonction y = F(t) ...

Chapitre 5 :Série chronologique

b) Le mouvement saisonnier : cette composante notée ( ). s t

Séries chronologiques

On consid`ere qu'une série chronologique (Xt) est la résultante de différentes composantes fondamentales : 1 la tendance (ou trend) (Zt) représente

Séries chronologiques (avec R) (Cours et exercices)

06-Jan-2020 (3) Tester maintenant le lissage exponentiel de Holt-Winters avec composante saisonnière ad- ditive puis multiplicative (seulement pour les ...

Introduction aux séries temporelles, tendance et composante saisonnière

MAP-STA2 : Séries chronologiques

Yannig Goude

yannig.goude@ edf.fr

2015-2016

le temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d"échantillonnage. Par exemple, les

données du nombre de requétes google "rubgy world cup" par semaine (source h ttps://www.google.fr/trends/

2004200620082010201220142016

0 20 40
60
80
100

Nb Queries

la production horaire d"un panneau photovoltaïque, l"indice des prix à la consommation des ménages Français

(source INSEE: h ttp://www.insee.fr/fr/bases-de-donnees/ ) au pas mensuel, la consommation électrique

résidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France en

milliards d"euros depuis 1970 (sources: h ttps://www.data.gouv.fr/fr 1 oct. 03oct. 05oct. 07 0.0 0.4 0.8

Solar Production

2000200520102015

100
115

Ind. Prix (INSEE)

sept. 03sept. 13sept. 23 0.2 0.6

Consumption (kw)

19701980199020002010

0 150
Transac.ImmoDécomposition d"une série temporelle

L"objectif principal de l"analyse d"une série temporelle est la prévision de ses futures réalisations. Afin de

réaliser cet objectif, une premiére étape de modélisation de la série est nécessaire. Cette étape consiste à

sélectionner, parmi une famille de modèles correspondant à des approximations de la réalité, celui qui décrit

le mieux la série en question. Quelques exemples de modéles de série temporelle: •les lissages exponentiels

•les modéles de régression (régression linéaire, modéles non-paramétriques...)

•les modéles du type ARIMA •les modéles de données fonctionnelles Une série temporelleYtest communément décomposée en: •une tendanceTtcorrespondant à une évolution à long terme de la série, par exemple: -tendance linéaire:Tt=a+bt -tendance quadratique:Tt=a+bt+ct2 -tendance logarithmique:Tt=log(t)

•une saisonnalitéStcorrespondant à un phénoméne périodique de période identifiée

•une erreurεtqui est la partie aléatoire de la série (idéalement stationnaire) 2

On ajoute parfois une autre composante, le cycleCtqui correspond à un phénoméne répétitif régulier (donc

prévisible) de période inconnue ou changeante.

Cette décomposition peut-étre additiveYt=Tt+St+εtou multiplicativeYt=Tt?St?εt. Il est également

possible de combiner ces deux décompositions:Yt= (Tt+St)?εtouYt= (Tt?St) +εt...

Nous nous intéressons ici à la modélisation de la composante déterministe de la série:TtetSt.

Rq: un passage aulogpermet de se ramener à un modéle additif si le modéle étudié est totalement multiplicatif.

Exemple:

janv. 1900janv. 1950janv. 2000 0 2 4 6 8 janv. 1900janv. 1950janv. 2000 -5 0 5

10Modélisation de la partie déterministe

La tendance

Il existe différents procédés permettant d"anlyser puis/ou de corriger la tendance d"une série temporelle.

Moyenne mobile

La moyenne mobile est une méthode simple permettant d"extraire les composantes

basses fréquences d"une série temporelle autrement dit sa tendance. Elle est également connue comme une

méthode de lissage car elle agit comme un filtre passe bas et donc élimine le bruit.

Le calcul de la moyenne mobile dépend d"un paramètrelappelé la largeur de fenêtre. Ce paramétre correspond

au nombre d"observations inclues dans le calcul de la moyenne glissante éffectuée. Pluslest grand plus le

lissage est important (jusqu"à atteindre la fonction constante égale à la moyenne).

La moyenne mobile se calcule ainsi:

3 ?yt=12l+ 1t+l? i=t-ly t

Et en r, une des nombreuses alternatives est la fonctionfilter:MA<-filter(X,filter= array(1/10,dim=10),method = c("convolution"),

sides = 2 circular = FALSE

MA<-xts(MA,order.by=Date)

plot(X,type=?l?) lines(MA,col=?red?)janv. 1900janv. 1920janv. 1940janv. 1960janv. 1980janv. 2000 0 2 4 6 8 X

Remarquons que la moyenne mobile est un estimateur non-paramétrique de la tendance, au sens ou nous ne

supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale).

Différenciation

Pour nettoyer une série de sa tendance et/où de sa saisonnalité, nous pouvons procéder par différenciation. Celà fonctionne pour des séries à tendance polynomiale. NotonsΔl"opérateur de différenciation:Δyt=yt-yt-1. L"opérateur de différenciation d"ordrekcorrespondant est:Δkyt= Δ(Δk-1yt) Propositionsoit un processusytadmettant une tendance polynomiale d"ordrek: y t=k? j=0a jtj+εt 4 alors le processusΔytadmet une tendance polyomiale d"ordrek-1.

Preuveà faireIl en découle que pour éliminer une tendance polynomiale d"ordrekon peut effectuer une différenciation

d"ordrek.

La fonction permettant de différencier une série temporelle est la fonctiondiffdont voici un exemple

d"utilisation sur l"indice des prix à la consommation des ménages:par(mfrow =c(1,2 )) prix.ts <-ts(dataPRIX$PrixConso,frequency = 12 )

Acf(prix.ts,na.action = na.omit)

diff.prix.ts <-diff(prix.ts,lag = 1 ,differences = 1 )

Acf(diff.prix.ts,na.action = na.omit)

-0.2 0.2 0.4 0.6 0.8 1.0 Lag ACF

Series: prix.ts

1224
-0.2 0.0 0.2 0.4 0.6 Lag ACF

Series: diff.prix.ts

1224plot(prix.ts,col = "blue" )

plot(diff.prix.ts,col = "orangered2" ) 5 Time prix.ts 51015
100
105
110
115
120
125
Time diff.prix.ts 51015
-1.0 -0.5 0.0 0.5

1.0Estimation paramétrique de la tendance

Après avoir représenté la série, il est souvent possible d"inférer

une représentation paramétrique de sa tendance. Dans ce cas, on procède par régression (linéaire le plus

souvent mais potentiellent non-linéaire) pour estimer cette tendance. Par exemple, dans le cas d"un processusyadmettant une tendance polynomiale d"ordrek:yt=?k j=0ajtj+εt, un estimateur de la tendance pourra être obtenu ainsi: T=X?a ouXest la matrice dont les colonnes sont les vecteurs(1,...,tj)et: ?a= (X?X)-1X?Y avecY= (y1,...,yt)

En pratique, la fonctionlmounlmdans le cas non linéaire permet d"estimer ce type de tendance.time <-c(1:nrow(dataPRIX))

dataPRIX$time <- time reg <-lm(PrixConso ~time + I(time^2) +I(time^3),data = dataPRIX) par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, reg$fitted,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -reg$fitted, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 6

2000200520102015

100
105
110
115
120
125

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

-1 0 1 2 Ind. Prix. - detrendEstimation non-paramétique de la tendance Dans certains cas, une représentation paramétrique de la tendance n"est pas évidente. Le modèle sous-jacent à ce type de données est: y t=f(t) +εt

oùfest une fonctionrégulièresur laquelle on ne fait pas d"hypothèse paramétrique,t= 1,2,..,n. On ne

fait pour l"instant pas d"hypothèses précises surεt, considérés comme stationnaires. On pourra dans ce cas

considérer une estimation non-paramétrique de cette tendance. Plusieurs approches sont possibles.

Estimateur à noyaux

définitionon appelle noyau une fonctionK:Rd→Rtelle que?K2<∞et?K= 1

définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On appelle estimateur à noyau def

associé à la fenêtrehet au noyauKla fonction?fhdéfinie par: fh(x) =? n t=1ytK(x-th n t=1K(x-th

c"est une estimation non-paramétrique de la tendance de la série. La régularité de cet estimateur dépend de

hla taille de fenêtre du noyau. exemple de noyaux: •gaussien:K(x) = exp(-x2/)/2pi 7 •epanechnikovK(x) =34 •tricubeK(x) =7081 •logistiqueK(x) = 1/(exp(x) + 2 + exp(-x)) •quartic:K(x) =1516 •triweight!:K(x) =3532 0.0 0.2 0.4 gaussien x -3-2-10123 0.0 0.6 uniforme x -3-2-10123 0.0 0.6 triangle x -3-2-10123 0.0 0.4 epanechnikov x8 -3-2-10123 0.0 0.4 0.8 tricube x -3-2-10123 0.05 0.20 logistique x -3-2-10123 0.0 0.6 quartic x -3-2-10123 0.0 0.6 triweight x

Une fonction permettant d"effectuer une régression à noyau en r estksmoothdu packagestatsdisponible

dans la distribution r de base.

Un exemple d"utilisation sur les données de l"indice des prix à la consommation des ménages:noyau <-ksmooth(dataPRIX$time, dataPRIX$PrixConso,kernel = c("normal"),

bandwidth = 10 par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, noyau$y,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -noyau$y, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 9

2000200520102015

100
105
110
115
120
125

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

-1.0 -0.5 0.0 0.5 1.0

Ind. Prix. - detrendPolynômes locaux

définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On noteWt(x) =K(x-th n t=1K(x-th )(on ne fait pas apparaitre ici la dépendance àhpour simplifier).

On appelle estimateur polynomial local de degréqdefassocié à la fenêtrehet au noyauKla fonction?fh

définie par: fh(x) =argminPn t=1W t(x)||yt-P(xt-x)||2 avecP(x) =?q j=0ajxjun polynôme de degrésq.

Le principe est donc, pour chaque valeur dex(ici le temps car on estime une tendance ou une composante

périodique de la série), on estime une fonction polynômiale approximant le mieux les données localement, la

notion de voisinage dépendant encore dehla taille de fenêtre. Autrement formulé, il s"agit d"estimer sur les

données un développement limité de la fonctionf.

On remarque que pourq= 0on retrouve l"estimateur à noyau précédant qui consiste à résoudre?n

t=1Wt(x)||yt-a||2.

La fonction r implémentant les polynômes locaux est la fonctionloessdont voilà un exemple d"utilisation:lo <-loess(PrixConso ~time, data = dataPRIX, degree = 2 ,span = 0.7 )

plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col =quotesdbs_dbs46.pdfusesText_46

[PDF] Introduction aux séries temporelles tendance et composante

MAP-STA2 : Séries chronologiques

Yannig Goude

2015-2016

2004200620082010201220142016

Nb Queries

Solar Production

2000200520102015

Ind. Prix (INSEE)

Consumption (kw)

19701980199020002010

Exemple:

10Modélisation de la partie déterministe

La tendance

Moyenne mobile

La moyenne mobile se calcule ainsi:

MA<-xts(MA,order.by=Date)

Différenciation

Acf(prix.ts,na.action = na.omit)

Acf(diff.prix.ts,na.action = na.omit)

Series: prix.ts

Series: diff.prix.ts

1224plot(prix.ts,col = "blue" )

1.0Estimation paramétrique de la tendance

2000200520102015

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

Estimateur à noyaux

2000200520102015

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

Ind. Prix. - detrendPolynômes locaux