Introduction aux séries temporelles, tendance et composante

Les 3 composantes d’une série chronologique Le but de la décomposition d’une série chronologique est de distinguer dans l’évolution de la série, une tendance « générale », des variations saisonnières qui se répètent chaque année, et des

Chapitre 5 : séries chronologiques - Free

• Dans le as d’un ajustement linéaire, la tendance de longue période o tenue ne donne qu’une indiation générale et ne permet pas d’effetuer des prévisions pour une période préise d’une année à venir (semaine, mois, trimestre) lorsque la série chronologique fait apparaître des variations saisonnières

II- Les Séries Chronologiques

A- Définition B- Les composantes d’une série chronologique: La tendance à long terme ou Trend Le mouvement cyclique Les variations saisonnières Les variations résiduelles ou accidentelles

Chapitre 4 Les séries chronologiques

D ecomposition d’une s erie chronologique Di erentes composantes : II les variations saisonni eres Les variations saisonni eres : ce sont des pics ou des creux qui se r ep etent de cycle en cycle Ici le cycle est de un an, c-a-d 4 trimestres La fonction de saisonnalit e se note S(t) : 1 S() doit ^etre une fonction p eriodique

CHAPITRE IV Séries chronologiques

Les observations sont périodiques et la période est égale à 4 L’étude d’une série chronologique permet d’effectuer des prévisions, c’est-à-dire d’estimer des valeurs futures, xt non disponible, autrement dit pour t7 Dans notre exemple T 12, les valeurs xh12 ne sont pas disponibles h 1,2, Pour

Séries chronologiques (avec R - unicefr

Les TP se feront en R, les exemples de Remarque 1 7 On admet ensuite que si l’auto-corrélation d’une série est constante, c’est

Introduction aux séries chronologiques

Déﬁnition d’une série chronologique Déﬁnition de tendances Déﬁnition de composantes périodiques ou saisonnières Déﬁnition de la composante résiduelle Notation Quelques remarques Comme précédemment, nous allons d’abord donner une déﬁnition générale de la composante saisonnière Déﬁnition

Introduction aux séries temporelles, tendance et composante

MAP-STA2 : Séries chronologiques

Yannig Goude

yannig.goude@ edf.fr

2015-2016

le temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d"échantillonnage. Par exemple, les

données du nombre de requétes google "rubgy world cup" par semaine (source h ttps://www.google.fr/trends/

2004200620082010201220142016

0 20 40
60
80
100

Nb Queries

la production horaire d"un panneau photovoltaïque, l"indice des prix à la consommation des ménages Français

(source INSEE: h ttp://www.insee.fr/fr/bases-de-donnees/ ) au pas mensuel, la consommation électrique

résidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France en

milliards d"euros depuis 1970 (sources: h ttps://www.data.gouv.fr/fr 1 oct. 03oct. 05oct. 07 0.0 0.4 0.8

Solar Production

2000200520102015

100
115

Ind. Prix (INSEE)

sept. 03sept. 13sept. 23 0.2 0.6

Consumption (kw)

19701980199020002010

0 150
Transac.ImmoDécomposition d"une série temporelle

L"objectif principal de l"analyse d"une série temporelle est la prévision de ses futures réalisations. Afin de

réaliser cet objectif, une premiére étape de modélisation de la série est nécessaire. Cette étape consiste à

sélectionner, parmi une famille de modèles correspondant à des approximations de la réalité, celui qui décrit

le mieux la série en question. Quelques exemples de modéles de série temporelle: •les lissages exponentiels

•les modéles de régression (régression linéaire, modéles non-paramétriques...)

•les modéles du type ARIMA •les modéles de données fonctionnelles Une série temporelleYtest communément décomposée en: •une tendanceTtcorrespondant à une évolution à long terme de la série, par exemple: -tendance linéaire:Tt=a+bt -tendance quadratique:Tt=a+bt+ct2 -tendance logarithmique:Tt=log(t)

•une saisonnalitéStcorrespondant à un phénoméne périodique de période identifiée

•une erreurεtqui est la partie aléatoire de la série (idéalement stationnaire) 2

On ajoute parfois une autre composante, le cycleCtqui correspond à un phénoméne répétitif régulier (donc

prévisible) de période inconnue ou changeante.

Cette décomposition peut-étre additiveYt=Tt+St+εtou multiplicativeYt=Tt?St?εt. Il est également

possible de combiner ces deux décompositions:Yt= (Tt+St)?εtouYt= (Tt?St) +εt...

Nous nous intéressons ici à la modélisation de la composante déterministe de la série:TtetSt.

Rq: un passage aulogpermet de se ramener à un modéle additif si le modéle étudié est totalement multiplicatif.

Exemple:

janv. 1900janv. 1950janv. 2000 0 2 4 6 8 janv. 1900janv. 1950janv. 2000 -5 0 5

10Modélisation de la partie déterministe

La tendance

Il existe différents procédés permettant d"anlyser puis/ou de corriger la tendance d"une série temporelle.

Moyenne mobile

La moyenne mobile est une méthode simple permettant d"extraire les composantes

basses fréquences d"une série temporelle autrement dit sa tendance. Elle est également connue comme une

méthode de lissage car elle agit comme un filtre passe bas et donc élimine le bruit.

Le calcul de la moyenne mobile dépend d"un paramètrelappelé la largeur de fenêtre. Ce paramétre correspond

au nombre d"observations inclues dans le calcul de la moyenne glissante éffectuée. Pluslest grand plus le

lissage est important (jusqu"à atteindre la fonction constante égale à la moyenne).

La moyenne mobile se calcule ainsi:

3 ?yt=12l+ 1t+l? i=t-ly t

Et en r, une des nombreuses alternatives est la fonctionfilter:MA<-filter(X,filter= array(1/10,dim=10),method = c("convolution"),

sides = 2 circular = FALSE

MA<-xts(MA,order.by=Date)

plot(X,type=?l?) lines(MA,col=?red?)janv. 1900janv. 1920janv. 1940janv. 1960janv. 1980janv. 2000 0 2 4 6 8 X

Remarquons que la moyenne mobile est un estimateur non-paramétrique de la tendance, au sens ou nous ne

supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale).

Différenciation

Pour nettoyer une série de sa tendance et/où de sa saisonnalité, nous pouvons procéder par différenciation. Celà fonctionne pour des séries à tendance polynomiale. NotonsΔl"opérateur de différenciation:Δyt=yt-yt-1. L"opérateur de différenciation d"ordrekcorrespondant est:Δkyt= Δ(Δk-1yt) Propositionsoit un processusytadmettant une tendance polynomiale d"ordrek: y t=k? j=0a jtj+εt 4 alors le processusΔytadmet une tendance polyomiale d"ordrek-1.

Preuveà faireIl en découle que pour éliminer une tendance polynomiale d"ordrekon peut effectuer une différenciation

d"ordrek.

La fonction permettant de différencier une série temporelle est la fonctiondiffdont voici un exemple

d"utilisation sur l"indice des prix à la consommation des ménages:par(mfrow =c(1,2 )) prix.ts <-ts(dataPRIX$PrixConso,frequency = 12 )

Acf(prix.ts,na.action = na.omit)

diff.prix.ts <-diff(prix.ts,lag = 1 ,differences = 1 )

Acf(diff.prix.ts,na.action = na.omit)

-0.2 0.2 0.4 0.6 0.8 1.0 Lag ACF

Series: prix.ts

1224
-0.2 0.0 0.2 0.4 0.6 Lag ACF

Series: diff.prix.ts

1224plot(prix.ts,col = "blue" )

plot(diff.prix.ts,col = "orangered2" ) 5 Time prix.ts 51015
100
105
110
115
120
125
Time diff.prix.ts 51015
-1.0 -0.5 0.0 0.5

1.0Estimation paramétrique de la tendance

Après avoir représenté la série, il est souvent possible d"inférer

une représentation paramétrique de sa tendance. Dans ce cas, on procède par régression (linéaire le plus

souvent mais potentiellent non-linéaire) pour estimer cette tendance. Par exemple, dans le cas d"un processusyadmettant une tendance polynomiale d"ordrek:yt=?k j=0ajtj+εt, un estimateur de la tendance pourra être obtenu ainsi: T=X?a ouXest la matrice dont les colonnes sont les vecteurs(1,...,tj)et: ?a= (X?X)-1X?Y avecY= (y1,...,yt)

En pratique, la fonctionlmounlmdans le cas non linéaire permet d"estimer ce type de tendance.time <-c(1:nrow(dataPRIX))

dataPRIX$time <- time reg <-lm(PrixConso ~time + I(time^2) +I(time^3),data = dataPRIX) par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, reg$fitted,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -reg$fitted, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 6

2000200520102015

100
105
110
115
120
125

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

-1 0 1 2 Ind. Prix. - detrendEstimation non-paramétique de la tendance Dans certains cas, une représentation paramétrique de la tendance n"est pas évidente. Le modèle sous-jacent à ce type de données est: y t=f(t) +εt

oùfest une fonctionrégulièresur laquelle on ne fait pas d"hypothèse paramétrique,t= 1,2,..,n. On ne

fait pour l"instant pas d"hypothèses précises surεt, considérés comme stationnaires. On pourra dans ce cas

considérer une estimation non-paramétrique de cette tendance. Plusieurs approches sont possibles.

Estimateur à noyaux

définitionon appelle noyau une fonctionK:Rd→Rtelle que?K2<∞et?K= 1

définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On appelle estimateur à noyau def

associé à la fenêtrehet au noyauKla fonction?fhdéfinie par: fh(x) =? n t=1ytK(x-th n t=1K(x-th

c"est une estimation non-paramétrique de la tendance de la série. La régularité de cet estimateur dépend de

hla taille de fenêtre du noyau. exemple de noyaux: •gaussien:K(x) = exp(-x2/)/2pi 7 •epanechnikovK(x) =34 •tricubeK(x) =7081 •logistiqueK(x) = 1/(exp(x) + 2 + exp(-x)) •quartic:K(x) =1516 •triweight!:K(x) =3532 0.0 0.2 0.4 gaussien x -3-2-10123 0.0 0.6 uniforme x -3-2-10123 0.0 0.6 triangle x -3-2-10123 0.0 0.4 epanechnikov x8 -3-2-10123 0.0 0.4 0.8 tricube x -3-2-10123 0.05 0.20 logistique x -3-2-10123 0.0 0.6 quartic x -3-2-10123 0.0 0.6 triweight x

Une fonction permettant d"effectuer une régression à noyau en r estksmoothdu packagestatsdisponible

dans la distribution r de base.

Un exemple d"utilisation sur les données de l"indice des prix à la consommation des ménages:noyau <-ksmooth(dataPRIX$time, dataPRIX$PrixConso,kernel = c("normal"),

bandwidth = 10 par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, noyau$y,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -noyau$y, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 9

2000200520102015

100
105
110
115
120
125

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

-1.0 -0.5 0.0 0.5 1.0

Ind. Prix. - detrendPolynômes locaux

définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On noteWt(x) =K(x-th n t=1K(x-th )(on ne fait pas apparaitre ici la dépendance àhpour simplifier).

On appelle estimateur polynomial local de degréqdefassocié à la fenêtrehet au noyauKla fonction?fh

définie par: fh(x) =argminPn t=1W t(x)||yt-P(xt-x)||2 avecP(x) =?q j=0ajxjun polynôme de degrésq.

Le principe est donc, pour chaque valeur dex(ici le temps car on estime une tendance ou une composante

périodique de la série), on estime une fonction polynômiale approximant le mieux les données localement, la

notion de voisinage dépendant encore dehla taille de fenêtre. Autrement formulé, il s"agit d"estimer sur les

données un développement limité de la fonctionf.

On remarque que pourq= 0on retrouve l"estimateur à noyau précédant qui consiste à résoudre?n

t=1Wt(x)||yt-a||2.

La fonction r implémentant les polynômes locaux est la fonctionloessdont voilà un exemple d"utilisation:lo <-loess(PrixConso ~time, data = dataPRIX, degree = 2 ,span = 0.7 )

plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col =quotesdbs_dbs46.pdfusesText_46

[PDF] Introduction aux séries temporelles, tendance et composante

I Présentation d’une série chronologique

Chapitre 5 : séries chronologiques - Free

II- Les Séries Chronologiques

Chapitre 4 Les séries chronologiques

CHAPITRE IV Séries chronologiques

Séries chronologiques (avec R - unicefr

Introduction aux séries chronologiques

Introduction aux séries temporelles, tendance et composante

MAP-STA2 : Séries chronologiques

Yannig Goude

2015-2016

2004200620082010201220142016

Nb Queries

Solar Production

2000200520102015

Ind. Prix (INSEE)

Consumption (kw)

19701980199020002010

Exemple:

10Modélisation de la partie déterministe

La tendance

Moyenne mobile

La moyenne mobile se calcule ainsi:

MA<-xts(MA,order.by=Date)

Différenciation

Acf(prix.ts,na.action = na.omit)

Acf(diff.prix.ts,na.action = na.omit)

Series: prix.ts

Series: diff.prix.ts

1224plot(prix.ts,col = "blue" )

1.0Estimation paramétrique de la tendance

2000200520102015

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

Estimateur à noyaux

2000200520102015

Ind. Prix. Conso. Ménages (INSEE)

2000200520102015

Ind. Prix. - detrendPolynômes locaux