I Présentation d’une série chronologique
Les 3 composantes d’une série chronologique Le but de la décomposition d’une série chronologique est de distinguer dans l’évolution de la série, une tendance « générale », des variations saisonnières qui se répètent chaque année, et des
Chapitre 5 : séries chronologiques - Free
• Dans le as d’un ajustement linéaire, la tendance de longue période o tenue ne donne qu’une indiation générale et ne permet pas d’effetuer des prévisions pour une période préise d’une année à venir (semaine, mois, trimestre) lorsque la série chronologique fait apparaître des variations saisonnières
II- Les Séries Chronologiques
A- Définition B- Les composantes d’une série chronologique: La tendance à long terme ou Trend Le mouvement cyclique Les variations saisonnières Les variations résiduelles ou accidentelles
Chapitre 4 Les séries chronologiques
D ecomposition d’une s erie chronologique Di erentes composantes : II les variations saisonni eres Les variations saisonni eres : ce sont des pics ou des creux qui se r ep etent de cycle en cycle Ici le cycle est de un an, c-a-d 4 trimestres La fonction de saisonnalit e se note S(t) : 1 S() doit ^etre une fonction p eriodique
CHAPITRE IV Séries chronologiques
Les observations sont périodiques et la période est égale à 4 L’étude d’une série chronologique permet d’effectuer des prévisions, c’est-à-dire d’estimer des valeurs futures, xt non disponible, autrement dit pour t7 Dans notre exemple T 12, les valeurs xh12 ne sont pas disponibles h 1,2, Pour
Séries chronologiques (avec R - unicefr
Les TP se feront en R, les exemples de Remarque 1 7 On admet ensuite que si l’auto-corrélation d’une série est constante, c’est
Introduction aux séries chronologiques
Définition d’une série chronologique Définition de tendances Définition de composantes périodiques ou saisonnières Définition de la composante résiduelle Notation Quelques remarques Comme précédemment, nous allons d’abord donner une définition générale de la composante saisonnière Définition
[PDF] les composantes du système d'information marketing
[PDF] les composants d'un journal
[PDF] les composants d'un appareil photo
[PDF] les composants de l'ordinateur et leurs roles
[PDF] les composants de l'ordinateur pdf
[PDF] les composants de l'ordinateur wikipédia
[PDF] les composants de l'unité centrale
[PDF] les composants de l'unité centrale d'un ordinateur
[PDF] les composants du laits et du fromage
[PDF] Les composants du prix
[PDF] Les composants électroniques
[PDF] les composants externes d'un ordinateur
[PDF] les composants internes d'un ordinateur
[PDF] les comptes de la bécasse au champs
Introduction aux séries temporelles, tendance et composante saisonnière
MAP-STA2 : Séries chronologiques
Yannig Goude
yannig.goude@ edf.fr2015-2016
le temps. Ce temps est mesuré à une fréquence donnée, appelée fréquence d"échantillonnage. Par exemple, les
données du nombre de requétes google "rubgy world cup" par semaine (source h ttps://www.google.fr/trends/2004200620082010201220142016
0 20 4060
80
100
Nb Queries
la production horaire d"un panneau photovoltaïque, l"indice des prix à la consommation des ménages Français
(source INSEE: h ttp://www.insee.fr/fr/bases-de-donnees/ ) au pas mensuel, la consommation électriquerésidentielle moyenne en Irlande au pas demi-horaire, les montants de transactions immobilières en France en
milliards d"euros depuis 1970 (sources: h ttps://www.data.gouv.fr/fr 1 oct. 03oct. 05oct. 07 0.0 0.4 0.8Solar Production
2000200520102015
100115
Ind. Prix (INSEE)
sept. 03sept. 13sept. 23 0.2 0.6Consumption (kw)
19701980199020002010
0 150Transac.ImmoDécomposition d"une série temporelle
L"objectif principal de l"analyse d"une série temporelle est la prévision de ses futures réalisations. Afin de
réaliser cet objectif, une premiére étape de modélisation de la série est nécessaire. Cette étape consiste à
sélectionner, parmi une famille de modèles correspondant à des approximations de la réalité, celui qui décrit
le mieux la série en question. Quelques exemples de modéles de série temporelle: •les lissages exponentiels•les modéles de régression (régression linéaire, modéles non-paramétriques...)
•les modéles du type ARIMA •les modéles de données fonctionnelles Une série temporelleYtest communément décomposée en: •une tendanceTtcorrespondant à une évolution à long terme de la série, par exemple: -tendance linéaire:Tt=a+bt -tendance quadratique:Tt=a+bt+ct2 -tendance logarithmique:Tt=log(t)•une saisonnalitéStcorrespondant à un phénoméne périodique de période identifiée
•une erreurεtqui est la partie aléatoire de la série (idéalement stationnaire) 2On ajoute parfois une autre composante, le cycleCtqui correspond à un phénoméne répétitif régulier (donc
prévisible) de période inconnue ou changeante.Cette décomposition peut-étre additiveYt=Tt+St+εtou multiplicativeYt=Tt?St?εt. Il est également
possible de combiner ces deux décompositions:Yt= (Tt+St)?εtouYt= (Tt?St) +εt...Nous nous intéressons ici à la modélisation de la composante déterministe de la série:TtetSt.
Rq: un passage aulogpermet de se ramener à un modéle additif si le modéle étudié est totalement multiplicatif.
Exemple:
janv. 1900janv. 1950janv. 2000 0 2 4 6 8 janv. 1900janv. 1950janv. 2000 -5 0 510Modélisation de la partie déterministe
La tendance
Il existe différents procédés permettant d"anlyser puis/ou de corriger la tendance d"une série temporelle.
Moyenne mobile
La moyenne mobile est une méthode simple permettant d"extraire les composantesbasses fréquences d"une série temporelle autrement dit sa tendance. Elle est également connue comme une
méthode de lissage car elle agit comme un filtre passe bas et donc élimine le bruit.Le calcul de la moyenne mobile dépend d"un paramètrelappelé la largeur de fenêtre. Ce paramétre correspond
au nombre d"observations inclues dans le calcul de la moyenne glissante éffectuée. Pluslest grand plus le
lissage est important (jusqu"à atteindre la fonction constante égale à la moyenne).La moyenne mobile se calcule ainsi:
3 ?yt=12l+ 1t+l? i=t-ly tEt en r, une des nombreuses alternatives est la fonctionfilter:MA<-filter(X,filter= array(1/10,dim=10),method = c("convolution"),
sides = 2 circular = FALSEMA<-xts(MA,order.by=Date)
plot(X,type=?l?) lines(MA,col=?red?)janv. 1900janv. 1920janv. 1940janv. 1960janv. 1980janv. 2000 0 2 4 6 8 XRemarquons que la moyenne mobile est un estimateur non-paramétrique de la tendance, au sens ou nous ne
supposons pas de structure a-priori de cette tendance (par ex. linéaire ou polynomiale).Différenciation
Pour nettoyer une série de sa tendance et/où de sa saisonnalité, nous pouvons procéder par différenciation. Celà fonctionne pour des séries à tendance polynomiale. NotonsΔl"opérateur de différenciation:Δyt=yt-yt-1. L"opérateur de différenciation d"ordrekcorrespondant est:Δkyt= Δ(Δk-1yt) Propositionsoit un processusytadmettant une tendance polynomiale d"ordrek: y t=k? j=0a jtj+εt 4 alors le processusΔytadmet une tendance polyomiale d"ordrek-1.Preuveà faireIl en découle que pour éliminer une tendance polynomiale d"ordrekon peut effectuer une différenciation
d"ordrek.La fonction permettant de différencier une série temporelle est la fonctiondiffdont voici un exemple
d"utilisation sur l"indice des prix à la consommation des ménages:par(mfrow =c(1,2 )) prix.ts <-ts(dataPRIX$PrixConso,frequency = 12 )Acf(prix.ts,na.action = na.omit)
diff.prix.ts <-diff(prix.ts,lag = 1 ,differences = 1 )Acf(diff.prix.ts,na.action = na.omit)
-0.2 0.2 0.4 0.6 0.8 1.0 Lag ACFSeries: prix.ts
1224-0.2 0.0 0.2 0.4 0.6 Lag ACF
Series: diff.prix.ts
1224plot(prix.ts,col = "blue" )
plot(diff.prix.ts,col = "orangered2" ) 5 Time prix.ts 51015100
105
110
115
120
125
Time diff.prix.ts 51015
-1.0 -0.5 0.0 0.5
1.0Estimation paramétrique de la tendance
Après avoir représenté la série, il est souvent possible d"inférerune représentation paramétrique de sa tendance. Dans ce cas, on procède par régression (linéaire le plus
souvent mais potentiellent non-linéaire) pour estimer cette tendance. Par exemple, dans le cas d"un processusyadmettant une tendance polynomiale d"ordrek:yt=?k j=0ajtj+εt, un estimateur de la tendance pourra être obtenu ainsi: T=X?a ouXest la matrice dont les colonnes sont les vecteurs(1,...,tj)et: ?a= (X?X)-1X?Y avecY= (y1,...,yt)En pratique, la fonctionlmounlmdans le cas non linéaire permet d"estimer ce type de tendance.time <-c(1:nrow(dataPRIX))
dataPRIX$time <- time reg <-lm(PrixConso ~time + I(time^2) +I(time^3),data = dataPRIX) par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, reg$fitted,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -reg$fitted, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 62000200520102015
100105
110
115
120
125
Ind. Prix. Conso. Ménages (INSEE)
2000200520102015
-1 0 1 2 Ind. Prix. - detrendEstimation non-paramétique de la tendance Dans certains cas, une représentation paramétrique de la tendance n"est pas évidente. Le modèle sous-jacent à ce type de données est: y t=f(t) +εtoùfest une fonctionrégulièresur laquelle on ne fait pas d"hypothèse paramétrique,t= 1,2,..,n. On ne
fait pour l"instant pas d"hypothèses précises surεt, considérés comme stationnaires. On pourra dans ce cas
considérer une estimation non-paramétrique de cette tendance. Plusieurs approches sont possibles.
Estimateur à noyaux
définitionon appelle noyau une fonctionK:Rd→Rtelle que?K2<∞et?K= 1définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On appelle estimateur à noyau def
associé à la fenêtrehet au noyauKla fonction?fhdéfinie par: fh(x) =? n t=1ytK(x-th n t=1K(x-thc"est une estimation non-paramétrique de la tendance de la série. La régularité de cet estimateur dépend de
hla taille de fenêtre du noyau. exemple de noyaux: •gaussien:K(x) = exp(-x2/)/2pi 7 •epanechnikovK(x) =34 •tricubeK(x) =7081 •logistiqueK(x) = 1/(exp(x) + 2 + exp(-x)) •quartic:K(x) =1516 •triweight!:K(x) =3532 0.0 0.2 0.4 gaussien x -3-2-10123 0.0 0.6 uniforme x -3-2-10123 0.0 0.6 triangle x -3-2-10123 0.0 0.4 epanechnikov x8 -3-2-10123 0.0 0.4 0.8 tricube x -3-2-10123 0.05 0.20 logistique x -3-2-10123 0.0 0.6 quartic x -3-2-10123 0.0 0.6 triweight xUne fonction permettant d"effectuer une régression à noyau en r estksmoothdu packagestatsdisponible
dans la distribution r de base.Un exemple d"utilisation sur les données de l"indice des prix à la consommation des ménages:noyau <-ksmooth(dataPRIX$time, dataPRIX$PrixConso,kernel = c("normal"),
bandwidth = 10 par(mfrow =c(1,2 )) plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col = "blue" lines(dataPRIX$Date, noyau$y,col = "red" ,lwd = 2 ) plot(dataPRIX$Date, dataPRIX$PrixConso -noyau$y, type = "l" , xlab = ylab = "Ind. Prix. - detrend" col = "orangered2" 92000200520102015
100105
110
115
120
125
Ind. Prix. Conso. Ménages (INSEE)
2000200520102015
-1.0 -0.5 0.0 0.5 1.0Ind. Prix. - detrendPolynômes locaux
définitionsoit un réelh >0(paramètre de fenêtre), soit un noyauK. On noteWt(x) =K(x-th n t=1K(x-th )(on ne fait pas apparaitre ici la dépendance àhpour simplifier).On appelle estimateur polynomial local de degréqdefassocié à la fenêtrehet au noyauKla fonction?fh
définie par: fh(x) =argminPn t=1W t(x)||yt-P(xt-x)||2 avecP(x) =?q j=0ajxjun polynôme de degrésq.Le principe est donc, pour chaque valeur dex(ici le temps car on estime une tendance ou une composante
périodique de la série), on estime une fonction polynômiale approximant le mieux les données localement, la
notion de voisinage dépendant encore dehla taille de fenêtre. Autrement formulé, il s"agit d"estimer sur les
données un développement limité de la fonctionf.On remarque que pourq= 0on retrouve l"estimateur à noyau précédant qui consiste à résoudre?n
t=1Wt(x)||yt-a||2.La fonction r implémentant les polynômes locaux est la fonctionloessdont voilà un exemple d"utilisation:lo <-loess(PrixConso ~time, data = dataPRIX, degree = 2 ,span = 0.7 )
plot(dataPRIX$Date, dataPRIX$PrixConso,type = "l" ,xlab = "" , ylab = "Ind. Prix. Conso. Ménages (INSEE)" col =quotesdbs_dbs46.pdfusesText_46