Samenvatting Statistiek 2de Lic. An Arima model building strategy



Dovnload 50.75 Kb.
Datum20.08.2016
Grootte50.75 Kb.
Samenvatting Statistiek 2de Lic.


  1. An ARIMA model building strategy.






  1. VRM

De VRM geeft aan hoeveel maal we seizoenaal en niet-seizoenaal moeten differentiëren. De laagste waarde in de Variance Reduction Matrix geeft weer hoeveel maal we moeten differentiëren.




  1. SMP

De SMP (Standard deviation Mean Plot) geeft de relatie weer tussen de standaarddeviatie en het gemiddelde van de reeks. Wanneer er een duidelijke positieve/negatieve relatie bestaat tussen deze twee factoren, is aan de tweede voorwaarde van stationariteit (zie later) niet voldaan. Deze gaat ervan uit dat de standaardfouten constanten zijn, en dit is bij een relatie niet het geval. Indien Lambda ( 1 – R²) zou gelijk zijn aan nul, dan kan via een eenvoudige logaritmische functie, dit probleem worden verholpen. Dit zou ons moeten toelaten een reeks te bekomen die aan deze tweede voorwaarde voldoet. De SMP geeft eveneens de Lambda, die we moeten veranderen wanneer deze een andere waarde als 1 aangeeft. Lambda ligt normaal gezien tussen 2 en –2. Bij een zeer hoge Lambda stellen we ze in op 1.

De SMP is er om heteroskedasticiteit op te sporen, en om een geschikte transformatie te vinden zodat de tijdreeks homoskedastisch wordt. De ideale waarde van de Lambda zou tussen de –2 en 2 moeten liggen. Om stationariteit te bekomen zouden we onze tijdreeks tot de macht Lambda moeten verheffen.


  1. Stationariteit.

Wanneer een reeks stationair is, moet ze voldoen aan twee voorwaarden:



  • Eerste voorwaarde: de tijdreeks mag niet geïntegreerd zijn. Dit wil zeggen dat de ACF (Auto Correlation Function) geen langzaam dalende

    • niet-seizoenale autocorrelatiecoëfficiënten (at lags 1,2,3,…)

    • seizoenale autocorrelatiecoëfficiënten (at lags s,2s,3s,…)

mag bevatten.

Dit impliceert eveneens dat:



    • het spectrum geen aanwijzing geeft van (sterke) cyclische golven van lage frequency (lange periodes)

    • het spectrum geen (sterke) cyclische golven van van seizoenale frequency vertoont (of periodes s,2s,3s,… met s = seizoenale periode, meestal 12)

  • Tweede voorwaarde: de meest waarschijnlijke verandering door toeval is constant over de tijd. Dit betekent een constante standaardfout over de ganse tijdreeks. Deze conditie is nodig om makkelijk te kunnen differentiëren tussen veranderingen te wijten aan toeval, en veranderingen die toegeschreven kunnen worden aan exogene factoren.




  1. Spectrum

Het spectrum realteert de intesiteit (= amplitude in %) van onafhankelijke cyclische golven die aanwezig zijn in de tijdreeks, ten opzichte van hun frequenties (= 1 / lengte van cyclische golf). Het spectrum kan geïnterpreteerd worden als een vingerafdruk van de tijdreeks, en het geeft de lezer de mogelijkheid de sterkste (lees: meest belangrijke) cyclische golven van de tijdreeks te onderscheiden. Op het spectrum onderscheiden we verschillende cyclische golven. De aanwezigheid van verschillende golven doet het vermoeden rijzen dat er sprake is van autocorrelatie (systematische over- en onderwaardering).




  1. Cumulatief periodogram.

Het CP relateert de cumulatieve intensiteit van de cyclische golven die in de tijdreeks aanwezig zijn t.o.v. hun periode (= lengte van de cyclische golf). Het begin van de CP geeft de lange termijn-golf weer, de rechterzijde de korte termijn-golf. Wanneer het periodogram zich links buiten het Kolmogorov-Smirnov interval bevind, kunnen we besluiten dat er een zekere systematiek in de tijdreeks aanwezig is, en de lange termijntrends een belangrijke impact hebben op de tijdreeks. Een duidelijke trapfunctie is eveneens typisch voor een seizoenstrend.



  1. ACF.

Het ACF geeft de reeks waarden die overeenstemmen tot de correlatie van de tijdreeks en zijn eigen verleden. Dus:



  • Eerste waarde = correlatie tussen Yt en Yt-1

  • Tweede waarde = correlatie tussen Yt en Yt-2

  • Derde waarde = correlatie tussen Yt en Yt-3



De ACF kent enkele typische patronen waardoor we makkelijk een AR of een MA-proces kunnen vaststellen. Voor een AR proces kijken we naar de ACF. Wanneer deze een typisch patroon omvat voor een AR-proces gaan we kijken naar de PACF om de orde te bepalen. Daar moeten we kijken naar hoeveel staafjes er buiten het betrouwbaarheidsinterval liggen. Typische patronen zien we op onderstaande afbeeldingen. Voor een AR(1) proces zijn typisch een exponentieel dalend of convergerend verloop. Voor een AR(2) proces zijn de typische patronen dezelfde exponentieel stijgende of convergerende verlopen en een oscillerend verloop. Dit is voor de orde p (niet-seizoenaal AR-proces). Voor de seizoenale waarde (P) kijken we gewoon naar de groene staafjes, op analoge wijze. Bij een patroon is een seizoenaal AR-proces aanwezig wanneer een groen staafje op de PACF buiten het BI ligt.
AR(1):



AR(2):


Voor een MA proces te vinden draaien we de rollen om. Hier kijken we eerst naar de PACF. Dit is de partiële ACF, die alle coëfficiënten onafhankelijk van elkaar weergeeft. Wanneer de PACF een typisch patroon weergeeft moeten we gaan kijken op de ACF of er staafjes buiten het BI liggen. De hoeveelheid geeft de orde van het MA-proces weer. Voor het seizoenale MA-proces moeten we wederom kijken naar de groene staafjes. De seizoenale MA krijgt de letter Q toegekend, de niet-seizoenale de letter q.



MA(1) en MA(2):



MA(2) :

We moeten wel opletten, dit zijn ideale patronen waar geen ruis op zit. We moeten de bekomen (P)ACFs een beetje subjectief bekijken om er de patronen uit te halen.


Wanneer we de waarden voor p, P, q en Q gevonden hebben kunnen we een voorlopige equatie opstellen. Een voorbeeld van zulke equatie is:


3 1 2 1

( 1-∑ i Bi ) ( 1-∑ ФiBis ) Wt = ( 1-∑ iBi ) ( 1-∑ ΘiBis ) et



i=1 i=1 i=1 i=1

met Wt = dsDYt


3 1 2 1

( 1-∑ i Bi ) ( 1-∑ ФiBis ) dsDYt = ( 1-∑ iBi ) ( 1-∑ ΘiBis ) et



i=1 i=1 i=1 i=1

voor p = 3, P = 1, q = 2, Q = 1 (dit is een fictief voorbeeld)




  1. Estimate.

Bij een schatting van ons model met de gekende waarden van het ARMA-proces gaan we na welke waarden we daadwerkelijk moeten invullen op de plaatsen van , Ф,  en Θ. Bij deze estimate kunnen we eveneens zien of de waarden van het ARMA-proces wel correct zijn. Soms geeft deze estimate (bijvoorbeeld) de melding: “AR(2) is not significant different from zero”. Het is nu onze taak te herschatten, totdat alle waarden significant verschillen van nul. Bij de estimate moeten we ook L, d en D zo instellen zodat onze reeks stationair wordt.

Het doel van de estimate en forecast is het opstellen van een vergelijking, zodoende adequate prognoses omtrent de tijdreeks te kunnen maken. Alvorens dit te kunnen doen, moesten we de eventuele aanwezigheid van ARMA-processen opsporen. Aan de hand van deze ARMA-processen, de λ-transformatie, en de juiste graad van niet-seizoenale (d) en seizoenale differentiatie (D) wordt er een model geschat dat ervoor zorgt dat de SSR (Sum of Squared Residuals) worden geminimaliseerd, door manipulatie van de parameters , Ф,  en Θ.

Bij de output van de estimate zijn er enkele resultaten die geëvalueerd moeten worden:



  • Backforecasts: het is van primordiaal belang dat de gegenereerde backforecasts convergeren naar nul, en dit om niet-vertekende geschatte parameters te verkrijgen. Indien de backforecasts niet zouden convergeren naar nul, dan waren de gegenereerde geschatte parameters vertekend, waardoor inadequate voorspellingen zouden kunnen worden gemaakt. Het doel van backforecasting is het genereren van vroegere observaties, zodoende mogelijke gebrekkigheden van de gehanteerde tijdreeks aan het licht te brengen.

  • First roots of ARMA polynomials: de absolute waarde van de ‘first roots of ARMA polynomials’ moet groter zijn dan 1, hetgeen wijst op de convergentie van de backforecasts. Indien deze waarde (in absolute waarde) kleiner zou zijn dan 1, dan zouden de backforecasts divergeren. Het effect hiervan op de gemaakte prognoses werd reeds eerder verklaard. Daar de absolute waarde van de ‘first roots of ARMA polynomials’ groter is dan één, mogen we stellen dat aan de voorwaarden van stability en invertibility is voldaan!

  • Correlatiematrix: Aan de hand van de correlatiematrix zouden we de eventuele aanwezigheid van multicollineariteit kunnen opsporen. Multicollineariteit ontstaat immers wanneer twee of meerdere regressoren (parameters) onderling een sterke lineaire afhankelijkheid vertonen. De aanwezigheid van hoge multicollineariteit leidt tot grote standaardfouten, waardoor de geschatte parameterwaarden minder precies zijn. Multicollineariteit zorgt tevens voor lage t-statistieken, en gaat vaak gepaard met zeer hoge R² waarden. Ondanks de aanwezigheid van multicollineariteit blijven de schatters consistent, efficiënt en onvertekend. Het is dus belangrijk lage correlatiecoëfficiënten te hebben in deze correlatiematrix.

  • # e[t] > 0 en het # e[t] < 0: Het # e[t] > 0 en het # e[t] < 0 moeten min of meer aan elkaar gelijk zijn. Het gemiddelde van de residu’s moet daarenboven min of meer gelijk zijn aan nul, dit is wanneer de absolute waarde van de bijhorende t-statistiek kleiner is dan twee. De parameterwaarde van ‘Mean of e[t]’ maakt in feite niet veel uit, daar deze is uitgedrukt in eenheden, niet in procenten!

  • G-statistiek: De G-statistiek (G = Gain) mag niet gelijk zijn aan nul. Wanneer deze kleiner is dan 1 en groter dan nul wijst dit op een stabiel model. Wanneer de G kleiner zou zijn dan nul zou dit wijzen op een instabiel model.

  • Determinatiecoëfficiënt [R²]: Stel dat de determinatiecoëfficiënt [R²] gelijk is aan 0,70. Dit betekent dat 70% van de variantie van de tijdreeks kan verklaard worden, door gebruik te maken van dit wiskundig model. Dit voorbeeld is een goed cijfer.

Aan de hand van deze verschillende onderzochte statistieken, kunnen we besluiten dat deze tijdreeks wel of geen fundamentele gebrekkigheden vertoont. Bijgevolg kunnen we stellen dat als er geen fundamentele gebrekkigheden zijn, we aan de hand van dit geschatte model, adequate prognoses kunnen maken.

Nu kunnen we een expliciete equatie opmaken. Een voorbeeld hiervan is:



Aan de hand van deze equatie kunnen we duidelijk determineren dat een MA(1) proces kan geschreven worden als een oneindig AR-proces.

explicit equation in terms of stochastic innovations:

Bij bekomen waarden van:

Een ander voorbeeld is:



explicit forecasting function:

en:


explicit equation in terms of stochastic innovations:

Bij de bekomen waarden van:


Zoals duidelijk blijkt uit bovenstaande equaties is de hele tijdreeks verantwoordelijk voor het bepalen van de stochastische innovatie! Bijgevolg: zelfs de laatste ‘time lag’ heeft nog een impact op et.

Ten slotte kunnen we nagaan of het model homo- of heteroskedastisch is. Normalitair zouden de storingstermen zich rondom nul moeten gedragen. Indien de variantie van de storingstermen echter toeneemt bij stijgende ‘fit-waarden’, geeft dit een eerste indicatie op heteroskedasticiteit. Uiteraard is dit een subjectieve benadering. Hulpmiddel tot het bekomen van een conclusie is een scatterplot maken van de storingstermen.

Bijvoorbeeld:





  1. Forecast.

Bij een forecast doen we een voorspelling naar wat er in de toekomst met de tijdreeks kan gebeuren aan de hand van de bestaande cijfers. We mogen ook enkel een forecast maken wanneer onze estimate ok was.

Wanneer we de forecast gaan analyseren is het belangrijk allereerst te kijken of het model niet explodeert. Dit kunnen we makkelijk zien op de grafiek. Op deze grafiek kunnen we eveneens aflezen of er een seizoenale trend aanwezig is, en of deze terugkomt. Verder kunnen we ook een eventuele dalende of stijgende trend waarnemen. We moeten ook kijken naar de betrouwbaarheidsintervallen, deze houden immers wel rekening met een algemene dalende en/of stijgende trend. Wanneer we bijvoorbeeld binnen twee jaar de forecast met de werkelijke waarden gaan vergelijken van de unemployment-reeks, en alle waarden liggen dan ook binnen het betrouwbaarheidsinterval, kunnen we stellen dat de werkloosheid gedreven wordt door de systematiek van de economie. Wanneer er enkele waarden buiten vallen, zal dit geen toeval zijn, maar zal er een reden voor zijn.

In de tabel gegenereerd door de software bij een forecast, kunnen we een interpretatie opmaken van de standaardfouten. De absolute ondergrens van deze statistiek is gelijk aan nul, de absolute bovengrens gelijk aan één. Bijgevolg zal de standaardfout een waarde aannemen binnen het interval [0 ; 1]. Hoe dichter dit cijfer aanleunt bij nul, hoe accurater de voorspelling met betrekking tot die observatie. Indien we de verschillende standaardfouten in de tabel doorlopen, kunnen we bijvoorbeeld determineren dat de gemiddelde standaardfout bijvoorbeeld min of meer gelijk is aan 10%. Dit zou een goede waarde zijn. We kunnen tevens besluiten dat de standaardfouten toenemen doorheen de ‘forecastingsperiode’. Dit is niet meer dan normaal. Hoe toekomstgerichter je immers gaat voorspellen, hoe meer rekening je moet houden met onzekerheden, zoals onverwachte gebeurtenissen. We moeten het volgende in het achterhoofd houden, indien we adequate prognoses willen maken: zorg ervoor dat de standaardfouten geminimaliseerd worden. Dit leidt immers tot kleinere betrouwbaarheidsintervallen, wat op zich weer leidt tot betere prognoses. Kleinere betrouwbaarheidsintervallen kunnen worden verkregen door relatief veel observaties in je onderzoek/steekproef op te nemen.

De kolommen Pinc en Pdec in de probability-tabel, geven de richting weer waarin de forecast zich zal evolueren, ten opzichte van de vorige observatie, ervan uitgaande dat al het overige constant blijft (ceteris paribus). Pinc geeft de waarschijnlijkheid op een stijging weer, Pdec geeft de waarschijnlijkheid op een daling weer. De som van Pinc en Pdec horend bij éénzelfde observatie moet uiteraard steeds gelijk zijn aan 1. De kolommen CPinc en CPdec in de tabel, geven de richting weer waarin de forecast zich zal evolueren, ten opzichte van de laatst gekende, niet geforecaste observatie, ervan uitgaande dat al het overige constant blijft (ceteris paribus). CPinc geeft de waarschijnlijkheid op een stijging weer, CPdec geeft de waarschijnlijkheid op een daling weer. De som van CPinc en CPdec horend bij éénzelfde observatie moet uiteraard steeds gelijk zijn aan 1. De kolommen SPinc en SPdec in deze tabel, geven de richting weer waarin de forecast zich zal evolueren, ten opzichte van de observatie, 12 tijdseenheden terug, ervan uitgaande dat al het overige constant blijft (ceteris paribus). SPinc geeft de waarschijnlijkheid op een stijging weer, SPdec geeft de waarschijnlijkheid op een daling weer. De som van SPinc en SPdec horend bij éénzelfde observatie moet uiteraard steeds gelijk zijn aan 1! Aan de hand van deze grafieken kunnen we met andere woorden een algemeen stijgende en of dalende trend determineren.


  1. Onderzoek van de residu’s.

Bij het onderzoek van de reidu’s gaan we na of de storingstermen van de reeks (na backforecasting) zich op een correcte wijze gedragen. Met andere woorden: de storingstermen moeten ‘white noise’ zijn.



  • Allereerst computen we wederom de ACF en PACF. Wanneer deze sterk op elkaar gelijken kunnen we besluiten dat er geen verborgen processen meer in het model zitten. Wanneer we daarenboven geen ARMA-proces meer kunnen destilleren, daar noch het eerste niet-seizoenale (lag 1), noch het eerste seizoenale (lag 12) staafje in de autocorrelatiefunctie en de partiële autocorrelatiefunctie zich buiten het betrouwbaarheidsinterval bevind.

  • Bij de analyse van het spectrum en CP zou in het ideale geval de witte lijn zich tussen de gele lijnen, ofte binnen de Kolmogorov-Smirnov grenzen moeten bevinden. Indien we lange- en/of korte termijntrends moeten bekomen zou de witte lijn zich respectievelijk significant links, of rechts van de Kolmogorov-Smirnov grenzen moeten bevinden.

  • In het ideale geval zijn de storingstermen normaal verdeeld. Is dit niet het geval, dan zijn de schattingsresultaten vertekend, inconsistent en inefficiënt. Dit kan dan uiteraard leiden tot minder adequate prognoses. Indien de storingstermen normaal verdeeld zijn, dan is de kans op ‘kleine’ storingen groter dan de kans op ‘grote’ storingen. Dit is natuurlijk onze intentie. Hoe kleiner de storingen, hoe dichter de voorspelde waarden immers zullen aanleunen bij de werkelijkheid. Algemeen wordt gesteld dat, indien de storingstermen normaal verdeeld zijn en de steekproef voldoende groot is, we spreken van asymptotisch niet-vertekende, consistente parameters. Indien zou blijken dat de storingstermen inderdaad niet normaal verdeeld zijn, dan is een mogelijke oplossing het opnemen van meerdere observaties in je steekproef. Algemeen wordt immers het volgende gesteld: hoe groter de steekproef, hoe groter de kans dat de storingstermen normaal verdeel zullen zijn.

    • Histogram: Zoals reeds eerder besproken, moeten de storingstermen normaal verdeeld zijn, zodoende adequate prognoses te kunnen maken. Wanneer we zien dat de frequentie in het centrum groter is dan aan de staarten, kunnen we spreken van een typisch patroon voor een normaalverdeling.

    • Rootogram: Dit is een statistisch hulpmiddel, dat nagaat of de storingstermen al dan niet normaal verdeeld zijn. Zij gaat met andere woorden de werkelijke klassenfrequenties van het histogram vergelijken met de theoretische klassenfrequenties van een normaalverdeling, en vervolgens een uitspraak maken, op basis van statistische inferenties. De klassencoëfficiënten mogen zich niet significant buiten dit betrouwbaarheidsinterval begeven, indien we er impliciet van uit gaan dat onze tijdreeks normaal verdeeld is. De analyse wordt tevens statistisch gestaafd aan de hand van de -statistiek.

    • Entropy concentration: Dit is een alternatieve wijze om na te gaan of onze storingstermen al dan niet normaal verdeeld zijn. De witte lijn stelt de entropy voor. Wanneer we een “klokvorm” kunnen onderscheiden kunnen we stellen dat onze residu’s normaal verdeeld zijn. We kunnen wel determineren dat deze wijze, voor het bepalen of de storingstermen al dan niet normaal verdeeld is, minder nauwkeurig is dan het rootogram.

    • Skewness/kurtosis: De Skewness meet de ‘scheefheidsgraad’ van een verdeling. Een negatieve skewness impliceert een linksscheve verdeling, een positieve skewness impliceert een rechtsscheve verdeling. Indien de skewness gelijk is aan nul, kunnen we spreken van een symmetrische verdeling. Hetgeen uiteraard het geval is bij een normaalverdeling. Vandaar dat we moeten testen of de skewness van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen niet normaal verdeeld! De Kurtosis is een maatstaf die de dikte van de staarten van de verdeling van de storingstermen in kaart brengt. Een positieve kurtosis wijst op een spitse top, een negatie kurtosis op een vlakke distributie. Bij een normaalverdeling is de kurtosis gelijk aan nul, aangezien we de grootste frequenties in het centrum aantreffen, de kleinste aan de staarten. We zullen bijgevolg moeten testen of de kurtosis van de verdeling van onze storingstermen niet significant verschillend is van nul. Is dit niet het geval, dan zijn de storingstermen immers niet normaal verdeeld! De Fisher Test 1 Probability gaat na of de skewness van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% (α-fout = 0,05). Wanneer de P-value gelijk is aan 2%, kunnen we bijgevolg stellen dat, wat betreft de scheefheidsgraad, de storingstermen niet normaal verdeeld zijn! De Fisher Test 2 Probability gaat na of de kurtosis van de verdeling van de storingstermen niet significant verschillend is van nul. Is dit het geval dan zou de P-value groter moeten zijn dan 5% (α= 0,05). Wanneer de P-value gelijk is aan bijvoorbeeld 6%, kunnen we bijgevolg stellen dat, wat betreft de kurtosis, de storingstermen normaal verdeeld zijn! De nul-lijn op de grafieken zou tussen het betrouwbaarheidsinterval moeten liggen.

    • Gemiddelde: Het gemiddelde van de storingstermen mag niet significant verschillend zijn van nul. Is dit echter wel het geval, dan zijn de storingstermen sterk vertekend. Vandaar dat de gemaakte voorspellingen al dan niet met een korreltje zout zullen moeten worden genomen. Wanneer de absolute waarde van de t-statistiek kleiner is dan twee, kunnen we bijgevolg stellen dat het gemiddelde van de storingstermen niet significant verschillend is van nul. Dit is een goede zaak! Naast het standaardgemiddelde worden er nog andere gemiddelden berekend, waaronder de ‘trimmed mean’. Deze berekent het gemiddelde van de storingstermen, mits een procentuele eliminatie van extreme waarden. Een ander gemiddelde is de ‘winzorized mean’. Bij de berekening van dit gemiddelde wordt een percentage van de extreme waarden vervangen door meer normale waarden.

    • Variantie: De variantie (standaarddeviatie²) geeft de relatieve spreiding van de meetuitslagen ten opzichte van het gemiddelde van de residu’s weer. De standaardfout is de maximale afwijking tussen de voorspelde waarde (1-step-ahead forecast) en de werkelijkheid.

    • Kwartielen: wanneer we opmerken dat het tweede kwartiel vrij klein is in verhouding tot kwartiel 1 en 3, en kunnen stellen dat het eerste en het derde kwartiel in absolute waarde min of meer overeenkomen, kunnen we concluderen dat het om een normaalverdeling gaat. Het voorgaande is uiteraard niet meer dan normaal, gezien de symmetrie van de verdeling. Het tweede kwartiel is gelijk aan nul, hetgeen typisch is voor een normaalverdeling.

    • Percentielen: Gezien de normaalverdeling van de residu’s zouden het eerste en het negenennegentigste percentiel, het tweede en het achtennegentigste percentiel,… in absolute waarde sterk moeten overeenkomen. Het middelste percentiel (dus het vijftigste) zou min of meer gelijk moeten zijn aan nul!

Wanneer zijn de residus’s nu white noise? Als we hebben besloten dat de storingstermen normaal verdeeld zijn, er geen sprake meer is van autocorrelatie (ACF) en het gemiddelde van de residu’s niet significant verschillend is van nul (mits eliminatie van één extreme waarde). We kunnen bijgevolg besluiten dat de storingstermen ‘white noise’ zijn. Herschatting is bijgevolg niet meer nodig.
Voorbeelden:

Histogram Rootogram


Entropy concentration




  1. Random Walk.




Random-Walk: een tijdreeks waar elke observatie gelijk is aan de vorige observatie plus een on-average-zero normal random number (dat ook negatief mag zijn). De formule van het random-walk-proces is: Yt = Yt-1 + et waar et een random waarde is (getrokken uit een normaalverdeling met 0 gemiddelde).

Drifted Random-Walk: een tijdreeks waar elke observatie gelijk is aan de vorige observatie plus een on-average-zero normal random number (dat ook negatief mag zijn) plus een vaste waarde (die eveneens negatief mag zijn). De formule van het drifted random-walk-proces is: Yt = Yt-1 + c + et waar c een vast getal is, en et een random waarde is (getrokken uit een normaalverdeling met 0 gemiddelde).

Seasonal Walk: een tijdreeks waarbij elke observatie gelijk is aan de overeenstemmende observatie een jaar terug (zelfde maand, of zelfde kwartaal) plus een on-average-zero normal random number (dat ook negatief mag zijn). De formule van het Seasonal Walk proces is: Yt = Yt-s + et waar et een random waarde is (getrokken uit een normaalverdeling met 0 gemiddelde).


Seasonal Drifted Walk: een tijdreeks waarbij elke observatie gelijk is aan de overeenstemmende observatie een jaar terug (zelfde maand, of zelfde kwartaal) plus een on-average-zero normal random number (dat ook negatief mag zijn) plus een constante term (die negatief mag zijn). De formule van het Seasonal Walk proces is: Yt = Yt-s + c + et waar c een constante, en et een random waarde is (getrokken uit een normaalverdeling met 0 gemiddelde).




  1. Analyse eigen tijdreeksen.


Naam: 0010403Kon, 0010403Vla, 0010403Ant, 0010403Waa
Omschrijving: De tabel geeft de uitvoer weer in miljoenen euros van België verdeeld over gewesten en provincies van oorsprong. Ik heb gekozen voor de cijfers van gans het koninkrijk, het Vlaamse en Waalse Gewest en van de provincie Antwerpen. Antwerpen omdat deze de hoogste uitvoercijfers heeft van alle provincies. Het valt eveneens op dat de cijfers van de provincie Antwerpen deze van gans het Waalse Gewest ruim overtreffen. De aanwezigheid van de haven is hier volgens mij de voornaamste reden van.
Bron: Ik heb deze tijdreeksen gevonden op de website van Belgostat. http://www.nbb.be/belgostat/PresentationLinker?Order=true&TableId=931000054&Lang=N
Parameters:

  • Kon: L = 1, D = 1, d = 1, p = 1, P = 2, q = 0 = Q

  • Vla: L = 1, D = 1, d = 1, p = P = q = Q = 0

  • Ant: L = 1, D = 1, d = 1, p = P = q = Q = 0

  • Waa: L = 1, D = 1, d = 1, p = 3, P = 0, q = 1, Q = 0

  • Unemployment : L = 0,5, D = d = 1, p = 2, P = 0, q = 0, Q = 1


Waarden voor , Ф, en Θ:

  • Kon: AR(1) = -0,5441, SAR(1) = -0,557, SAR(2) = -0,1165 (SAR(2) nsvv0)

  • Vla: /

  • Ant: /

  • Waa: AR(1) = -10,326, AR(2) = -0,4877, AR(3) = 0,1926, MA(1) = -0,6198 (AR(2) en AR(3) nsvv0)


Correlaties:

  • Kon: -32 – 41%

  • Waa: 61 – 90%


Standaardfouten:

  • Kon: 3 – 11%

  • Vla: 5 – 6%

  • Ant: 8 – 12%

  • Waa: 4 – 16%


White noise?










De database wordt beschermd door het auteursrecht ©opleid.info 2017
stuur bericht

    Hoofdpagina