Sunday 8 October 2017

Første Ordens Moving Average Prosess


4.2 Linjære stasjonære modeller for Time Series hvor den tilfeldige variabelen kalles innovasjon fordi den representerer delen av den observerte variabelen som er uforutsigbar gitt de siste verdiene. Den generelle modellen (4.4) antar det som er resultatet av et lineært filter som forandrer de siste innovasjonene, det vil si en lineær prosess. Denne linearitetsforutsetningen er basert på Wolds dekomponeringsteorem (Wold 1938) som sier at en hvilken som helst diskret, stasjonær kovariansprosess kan uttrykkes som summen av to ukorrelerte prosesser, hvor det er rent deterministisk og er en rent ubestemt prosess som kan skrives som en lineær summen av innovasjonsprosessen: hvor er en sekvens av serielt ukorrelerte tilfeldige variabler med null gjennomsnitt og felles varians. Tilstand er nødvendig for stasjonar. Formuleringen (4.4) er en endelig reparametrizering av den uendelige representasjonen (4.5) - (4.6) med konstant. Det er vanligvis skrevet i forhold til lagoperatøren definert av, som gir et kortere uttrykk: hvor lagoperatørpolynomene og er kalt polynomial og polynomial, henholdsvis. For å unngå parameterredundans antar vi at det ikke er felles faktorer mellom komponentene og komponentene. Deretter skal vi studere plottet til noen tidsserier generert av stasjonære modeller med sikte på å bestemme hovedmønstrene av deres tidsmessige evolusjon. Figur 4.2 inneholder to serier generert fra følgende stasjonære prosesser beregnet ved hjelp av genarma-kvantet: Figur 4.2: Tidsserier generert av modeller Som forventet beveger begge tidsserier seg rundt et konstant nivå uten endringer i varians på grunn av den stasjonære egenskapen. Videre er dette nivået nær det teoretiske gjennomsnittet av prosessen, og avstanden til hvert punkt til denne verdien er svært sjelden utenfor grensene. Videre viser utviklingen av serien lokale avvik fra middelprosessen, som er kjent som den gjennomsnittlige reversjonsadferd som karakteriserer stasjonære tidsserier. La oss studere detaljert egenskapene til de forskjellige prosessene, spesielt autokovariansfunksjonen som fanger de dynamiske egenskapene til en stokastisk stasjonær prosess. Denne funksjonen avhenger av måleenhetene, så det vanlige målet på gradvis linearitet mellom variabler er korrelasjonskoeffisienten. Ved stasjonære prosesser defineres autokorrelasjonskoeffisienten ved lag, betegnet ved, som korrelasjonen mellom og: Autokorrelasjonsfunksjonen (ACF) er autokovariansfunksjonen som standardiseres av variansen. Egenskapene til ACF er: Gitt symmetriegenskapen (4.10), representeres ACF vanligvis ved hjelp av et strekkdiagram ved de ikke-negative lag som kalles det enkle korrelogrammet. Et annet nyttig verktøy for å beskrive dynamikken til en stasjonær prosess er den delvise autokorrelasjonsfunksjonen (PACF). Den delvise autokorrelasjonskoeffisienten ved lag måler den lineære sammenhengen mellom og justeres for effektene av mellomverdiene. Derfor er det bare koeffisienten i den lineære regresjonsmodellen: Egenskapene til PACF er ekvivalente med ACF (4.8) - (4.10) og det er lett å bevise det (Box og Jenkins 1976). Som ACF, er den delvise autokorrelasjonsfunksjonen ikke avhengig av måleenhetene, og den er representert ved hjelp av et strekkdiagram på de ikke-negative lag som kalles delvis korrelogram. De dynamiske egenskapene til hver stasjonær modell bestemmer en bestemt form for korrelogrammene. Videre kan det påvises at for enhver stasjonær prosess, begge funksjoner, ACF og PACF, nærmer seg null når laget har en tendens til uendelig. Modellene er ikke alltid stasjonære prosesser, så det er først å bestemme betingelsene for stasjonar. Det er underkategorier av modeller som har spesielle egenskaper, slik at vi skal studere dem separat. Dermed, når og, det er en hvit støyprosess. når det er en ren, flytende gjennomsnittsprosess. , og når det er en ren autoregressiv prosessordre. . 4.2.1 Hvit støyprosess Den enkleste modellen er en hvit støyprosess, hvor er en sekvens av ukorrelerte null-middelvariabler med konstant varians. Det er betegnet av. Denne prosessen er stasjonær hvis dens varians er begrenset, siden gitt at: verifiserer betingelsene (4.1) - (4.3). Videre er ukorrelert over tid, slik at autokovariansfunksjonen er: Figur 4.7 viser to simulerte tidsserier generert fra prosesser med null gjennomsnitt og parametre og -0,7. Den autoregressive parameteren måler persistensen av tidligere hendelser i gjeldende verdier. For eksempel, hvis et positivt (eller negativt) sjokk påvirker positivt (eller negativt) for en tidsperiode som er lengre jo større er verdien av. Når serierne beveger seg mer grovt rundt gjennomsnittet på grunn av vekslingen i retning av effekten av, det vil si et sjokk som påvirker positivt i øyeblikket, har negative virkninger på, positivt i. Prosessen er alltid inverterbar, og den er stasjonær når parameteren til modellen er begrenset til å ligge i regionen. For å bevise den stasjonære tilstanden skriver vi først i den bevegelige gjennomsnittsformen ved rekursiv substitusjon av i (4.14): Figur 4.8: Befolkningskorrelogrammer for prosesser Det er en vektet sum av tidligere innovasjoner. Vektene avhenger av verdien av parameteren: når, (eller) øker innflytelsen av en gitt innovasjon (eller reduserer) gjennom tiden. Ved å ta forventninger til (4,15) for å beregne prosessens gjennomsnitt, får vi: Gitt det er resultatet en sum av uendelige termer som kun konvergerer for all verdi hvis i hvilket tilfelle. Et lignende problem vises når vi beregner det andre øyeblikket. Beviset kan forenkles, forutsatt at det vil si at. Da er variansen: Igjen går variansen til uendelig bortsett fra, i hvilket tilfelle. Det er enkelt å verifisere at både gjennomsnittet og variansen eksploderer når denne tilstanden ikke holder. Autokovariansfunksjonen til en stasjonær prosess er derfor autokorrelasjonsfunksjonen for den stasjonære modellen: Det vil si at korrelogrammet viser et eksponensielt henfall med positive verdier, alltid hvis det er positivt og med negative positive svingninger hvis det er negativt (se figur 4.8). Videre reduseres hastigheten av forfall som øker, jo større er verdien av jo sterkere den dynamiske korrelasjonen i prosessen. Endelig er det en cutoff i den delvise autokorrelasjonsfunksjonen ved første lag. Figur 4.9: Befolkningskorrelogrammer for prosesser Det kan vises at den generelle prosessen (Box og Jenkins 1976): Står bare hvis røttene til polynomets karakteristiske likning ligger utenfor enhetens sirkel. Midten av en stasjonær modell er. Er alltid invertible for noen verdier av parametrene. Den ACF går til null eksponentielt når røttene til er reelle eller med sinus-cosinusbølgefluktuasjoner når de er komplekse. Det er PACF som har en cutoff på laget, det vil si. Noen eksempler på Korrelogrammer for mer komplekse modeller, som for eksempel, kan ses i figur 4.9. De er svært lik mønstrene når prosessene har reelle røtter, men har en helt annen form når røttene er komplekse (se det første grafikkbildet i figur 4.9). 4.2.4 Autoregressiv Moving Average Model Den generelle (endelig rekkefølge) autoregressive glidende gjennomsnittlige bestillingsorden,, er: Autoregressive bevegelige gjennomsnittlige feilprosesser (ARMA-feil) og andre modeller som involverer feilfeil, kan estimeres ved hjelp av FIT-setninger og simulert eller prognose ved å bruke SOLVE-setninger. ARMA modeller for feilprosessen brukes ofte til modeller med autokorrelerte rester. AR-makroen kan brukes til å spesifisere modeller med autoregressive feilprosesser. MA-makroen kan brukes til å spesifisere modeller med bevegelige gjennomsnittsfeilprosesser. Autoregressive feil En modell med førstegangs autoregressive feil, AR (1), har skjemaet mens en AR (2) feilprosess har skjemaet og så videre for høyere rekkefølge prosesser. Merk at s er uavhengige og identisk fordelte og har en forventet verdi på 0. Et eksempel på en modell med en AR (2) komponent er og så videre for høyere rekkefølge prosesser. For eksempel kan du skrive en enkel lineær regresjonsmodell med MA (2) glidende gjennomsnittlige feil som hvor MA1 og MA2 er de bevegelige gjennomsnittsparametrene. Legg merke til at RESID. Y automatisk er definert av PROC MODEL, da ZLAG-funksjonen må brukes til MA-modeller for å avkorte rekursjonen av lagene. Dette sikrer at de forsinkede feilene starter ved null i forsinkelsesfasen og ikke propagerer manglende verdier når forsinkelsesperiodevariabler mangler, og det sikrer at fremtidige feil er null i stedet for å bli savnet under simulering eller prognoser. For detaljer om lagfunksjonene, se avsnittet Laglogikk. Denne modellen som er skrevet ved hjelp av MA-makroen, er som følger: Generell form for ARMA-modeller Den generelle ARMA (p, q) prosessen har følgende form En ARMA (p, q) modell kan spesifiseres som følger: hvor AR i og MA j representerer de autoregressive og bevegelige gjennomsnittsparametrene for de ulike lagene. Du kan bruke noen navn du vil ha for disse variablene, og det finnes mange tilsvarende måter som spesifikasjonen kan skrives på. Vector ARMA prosesser kan også estimeres med PROC MODEL. For eksempel kan en tovariabel AR (1) prosess for feilene i de to endogene variablene Y1 og Y2 spesifiseres som følger: Konvergensproblemer med ARMA-modeller ARMA-modeller kan være vanskelig å estimere. Hvis parametrisestimatene ikke er innenfor det aktuelle området, øker de gjenværende betingelsene for flyttende gjennomsnitt eksponentielt. De beregnede residualene for senere observasjoner kan være svært store eller kan overflyte. Dette kan skje enten fordi feil startverdier ble brukt eller fordi iterasjonene flyttet vekk fra rimelige verdier. Pasienten bør brukes til å velge startverdier for ARMA-parametere. Startverdier på 0,001 for ARMA-parametere virker vanligvis hvis modellen passer godt til data og problemet er godt betinget. Legg merke til at en MA-modell ofte kan tilnærmet seg med en høy-ordnet AR-modell, og omvendt. Dette kan resultere i høy kollinearitet i blandede ARMA-modeller, som igjen kan forårsake alvorlig dårlig konditionering i beregningene og ustabiliteten til parameterestimatene. Hvis du har konvergensproblemer mens du vurderer en modell med ARMA-feilprosesser, kan du prøve å estimere i trinn. Bruk først en FIT-setning for å estimere bare strukturparametrene med ARMA-parametrene holdt til null (eller til fornuftige tidligere estimater hvis tilgjengelig). Deretter bruker du en annen FIT-setning for å bare estimere ARMA-parametrene, ved hjelp av strukturelle parameterverdier fra første runde. Siden verdiene til strukturparametrene sannsynligvis vil være nær de endelige estimatene, kan ARMA parameter estimatene nå konvergere. Til slutt, bruk en annen FIT-setning for å produsere samtidige estimater av alle parametrene. Siden de første verdiene til parametrene nå er sannsynligvis ganske nær deres endelige felles estimater, bør estimatene konvergere raskt hvis modellen passer for dataene. AR Initial Conditions De første lagene av feilvilkårene for AR (p) - modellene kan modelleres på forskjellige måter. De autoregressive feiloppstartsmetodene som støttes av SASETS-prosedyrer, er følgende: Kondisjonerende minst firkanter (ARIMA og MODEL-prosedyrer) ubetingede minstefirkanter (AUTOREG, ARIMA og MODEL-prosedyrer) maksimal sannsynlighet (AUTOREG, ARIMA og MODEL-prosedyrer) Yule-Walker (AUTOREG Hildreth-Lu, som sletter de første p-observasjonene (kun MODEL-prosedyre) Se kapittel 8, AUTOREG-prosedyren, for en forklaring og diskusjon av fordelene ved ulike AR (p) oppstartsmetoder. CLS, ULS, ML og HL initialiseringer kan utføres av PROC MODEL. For AR (1) - feil, kan disse initialiseringene produseres som vist i tabell 18.2. Disse metodene er ekvivalente i store prøver. Tabell 18.2 Initialiseringer utført av PROC MODEL: AR (1) FEIL De første lagene til feilvilkårene for MA (q) - modellene kan også modelleres på forskjellige måter. Følgende gjennomsnittlige feiloppstartsparadigmaer for bevegelige gjennomsnitt er støttet av ARIMA - og MODEL-prosedyrene: ubetingede minstefeltene betingede minstefirkanter Den betingede minstefirkantmetoden for estimering av gjennomsnittlig feilvilkår er ikke optimal fordi den ignorerer oppstartsproblemet. Dette reduserer estimatets effektivitet, selv om de forblir objektive. De innledende forsinkede residuene, som strekker seg før data begynner, antas å være 0, deres ubetingede forventede verdi. Dette introduserer en forskjell mellom disse residuene og de generaliserte minstkvadratresiduene for den bevegelige gjennomsnittlige kovariansen, som, i motsetning til den autoregressive modellen, fortsetter gjennom datasettet. Vanligvis er denne forskjellen konvergerende raskt til 0, men for nesten uforanderlige bevegelige gjennomsnittsprosesser er konvergensen ganske treg. For å minimere dette problemet, bør du ha rikelig med data, og de gjennomsnittlige parameter estimatene skal ligge godt innenfor det inverterbare området. Dette problemet kan korrigeres på bekostning av å skrive et mer komplekst program. Ubetingede minimale kvadrater estimater for MA (1) prosessen kan produseres ved å spesifisere modellen som følger: Flytte-gjennomsnittlige feil kan være vanskelig å estimere. Du bør vurdere å bruke en AR (p) tilnærming til den bevegelige gjennomsnittsprosessen. En bevegelig gjennomsnittsprosess kan vanligvis være godt tilnærmet av en autoregressiv prosess hvis dataene ikke har blitt jevnet eller differensiert. AR Macro SAS makro AR genererer programmeringsuttalelser for PROC MODEL for autoregressive modeller. AR-makroen er en del av SASETS-programvaren, og ingen spesielle alternativer må settes for å bruke makroen. Den autoregressive prosessen kan brukes på strukturelle ligningsfeilene eller til den endogene serien selv. AR-makroen kan brukes til følgende typer autoregresjon: ubegrenset vektor autoregresjonsbegrenset vektor autoregresjon Univariate Autoregression For å modellere feilbegrepet for en ligning som en autoregressiv prosess, bruk følgende setning etter ligningen: For eksempel, anta at Y er en lineær funksjon av X1, X2 og en AR (2) feil. Du vil skrive denne modellen som følger: Samtalen til AR må komme etter alle likningene som prosessen gjelder for. Den foregående makrooppkallingen, AR (y, 2), produserer setningene som vises i LIST-utgangen i figur 18.58. Figur 18.58 LIST Option Output for en AR (2) - modell PRED-prefikserte variabler er midlertidige programvariabler som brukes, slik at lagene på residualene er de riktige residualene og ikke de som er omdefinert av denne ligningen. Merk at dette tilsvarer uttalelsene som er uttrykkelig skrevet i avsnittet Generell skjema for ARMA-modeller. Du kan også begrense de autoregressive parametrene til null ved valgte lag. For eksempel, hvis du vil ha autoregressive parametere på lag 1, 12 og 13, kan du bruke følgende setninger: Disse setningene genererer utgangen vist i Figur 18.59. Figur 18.59 LIST Option Output for en AR-modell med Lags på 1, 12 og 13 MODEL Prosedyreoppføring av kompilert programkodestatus som analysert PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - AKTUELT. ERROR. y PRED. y - y Det er variasjoner på den betingede minste kvadratmetoden, avhengig av om observasjoner ved starten av serien brukes til å varme opp AR-prosessen. Som standard bruker AR-betinget minste kvadratmetoden alle observasjonene og antar nuller for de første lagene av autoregressive termer. Ved å bruke M-alternativet, kan du be om at AR bruker stedet for ubetinget minste kvadrat (ULS) eller maksimal sannsynlighet (ML) i stedet. For eksempel er diskusjoner av disse metodene gitt i avsnittet AR Initial Conditions. Ved å bruke MCLS n-alternativet, kan du be om at de første n observasjonene brukes til å beregne estimater av de første autoregressive lagene. I dette tilfellet starter analysen med observasjon n 1. For eksempel: Du kan bruke AR-makroen til å bruke en autoregressiv modell til den endogene variabelen, i stedet for til feilperioden, ved å bruke TYPEV-alternativet. Hvis du for eksempel vil legge til de fem siste lagene til Y til ligningen i forrige eksempel, kan du bruke AR til å generere parametrene og lagre ved å bruke følgende setninger: De foregående setningene genererer utgangen vist i Figur 18.60. Figur 18.60 LIST Alternativutgang for en AR-modell av Y Denne modellen forutsier Y som en lineær kombinasjon av X1, X2, en avskjæring og verdiene for Y i de siste fem periodene. Ubegrenset Vector Autoregression Hvis du vil modellere feilvilkårene for et sett med ligninger som en vektorautoregressiv prosess, bruker du følgende form for AR-makroen etter likningene: Prosessnavnverdien er et hvilket som helst navn du oppgir for AR å bruke til å lage navn for autoregressive parametre. Du kan bruke AR-makroen til å modellere flere forskjellige AR-prosesser for forskjellige sett med ligninger ved å bruke forskjellige prosessnavn for hvert sett. Prosessnavnet sikrer at variabelenavnene som brukes, er unike. Bruk en kort prosessnavn verdi for prosessen hvis parameter estimater skal skrives til et utdata datasett. AR-makroen forsøker å konstruere parameternavn mindre enn eller lik åtte tegn, men dette er begrenset av lengden på prosessnavn. som brukes som prefiks for AR-parameternavnene. Variablelistverdien er listen over endogene variabler for ligningene. For eksempel, anta at feil for ligningene Y1, Y2 og Y3 er generert av en andreordsvektor autoregressiv prosess. Du kan bruke følgende setninger: som genererer følgende for Y1 og lignende kode for Y2 og Y3: Bare metodene med betinget minste kvadrat (MCLS eller MCLS n) kan brukes til vektorprosesser. Du kan også bruke samme skjema med begrensninger at koeffisjonsmatrisen er 0 på utvalgte lag. Følgende setninger bruker for eksempel en tredje ordensvektprosess til ligningsfeilene med alle koeffisientene ved lag 2 begrenset til 0 og med koeffisientene ved lag 1 og 3 ubegrenset: Du kan modellere de tre serie Y1Y3 som en vektor-autoregressiv prosess i variablene i stedet for i feilene ved å bruke TYPEV-alternativet. Hvis du vil modellere Y1Y3 som en funksjon av tidligere verdier av Y1Y3 og noen eksogene variabler eller konstanter, kan du bruke AR til å generere setningene for lagbetingelsene. Skriv en ligning for hver variabel for den ikke-autoregressive delen av modellen, og ring deretter AR med TYPEV-alternativet. For eksempel kan den ikke-autoregressive delen av modellen være en funksjon av eksogene variabler, eller det kan skilles parametere. Hvis det ikke finnes eksogene komponenter til vektorgruppens autoregresjonsmodell, inkludert ingen avlyttinger, tilordner du null til hver av variablene. Det må være en oppgave til hver av variablene før AR kalles. Dette eksemplet modellerer vektoren Y (Y1 Y2 Y3) som en lineær funksjon bare av verdien i de to foregående periodene og en hvit støyfeilvektor. Modellen har 18 (3 3 3 3) parametere. Syntax av AR Macro Det er to tilfeller av syntaksen til AR-makroen. Når det ikke er behov for restriksjoner på en AR-vektorprosess, har syntaksen til AR-makroen den generelle formen spesifiserer et prefiks for AR som skal brukes til å konstruere navn på variabler som trengs for å definere AR-prosessen. Hvis endolisten ikke er spesifisert, angir den endogene listen som navnet. som må være navnet på ligningen som AR feilprosessen skal brukes på. Navneverdien kan ikke overstige 32 tegn. er ordren til AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. Hvis mer enn ett navn er gitt, opprettes en ubegrenset vektorprosess med de strukturelle rester av alle ligningene som er inkludert som regressorer i hver av ligningene. Hvis ikke spesifisert, angir endolisten navnet. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Bare MCLS er tillatt når mer enn en ligning er angitt. ULS - og ML-metodene støttes ikke for vektor AR-modeller av AR. angir at AR-prosessen skal påføres de endogene variablene selv i stedet for til de strukturelle residualene i ligningene. Begrenset Vector Autoregression Du kan kontrollere hvilke parametere som er inkludert i prosessen, begrense til 0 de parametrene du ikke inkluderer. Bruk først AR med alternativet DEFER til å erklære variabellisten og definere dimensjonen av prosessen. Deretter bruker du flere AR-anrop for å generere vilkår for utvalgte ligninger med utvalgte variabler på utvalgte lag. F. eks. Feilligningene som er produsert, er som følger: Denne modellen sier at feilene for Y1 avhenger av feilene til både Y1 og Y2 (men ikke Y3) i begge lag 1 og 2, og at feilene for Y2 og Y3 avhenger av De forrige feilene for alle tre variablene, men bare ved lag 1. AR Makro syntaks for begrenset vektor AR En alternativ bruk av AR har lov til å pålegge restriksjoner på en vektor AR-prosess ved å ringe AR flere ganger for å angi forskjellige AR-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen angir et prefiks for AR å bruke til å bygge navn på variabler som trengs for å definere vektor AR-prosessen. angir rekkefølgen av AR-prosessen. spesifiserer listen over likninger som AR-prosessen skal brukes på. angir at AR ikke skal generere AR-prosessen, men skal vente på ytterligere informasjon angitt i senere AR-anrop for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i denne AR-anropet skal brukes til. Bare navn som er spesifisert i endolistverdien til den første anropen for navnverdien, kan vises i listen over likninger i eqlist. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. Bare navn i endolisten til det første anropet for navnverdien kan vises i varlisten. Hvis ikke spesifisert, varsler standard til endolist. angir listen over lag som AR-vilkårene skal legges til. Koeffisientene til betingelsene ved lags ikke listet er satt til 0. Alle de listede lagene må være mindre enn eller lik verdien av nlag. og det må ikke være duplikater. Hvis ikke spesifisert, lagliste standard til alle lag 1 til nlag. MA Macro SAS makro MA genererer programmeringserklæringer for PROC MODEL for flyttende gjennomsnittlige modeller. MA-makroen er en del av SASETS-programvaren, og det kreves ingen spesielle alternativer for å bruke makroen. Feilprosessen med bevegelige gjennomsnitt kan påføres strukturelle ligningsfeil. Syntaxen til MA-makroen er den samme som AR-makroen, bortsett fra at det ikke er noen TYPE-argument. Når du bruker MA og AR-makroene kombinert, må MA-makroen følge AR-makroen. Følgende SASIML-setninger produserer en ARMA (1, (1 3)) feilprosess og lagrer den i datasettet MADAT2. Følgende PROC MODEL-setninger brukes til å estimere parametrene til denne modellen ved å bruke maksimal sannsynlighet feil struktur: Estimatene av parametrene produsert av denne løp er vist i Figur 18.61. Figur 18.61 Estimater fra en ARMA (1, (3)) prosess Det er to tilfeller av syntaksen for MA makroen. Når det ikke er behov for restriksjoner på en vektor MA-prosess, har syntaksen til MA-makroen den generelle formen spesifiserer et prefiks for MA som skal brukes til å konstruere navn på variabler som trengs for å definere MA prosessen og er standard endolisten. er bestillingen av MA prosessen. spesifiserer likningene som MA-prosessen skal brukes på. Hvis mer enn ett navn er gitt, brukes CLS estimering for vektorprosessen. spesifiserer lagene der MA-vilkårene skal legges til. Alle de listede lagene må være mindre enn eller lik nlag. og det må ikke være duplikater. Hvis ikke spesifisert lagrer laglisten til alle lag 1 til nlag. angir estimeringsmetoden som skal implementeres. Gyldige verdier av M er CLS (estimater med betingede minste kvadrater), ULS (ubetingede minstkvadratestimater) og ML (maksimal sannsynlighet estimater). MCLS er standard. Kun MCLS er tillatt når mer enn en ligning er spesifisert i endolisten. MA Makro syntaks for begrenset vektor Flyttende Gjennomsnitt En alternativ bruk av MA er tillatt å pålegge begrensninger på en vektor MA prosess ved å ringe MA flere ganger for å angi forskjellige MA-termer og lags for forskjellige ligninger. Den første anropet har den generelle formen spesifiserer et prefiks for MA å bruke til å konstruere navn på variabler som trengs for å definere vektor MA prosessen. angir rekkefølgen av MA prosessen. spesifiserer listen over likninger som MA-prosessen skal brukes på. angir at MA ikke skal generere MA prosessen, men skal vente på ytterligere informasjon angitt i senere MA-samtaler for samme navneverdi. De påfølgende anropene har den generelle formelen den samme som i den første anropet. spesifiserer listen over likninger som spesifikasjonene i dette MA-samtalen skal brukes til. spesifiserer listen over ligninger hvis lagrede strukturelle residualer skal inkluderes som regressorer i ligningene i eqlist. spesifiserer listen over lag som MA-vilkårene skal legges til. Utødeleggende Moving-Average Simulation (First Order) Demonstrasjonen er satt slik at samme tilfeldige serie poeng blir brukt uansett hvordan konstantene er varierte. Men når kvoten kvitteringsknappen trykkes, vil en ny tilfeldig serie bli generert og brukt. Å holde den tilfeldige serien identisk tillater brukeren å se nøyaktig effektene på ARMA-serien av endringer i de to konstantene. Konstanten er begrenset til (-1,1) fordi divergens av ARMA-serien resulterer når. Demonstrasjonen er kun for en første bestillingsprosess. Ytterligere AR-betingelser ville muliggjøre mer komplekse serier som skal genereres, mens flere MA-termer vil øke utjevningen. For en detaljert beskrivelse av ARMA-prosesser, se for eksempel G. Box, G. M. Jenkins og G. Reinsel, Time Series Analysis: Forecasting and Control. 3. utg. Englewood Cliffs, NJ: Prentice-Hall, 1994. RELATERTE LINKS2.1 Moving Average Models (MA-modeller) Tidsseriemodeller kjent som ARIMA-modeller kan omfatte autoregressive termer og eller flytte gjennomsnittlige termer. I uke 1 lærte vi et autoregressivt uttrykk i en tidsseriemodell for variabelen x t er en forsinket verdi på x t. For eksempel er et lag 1 autoregressivt uttrykk x t-1 (multiplisert med en koeffisient). Denne leksjonen definerer glidende gjennomsnittlige vilkår. En glidende gjennomsnittlig term i en tidsseriemodell er en tidligere feil (multiplisert med en koeffisient). La (wt overset N (0, sigma2w)), noe som betyr at w t er identisk, uavhengig distribuert, hver med en normalfordeling med gjennomsnittlig 0 og samme varians. Den første ordre-flytende gjennomsnittsmodellen, betegnet med MA (1), er (xt mu wt theta1w) Den andre ordens bevegelige gjennomsnittsmodellen, betegnet med MA (2), er (xt mu wt theta1w theta2w) , betegnet med MA (q) er (xt mu wt theta1w theta2w punkter thetaqw) Merknad. Mange lærebøker og programvare definerer modellen med negative tegn før betingelsene. Dette endrer ikke de generelle teoretiske egenskapene til modellen, selv om den ikke flipper de algebraiske tegnene på estimerte koeffisientverdier og (unsquared) termer i formler for ACFer og avvik. Du må sjekke programvaren for å verifisere om negative eller positive tegn har blitt brukt for å skrive riktig estimert modell. R bruker positive tegn i sin underliggende modell, som vi gjør her. Teoretiske egenskaper av en tidsrekkefølge med en MA (1) modell Merk at den eneste ikke-nullverdien i teoretisk ACF er for lag 1. Alle andre autokorrelasjoner er 0. Således er en prøve-ACF med en signifikant autokorrelasjon bare ved lag 1 en indikator på en mulig MA (1) modell. For interesserte studenter er bevis på disse egenskapene et vedlegg til denne utdelingen. Eksempel 1 Anta at en MA (1) modell er x t 10 w t .7 w t-1. hvor (wt overset N (0,1)). Dermed er koeffisienten 1 0,7. Den teoretiske ACF er gitt av Et plott av denne ACF følger. Plottet som nettopp er vist er den teoretiske ACF for en MA (1) med 1 0,7. I praksis vil en prøve vanligvis ikke gi et slikt klart mønster. Ved hjelp av R simulerte vi n 100 prøveverdier ved hjelp av modellen x t 10 w t .7 w t-1 hvor w t iid N (0,1). For denne simuleringen følger en tidsserie-plott av prøvedataene. Vi kan ikke fortelle mye fra denne plottet. Prøven ACF for de simulerte dataene følger. Vi ser en spike i lag 1 etterfulgt av generelt ikke signifikante verdier for lags forbi 1. Merk at prøven ACF ikke samsvarer med det teoretiske mønsteret til den underliggende MA (1), som er at alle autokorrelasjoner for lags forbi 1 vil være 0 . En annen prøve ville ha en litt annen prøve-ACF vist nedenfor, men vil trolig ha de samme brede funksjonene. Terapeutiske egenskaper av en tidsserie med en MA (2) modell For MA (2) modellen er teoretiske egenskaper følgende: Merk at de eneste ikke-nullverdiene i teoretisk ACF er for lags 1 og 2. Autokorrelasjoner for høyere lags er 0 . En ACF med signifikant autokorrelasjoner på lags 1 og 2, men ikke-signifikante autokorrelasjoner for høyere lags indikerer en mulig MA (2) modell. iid N (0,1). Koeffisientene er 1 0,5 og 2 0,3. Fordi dette er en MA (2), vil den teoretiske ACF bare ha null nullverdier ved lags 1 og 2. Verdier av de to ikke-null-autokorrelasjonene er Et plot av teoretisk ACF følger. Som nesten alltid er tilfellet, vil prøvedataene ikke oppføre seg så perfekt som teori. Vi simulerte n 150 utvalgsverdier for modellen x t 10 w t .5 w t-1 .3 w t-2. hvor det er N (0,1). Tidsserien av dataene følger. Som med tidsserien for MA (1) eksempeldata, kan du ikke fortelle mye om det. Prøven ACF for de simulerte dataene følger. Mønsteret er typisk for situasjoner der en MA (2) modell kan være nyttig. Det er to statistisk signifikante pigger på lags 1 og 2 etterfulgt av ikke-signifikante verdier for andre lags. Merk at på grunn av prøvetakingsfeil, samsvarte ACF ikke nøyaktig det teoretiske mønsteret. ACF for General MA (q) Modeller En egenskap av MA (q) - modeller generelt er at det finnes ikke-null autokorrelasjoner for de første q lagene og autokorrelasjonene 0 for alle lagene gt q. Ikke-entydighet av sammenhengen mellom verdier av 1 og (rho1) i MA (1) Modell. I MA (1) - modellen, for en verdi på 1. Den gjensidige 1 1 gir samme verdi. For eksempel, bruk 0,5 for 1. og bruk deretter 1 (0,5) 2 for 1. Du får (rho1) 0,4 i begge tilfeller. For å tilfredsstille en teoretisk begrensning kalt invertibility. vi begrenser MA (1) - modeller for å ha verdier med absolutt verdi mindre enn 1. I eksemplet som er gitt, vil 1 0,5 være en tillatelig parameterverdi, mens 1 10,5 2 ikke vil. Invertibility av MA modeller En MA-modell sies å være invertibel hvis den er algebraisk tilsvarer en konvergerende uendelig rekkefølge AR-modell. Ved konvergering mener vi at AR-koeffisientene reduseres til 0 da vi beveger oss tilbake i tid. Invertibility er en begrensning programmert i tidsserier programvare som brukes til å estimere koeffisientene av modeller med MA termer. Det er ikke noe vi ser etter i dataanalysen. Ytterligere opplysninger om inverterbarhetsbegrensningen for MA (1) - modeller er gitt i vedlegget. Avansert teorienotat. For en MA (q) modell med en spesifisert ACF, er det bare en inverterbar modell. Den nødvendige betingelsen for invertibilitet er at koeffisientene har verdier slik at ligningen 1- 1 y-. - q y q 0 har løsninger for y som faller utenfor enhetens sirkel. R-kode for eksemplene I eksempel 1, plotte vi den teoretiske ACF av modellen x t10 w t. 7w t-1. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt til å plotte den teoretiske ACF var: acfma1ARMAacf (mac (0,7), lag. max10) 10 lag av ACF for MA (1) med theta1 0,7 lags0: 10 skaper en variabel som heter lags som varierer fra 0 til 10. plot (lags, acfma1, xlimc (1,10), ylabr, typh, main ACF for MA (1) med theta1 0,7) abline (h0) legger til en horisontal akse på plottet. Den første kommandoen bestemmer ACF og lagrer den i en gjenstand kalt acfma1 (vårt valg av navn). Plot-kommandoen (den tredje kommandoen) plots lags versus ACF-verdiene for lags 1 til 10. ylab-parameteren merker y-aksen og hovedparameteren setter en tittel på plottet. For å se de numeriske verdiene til ACF, bruk bare kommandoen acfma1. Simuleringen og tomtene ble gjort med følgende kommandoer. xcarima. sim (n150, liste (mac (0.7))) Simulerer n 150 verdier fra MA (1) xxc10 legger til 10 for å gjøre gjennomsnitt 10. Simuleringsstandarder betyr 0. Plot (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF for simulerte prøvedata) I eksempel 2 skisserte vi den teoretiske ACF av modellen xt 10 wt .5 w t-1 .3 w t-2. og deretter simulert n 150 verdier fra denne modellen og plottet prøve tidsseriene og prøven ACF for de simulerte dataene. R-kommandoene som ble brukt var acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typh, hoved ACF for MA (2) med theta1 0,5, theta20.3) abline (h0) xcarima. sim (n150, liste (mac (0,5, 0,3)) xxc10 plot (x, typeb, hoved Simulert MA (2) Serie) acf (x, xlimc (1,10) mainACF for simulert MA (2) Data) Vedlegg: Bevis på egenskaper av MA (1) For interesserte studenter, her er bevis for teoretiske egenskaper av MA (1) modellen. Varians: (tekst (xt) tekst (mu wt theta1 w) 0 tekst (wt) tekst (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Når h 1, er det forrige uttrykket 1 w 2. For ethvert h 2, . Årsaken er at ved definisjon av uavhengighet av wt. E (w k w j) 0 for noen k j. Videre, fordi w t har middelverdien 0, E (w jw j) E (w j 2) w 2. For en tidsserie, Bruk dette resultatet for å få ACF gitt ovenfor. En inverterbar MA-modell er en som kan skrives som en uendelig rekkefølge AR-modell som konvergerer slik at AR-koeffisientene konvergerer til 0 mens vi beveger oss uendelig tilbake i tiden. Vel demonstrere invertibility for MA (1) modellen. Vi erstatter deretter forholdet (2) for w t-1 i ligning (1) (3) (zt wt theta1 (z-theta1w) wt theta1z-tet2w) Ved tid t-2. (2) blir vi da erstatter forholdet (4) for w t-2 i ligning (3) (zt wt theta1z-teteta21wt theta1z-teteta21 (z-theta1w) wt theta1z-theta12z theta31w) Hvis vi skulle fortsette uendelig), ville vi få den uendelige rekkefølgen AR-modellen (zt wt theta1z - theta21z theta31z - theta41z prikker) Merk imidlertid at hvis 1 1, vil koeffisientene som multipliserer lagene av z, øke (uendelig) i størrelse når vi beveger oss tilbake i tid. For å forhindre dette, trenger vi 1 lt1. Dette er betingelsen for en inverterbar MA (1) modell. Uendelig Order MA-modell I uke 3 ser du at en AR (1) - modell kan konverteres til en uendelig rekkefølge MA-modell: (xt - mu wt phi1w phi21w prikker phik1 w dots sum phij1w) Denne summeringen av tidligere hvite støybetingelser er kjent som årsakssammenheng av en AR (1). Med andre ord, x t er en spesiell type MA med et uendelig antall vilkår som går tilbake i tid. Dette kalles en uendelig ordre MA eller MA (). En endelig ordre MA er en uendelig orden AR og en hvilken som helst endelig rekkefølge AR er en uendelig rekkefølge MA. Tilbakekall i uke 1, bemerket vi at et krav til en stasjonær AR (1) er at 1 lt1. Lar beregne Var (x t) ved hjelp av årsakssammensetningen. Dette siste trinnet bruker et grunnfakta om geometrisk serie som krever (phi1lt1) ellers ser serien ut. Navigasjon

No comments:

Post a Comment