Sunday, October 16, 2016

Arimathéa Bewegende Gemiddelde

'N Rima staan ​​vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan ​​bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan ​​slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science.8.4 Moving gemiddelde modelle Eerder as om te gebruik afgelope waardes van die voorspelling veranderlike in 'n regressie, 'n bewegende gemiddelde model gebruik afgelope voorspelling foute in 'n regressie-agtige model. y c et theta e theta e kolle theta e, waar et is wit geraas. Ons noem dit 'n MA (Q) model. Natuurlik, ons het nie die waardes van et waarneem, so dit is nie regtig regressie in die gewone sin. Let daarop dat elke waarde van yt gesien kan word as 'n geweegde bewegende gemiddelde van die afgelope paar voorspel foute. Maar bewegende gemiddelde modelle moet nie verwar word met bewegende gemiddelde smoothing ons in Hoofstuk 6. 'n bewegende gemiddelde model bespreek word gebruik vir die voorspelling van toekomstige waardes, terwyl bewegende gemiddelde smoothing word gebruik vir die bepaling van die tendens-siklus van verlede waardes wees. Figuur 8.6: Twee voorbeelde van data uit bewegende gemiddelde modelle met verskillende parameters. Links: MA (1) met y t 20e t 0.8e t-1. Regs: MA (2) met y t e t-e t-1 0.8e t-2. In beide gevalle, is e t normaalverdeelde wit geraas met gemiddelde nul en variansie een. Figuur 8.6 toon 'n mate van data uit 'n MA (1) model en 'n MA (2) model. Die verandering van die parameters theta1, kolle, thetaq resultate in verskillende tyd reeks patrone. Soos met outoregressiemodelle, sal die afwyking van die term fout et net verander die skaal van die reeks, nie die patrone. Dit is moontlik om 'n stilstaande AR (p) model as 'n MA (infty) model skryf. Byvoorbeeld, met behulp van herhaalde vervanging, kan ons hierdie bewys vir 'n AR (1) model: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amp phi13y phi12e phi1 e et amptext einde verstande -1 Dit phi1 Dit 1, sal die waarde van phi1k kleiner te kry as k groter word. So uiteindelik kry ons yt et phi1 e phi12 e phi13 e cdots, 'n MA (infty) proses. Die omgekeerde gevolg het as ons 'n paar beperkinge op te lê op die MA parameters. Toe die MA-model is omkeerbaar genoem. Dit wil sê, dat ons 'n omkeerbare MA (Q) proses as 'n AR (infty) proses kan skryf. Omkeerbare modelle is nie net om ons in staat stel om van MA modelle om modelle AR. Hulle het ook 'n paar wiskundige eienskappe wat maak dit makliker om te gebruik in die praktyk. Die inverteerbaarheid beperkings is soortgelyk aan die stasionariteit beperkings. Vir 'n MA (1) model: -1lttheta1lt1. Vir 'n MA (2) model: -1lttheta2lt1, theta2theta1 GT-1, theta1 - theta2 Dit 1. Meer ingewikkelde voorwaardes hou vir qge3. Weereens, sal R sorg van hierdie beperkings te neem wanneer die beraming van die models. Linear versus nie-lineêre kleinste kwadrate ARIMA modelle wat sluit slegs AR terme is spesiale gevalle van lineêre regressiemodelle, vandaar kan hulle toegerus deur gewone kleinste kwadrate. AR voorspellings is 'n lineêre funksie van die koëffisiënte sowel as 'n lineêre funksie van die verlede data. In beginsel kan kleinste-kwadrate beramings van AR koëffisiënte presies bereken word vanaf outokorrelasies in 'n enkele quotiterationquot. In die praktyk, kan jy 'n AR model inpas in die meerdere prosedure Regressie - net agteruitgang EWENAAR (Y) (of wat ook al) op lags van homself. (Maar jy sou kry effens verskillende resultate van die ARIMA prosedure - sien hieronder) ARIMA modelle wat sluit MA terme is soortgelyk aan regressiemodelle, maar kan nie deur gewone kleinstekwadrate toegerus: voorspellings is 'n lineêre funksie van die verlede data, maar hulle is lineêre funksies van koëffisiënte - bv 'n ARIMA (0,1,1) model sonder konstante is 'n eksponensieel geweeg bewegende gemiddelde: waarin die voorspellings is 'n nie-lineêre funksie van die MA (1) parameter (quotthetaquot). Nog 'n manier om te kyk na die probleem: jy kan nie inpas MA modelle met behulp van gewone meervoudige regressie, want daars geen manier om foute as 'n onafhanklike veranderlike spesifiseer - die foute is nie bekend tot die model is toegerus Hulle moet opeenvolgend bereken. tydperk deur tydperk, gegewe die huidige parameter ramings. MA modelle vereis dus 'n nie-lineêre skatting algoritme wat gebruik gaan word, soortgelyk aan die quotSolverquot algoritme in Excel. Die algoritme gebruik 'n soektog proses wat tipies vereis 5 tot 10 iterasies en soms kan nie konvergeer. Jy kan die toleransies vir die bepaling van stap groottes en stop kriteria vir die soektog (hoewel verstekwaardes is gewoonlik OK) aan te pas. quotMeanquot versus quotconstantquot Die quotmeanquot en die quotconstantquot in ARIMA-model pas resultate is verskillende getalle wanneer die model sluit AR terme. Veronderstel dat jy pas 'n ARIMA model om Y waarin p die aantal outoregressiewe terme. (Aanvaar vir gerief dat daar geen MA terme.) Laat y dui die differenced (stationarized) weergawe van Y. bv y t Y t - Y t-1 as 'n mens nonseasonal verskil is gebruik. Toe die AR (p) vooruitskatting vergelyking vir y is: Dit is net 'n gewone meervoudige regressie model waarin 956 is die konstante term, 981 1 is die koëffisiënt van die eerste lag van y. en so aan. Nou, intern, die sagteware vat hierdie helling-afsnit vorm van die regressievergelyking om 'n soortgelyke vorm in terme van afwykings van die gemiddelde. Laat m dui die gemiddelde van die stationarized reeks y. Toe die p-orde outoregressiewe vergelyking kan geskryf word in terme van afwykings van die gemiddelde as: Deur die versameling van al die konstante terme in hierdie vergelyking, sien ons dit is gelykstaande aan die oorspronklike vorm van die vergelyking as: CONSTANT GEMIDDELDE x (1 - som AR koëffisiënte) die sagteware skat eintlik m (saam met die ander model parameters) en verslae dit as die gemiddelde in die model-pas resultate, tesame met sy standaard fout en t-statistiek, ens die konstante (956) word dan bereken volgens die formule hierbo. As die model nie AR terme bevat, die gemiddelde en die konstante is identies. In 'n model met 'n bevel van nonseasonal breukmetodes (net), die gemiddelde is die tendens faktor (gemiddelde tydperk tot tydperk verandering). In 'n model met 'n bevel van seisoenale breukmetodes (net), die gemiddelde is die jaarlikse tendens faktor (gemiddelde jaar-tot-jaar verandering). Die basiese probleem: 'n ARIMA model (of ander tyd reeks model) voorspel toekomstige waardes van die tyd reeks uit die verlede waardes - maar hoe moet die voorspelling vergelyking word geïnitialiseerd om 'n voorspelling te maak vir die heel eerste waarneming (Eintlik kan AR modelle geïnisialiseer deur die val van die eerste paar opmerkings - hoewel dit nie doeltreffend is en afval data-- maar MA modelle vereis 'n skatting van 'n vorige fout voordat hulle die eerste skatting kan maak) Vreemde, maar ware.. 'n stilstaande tyd reeks lyk dieselfde pad vorentoe of agtertoe in tyd, dus. Dieselfde model wat die toekoms van 'n reeks voorspel kan ook gebruik word om die verlede te voorspel. Die oplossing: om die meeste inligting uit te druk van die beskikbare data, die beste manier om 'n ARIMA model (of enige tyd reeks voorspelling model) inisialiseer is om agteruit vooruitskatting (quotbackforecastingquot) gebruik skattings van datawaardes te verkry voor tydperk 1. Wanneer jy gebruik die opsie backforecasting in ARIMA skatting, die soekalgoritme eintlik maak twee gaan deur die data op elke iterasie: eers 'n agterlike pas gemaak om datawaardes voor skat met behulp van die huidige parameter ramings, sal die beraamde datawaardes voor gebruik word om inisialiseer die voorspelling vergelyking vir 'n vorentoe-aangee deur die data. As jy dit nie gebruik maak van die opsie backforecasting, is die voorspelling vergelyking geïnisialiseer deur te aanvaar dat voor waardes van die stationarized reeks gelyk aan die gemiddelde was. As jy wel 'die opsie backforecasting, dan is die backforecasts wat gebruik word om die model inisialiseer is implisiete parameters van die model, wat moet beraam saam met die AR en MA koëffisiënte. Die aantal bykomende implisiete parameters is min of meer gelyk aan die hoogste lag in die model - gewoonlik 2 of 3 vir 'n nonseasonal model, en S1 of 2s1 vir 'n seisoenale model met seasonalitys. (As die model sluit beide 'n seisoenale verskil en 'n seisoenale AR of MA termyn, wat dit nodig het twee seisoene waarde van voor waardes te begin) Let daarop dat met óf backforecasting opsie, 'n AR-model word beraam op 'n ander manier as wat dit sou wees beraamde in die meerdere prosedure Regressie (ontbrekende waardes is nie slegs geïgnoreer - hulle vervang óf met 'n skatting van die gemiddelde of met backforecasts), vandaar 'n AR model toegerus in die ARIMA prosedure sal nooit presies lewer dieselfde parameter ramings as 'n AR-model toegerus in die meerdere prosedure Regressie. Konvensionele wysheid: draai backforecasting af wanneer jy nie seker is of die huidige model is geldig, draai dit op die finale parameterberaming te kry wanneer jy redelik seker die model is geldig. As die model is mis-gespesifiseerde, kan backforecasting lei tot mislukkings van die parameter ramings om saam te kom en / of om eenheid-wortel problems. Autoregressive geïntegreerde bewegende gemiddelde ARIMA (p, d, q) Modelle vir Tydreeksanalise Deur Michael Saal-Moore op 15 September 2015 in die vorige reeks artikels (Dele 1. 2 en 3) ons het in beduidende detail oor die AR (p), MA (Q) en ARMA (p, q) lineêre tydreeksmodelle. Ons gebruik hierdie modelle te gesimuleerde data stelle, toegerus modelle om parameters te herstel genereer en dan toegepas hierdie modelle om finansiële aandele data. In hierdie artikel gaan ons 'n uitbreiding van die ARMA model, te bespreek, naamlik die outoregressiewe geïntegreerde bewegende gemiddelde model, of ARIMA (p, d, q) model. Ons sal sien dat dit nodig is om die ARIMA model in ag neem wanneer ons 'n nie-stilstaande reeks. Sulke reeks kom in die teenwoordigheid van stogastiese tendense. Vinnige Recap en Volgende stappe Tot op datum het ons van mening dat die volgende modelle (die skakels sal jou neem na die toepaslike artikels): Ons het stadig maar seker opgebou ons begrip van tydreekse met konsepte soos serial korrelasie, stasionariteit, lineariteit, residue, correlograms, simuleer, toebehore, seisoenaliteit, voorwaardelike heteroskedastisiteit en hipotesetoetsing. Vanaf nog het ons nie 'n voorspelling of voorspelling van ons modelle uitgevoer en so het geen meganisme vir die vervaardiging van 'n handel stelsel of aandele kurwe het. Sodra ons ARIMA bestudeer (in hierdie artikel), boog en GARCH (in die volgende artikels), sal ons in staat wees om 'n basiese langtermyn handel strategie wat gebaseer is op die voorspelling van aandelemark-indeks opbrengste te bou. Ten spyte van die feit dat ek gegaan het in 'n baie detail oor modelle wat ons weet sal uiteindelik nie 'n groot prestasie (AR, MA, ARMA), wat ons nou goed vertroud met die verloop van tyd reeks modelle. Dit beteken dat wanneer ons kom om te studeer meer onlangse modelle (en selfs diegene wat tans in die navorsingsliteratuur), sal ons 'n beduidende kennisbasis waarop om te trek het, ten einde hierdie modelle effektief te evalueer, eerder as om hulle te behandel soos 'n beurt sleutel voorskrif of black box. Nog belangriker, sal dit ons met die vertroue op ons eie te brei en te verander hulle en verstaan ​​wat ons doen wanneer ons dit doen id graag dankie sê vir die feit dat die pasiënt tot dusver, soos dit mag lyk dat hierdie artikels is ver weg van die werklike aksie van werklike handel. Maar waar kwantitatiewe handel navorsing is versigtig, gemeet en neem baie tyd om reg te kry. Daar is geen kitsoplossing of ryk skema in Quant handel. Was byna gereed om ons eerste handel model, wat 'n mengsel van ARIMA en GARCH sal wees oorweeg, en daarom is dit noodsaaklik dat ons 'n paar keer die begrip van die ARIMA model spandeer goed Sodra ons ons eerste handel model gebou het, gaan ons meer te oorweeg gevorderde modelle soos lang geheue prosesse, state-ruimte modelle (dws die Kalman filter) en Vector outoregressiewe (VAR) modelle, wat ons sal lei tot ander, meer gesofistikeerd, handel strategieë. Outoregressiewe geïntegreerde bewegende gemiddelde (ARIMA) Models van orde p, d, is Q Rasionaal ARIMA modelle gebruik omdat hulle 'n nie-stasionêre reeks om 'n stilstaande reeks met behulp van 'n reeks breukmetodes stappe kan verminder. Ons kan onthou uit die artikel oor wit geraas en ewekansige loop dat as ons die verskil operateur van toepassing op 'n ewekansige loop reeks ( 'n nie-stasionêre reeks) ons gelaat met 'n wit geraas ( 'n stilstaande reeks): begin nabla xt xt - x wt einde ARIMA wese voer hierdie funksie, maar doen dit herhaaldelik, d keer, ten einde 'n nie-stasionêre reeks te verminder tot 'n stilstaande een. Met die oog op ander vorme van nie-stasionariteit hanteer buite stogastiese tendense kan bykomende modelle gebruik word. Seisoenaliteit effekte (soos dié wat in kommoditeitspryse) aangepak kan word met die seisoenale ARIMA model (SARIMA), maar ons sal nie bespreek SARIMA veel in hierdie reeks. Voorwaardelike heteroscedastic effekte (soos met wisselvalligheid groepering in aandele indekse) aangepak kan word met ARCH / GARCH. In hierdie artikel sal ons oorweeg nie-stasionêre reeks met stogastiese tendense en pas ARIMA modelle om hierdie reeks. Ons sal ook uiteindelik produseer voorspellings vir ons finansiële reeks. Definisies Voor definieer ARIMA prosesse wat ons nodig het om die konsep van 'n geïntegreerde reeks bespreek: Geïntegreerde Reeks van orde d A tydreekse geïntegreer orde d. Ek (d) indien: begin nablad xt wt einde Dit is, as ons verskil die reeks d tye waarin ons 'n diskrete wit geraas reeks ontvang. Alternatiewelik, met behulp van die agterste Shift Operateur ekwivalente toestand is: Noudat ons 'n geïntegreerde reeks kan ons die ARIMA proses self definieer gedefinieer: outoregressiewe geïntegreerde bewegende gemiddelde Model van orde p, d, q 'n tydreeks is 'n outoregressiewe geïntegreerde bewegende gemiddelde model van orde p, d, q. ARIMA (p, d, q). As nablad xt is 'n outoregressiewe bewegende gemiddelde van orde p, q, ARMA (p, q). Dit is, as die reeks is differenced d keer, en dit dan volg 'n ARMA (p, q) proses, dan is dit 'n ARIMA (p, d, q) reeks. As ons gebruik maak van die polinoom notasie uit Deel 1 en Deel 2 van die ARMA reeks, dan 'n ARIMA (p, d, q) proses kan geskryf word in terme van die agterste Shift-operateur. : Waar WT is 'n diskrete wit geraas reeks. Daar is 'n paar punte om daarop te let oor hierdie definisies. Sedert die ewekansige loop gegee word deur xt x wt dit kan gesien word dat ek (1) is 'n ander voorstelling, aangesien nabla1 xt wt. As ons vermoed dat 'n nie-lineêre tendens dan kan ons in staat wees om herhaalde breukmetodes (dit wil sê d GT 1) gebruik om 'n reeks te stilstaande wit geraas te verminder. In R kan ons die verskil opdrag gebruik met bykomende parameters, bv diff (x, d3) om uit te herhaal verskille dra. Simulasie, Correlogram en modelpassing Aangesien ons reeds gebruik van die arima. sim opdrag om 'n ARMA (p, q) proses na te boots het, sal die volgende prosedure soortgelyk aan dié in Deel 3 van die ARMA reeks gedra word. Die groot verskil is dat ons nou sal stel D1, dit is, sal ons 'n nie-stasionêre tydreekse met 'n stogastiese trending komponent produseer. Soos voorheen kan ons 'n ARIMA model aan ons gesimuleerde data pas, probeer om die parameters te herstel, te skep vertrouensintervalle vir hierdie parameters, produseer 'n correlogram van die residue van die toegeruste model en uiteindelik uit te voer 'n Ljung-Box toets om vas te stel of ons ' 'n goeie passing. Ons gaan 'n ARIMA (1,1,1) model simuleer, met die outoregressiewe koëffisiënt alpha0.6 en die bewegende gemiddelde koëffisiënt beta-0.5. Hier is die R-kode te simuleer en plot so 'n reeks: Noudat ons ons gesimuleerde reeks gaan ons probeer inpas n ARIMA (1,1,1) model om dit te. Aangesien ons die einde sal ons dit eenvoudig spesifiseer in die pas te weet: Die vertrouensintervalle word bereken as: Beide parameterberaming binne die vertrouensintervalle val en is naby aan die ware parameterwaardes van die gesimuleerde ARIMA reeks. Vandaar, behoort nie ons verbaas wees om te sien die residue op soek na 'n verwesenliking van diskrete wit geraas Uiteindelik, kan ons 'n Ljung-Box toets hardloop om statistiese bewyse van 'n goeie passing bied: Ons kan sien dat die p-waarde is aansienlik groter as 0.05 en as sodanig kan ons sê dat daar 'n sterk bewyse vir diskrete wit geraas wat 'n goeie passing vir die residue. Vandaar die ARIMA (1,1,1) model is 'n goeie passing, soos verwag. Finansiële inligting en voorspelling In hierdie afdeling gaan ons ARIMA modelle te pas by Amazon, Inc. (AMZN) en die SampP500 VSA Equity Index (GPSC, in Yahoo Finansies). Ons sal gebruik maak van die voorspelling biblioteek, geskryf deur Rob J Hyndman maak. Kom ons gaan voort en die installering van die biblioteek in R: Nou kan ons gebruik quantmod om die daaglikse prys reeks Amazon aflaai vanaf die begin van 2013 Sedert ons reeds die eerste orde verskille van die reeks sal geneem, die ARIMA inpas binnekort uitgevoer sal nie vereis dat d GT 0 vir die geïntegreerde komponent: Soos in Deel 3 van die ARMA reeks, ons is nou van plan om lus deur die kombinasies van p, d en Q, om die optimale ARIMA (p, d, q) model te vind. Deur optimale bedoel ons die einde kombinasie wat die Akaike Inligting Criterion (AIC) verminder: Ons kan sien dat 'n bevel van P4, D0, K4 is gekies. Veral D0, soos ons reeds die eerste orde verskille hierbo geneem: As ons plot die correlogram van die residue kan ons kyk of ons het bewyse vir 'n diskrete wit geraas reeks: Daar is twee belangrike pieke, naamlik by K15 en K21, hoewel ons moet verwag om statisties beduidende pieke sien bloot as gevolg van steekproefneming variasie 5 van die tyd. Kom ons doen 'n Ljung-Box toets (sien vorige artikel) en kyk of ons bewyse vir 'n goeie passing: Soos ons kan sien die p-waarde groter as 0.05 en so ons het bewyse vir 'n goeie passing op die vlak 95. Ons kan nou gebruik maak van die voorspelling opdrag van die voorspelling biblioteek ten einde 25 dae voor voorspel vir die opbrengste reeks Amazon: Ons kan die punt voorspellings sien vir die volgende 25 dae met 95 (donkerblou) en 99 (ligblou) fout bands . Ons sal gebruik word om hierdie voorspellings in ons eerste keer reeks handel strategie wanneer ons kom ARIMA en GARCH kombineer. Kom ons dieselfde prosedure vir die SampP500 uit te voer. Eerstens het ons die data verkry uit quantmod en skakel dit om na 'n daaglikse log opbrengste stroom: Ons pas 'n ARIMA model deur herhaling oor die waardes van p, d en Q: Die AIC sê vir ons dat die beste model is die ARIMA (2,0, 1) model. Let weereens dat D0, soos ons reeds die eerste orde verskille van die reeks geneem het: Ons kan die residue van die toegeruste model plot om te sien of ons 'n bewys van diskrete wit geraas: Die correlogram lyk belowend, sodat die volgende stap is om te hardloop die Ljung-Box toets en bevestig dat ons 'n goeie model pas: Aangesien die p-waarde groter as 0.05 het ons bewyse van 'n goeie model pas. Hoekom is dit dat in die vorige artikel ons Ljung-Box toets vir die SampP500 het getoon dat die ARMA (3,3) was 'n swak passing vir die daaglikse log opbrengste Let daarop dat ek doelbewus kapt die SampP500 data om te begin van 2013 af in hierdie artikel , wat gerieflik sluit die wisselvallige tydperke rondom 2007-2008. Vandaar het ons 'n groot gedeelte van die SampP500 waar ons moes buitensporige wisselvalligheid groepering uitgesluit. Dit impak die korrelasie van die reeks en vandaar het die uitwerking van die maak van die reeks lyk meer stilstaande as wat dit in die verlede was. Dit is 'n baie belangrike punt. Wanneer die ontleding van tydreekse wat ons nodig het om uiters versigtig van voorwaardelik heteroscedastic reeks, soos aandelemark indekse te wees. In kwantitatiewe finansies, probeer om tye van verskillende wisselvalligheid is dikwels bekend as regime opsporing te bepaal. Dit is een van die moeiliker take aan Wel bereik bespreek hierdie punt breedvoerig in die volgende artikel as ons kom tot die boog en GARCH modelle te oorweeg. Kom nou plot 'n voorspelling vir die volgende 25 dae van die SampP500 daaglikse log opbrengste: Nou dat ons die vermoë om aan te pas en weer modelle soos ARIMA, was baie naby aan die vermoë om strategie aanwysers te skep vir verhandeling. Volgende stappe in die volgende artikel gaan ons 'n blik op die algemene outoregressiewe voorwaardelike Heteroskedastisiteit (GARCH) model neem en dit gebruik om meer van die reeks korrelasie verduidelik in sekere aandele en aandele-indeks reeks. Sodra ons GARCH bespreek sal ons in staat wees om dit te kombineer met die ARIMA model en skep sein aanwysers en dus 'n basiese kwantitatiewe handel strategie. Michael Saal-Moore Mike is die stigter van QuantStart en is betrokke by die kwantitatiewe finansiële sektor vir die afgelope vyf jaar, in die eerste plek as 'n quant ontwikkelaar en later as 'n quant handelaar konsultasie vir verskansingsfondse. Verwante Articles2.1 bewegende gemiddelde modelle (MA modelle) tydreeksmodelle bekend as ARIMA modelle kan die volgende insluit outoregressiewe terme en / of bewegende gemiddelde terme. In Week 1, het ons geleer 'n outoregressiewe term in 'n tydreeks model vir die veranderlike x t is 'n vertraagde waarde van x t. Byvoorbeeld, 'n lag 1 outoregressiewe termyn is x t-1 (vermenigvuldig met 'n koëffisiënt). Hierdie les definieer bewegende gemiddelde terme. 'N bewegende gemiddelde termyn in 'n tydreeks model is 'n verlede fout (vermenigvuldig met 'n koëffisiënt). Laat (WT omslaan N (0, sigma2w)), wat beteken dat die w t is identies, onafhanklik versprei, elk met 'n normaalverdeling met gemiddelde 0 en dieselfde afwyking. Die 1 ste orde bewegende gemiddelde model, aangedui deur MA (1) is (xt mu wt theta1w) Die 2de orde bewegende gemiddelde model, aangedui deur MA (2) is (xt mu wt theta1w theta2w) Die Q de orde bewegende gemiddelde model , aangedui deur MA (Q) is (xt mu wt theta1w theta2w kolle thetaqw) Nota. Baie handboeke en sagteware programme definieer die model met negatiewe tekens voor die terme. Dit nie die geval verander die algemene teoretiese eienskappe van die model, hoewel dit flip die algebraïese tekens van beraamde koëffisiënt waardes en (unsquared) terme in formules vir ACFs en afwykings. Jy moet jou sagteware kyk om te kontroleer of negatiewe of positiewe tekens is gebruik om korrek te skryf die beraamde model. R gebruik positiewe tekens in sy onderliggende model, soos ons hier doen. Teoretiese Eienskappe van 'n tydreeks met 'n MA (1) Model Let daarop dat die enigste nie-nul waarde in die teoretiese ACF is vir lag 1. Alle ander outokorrelasies is 0. So 'n monster ACF met 'n beduidende outokorrelasie net by lag 1 is 'n aanduiding van 'n moontlike MA (1) model. Vir belangstellende studente, bewyse van hierdie eienskappe is 'n bylae tot hierdie opdragstuk. Voorbeeld 1 Veronderstel dat 'n MA (1) model is x t 10 w t 0,7 w t-1. waar (WT omslaan N (0,1)). So het die koëffisiënt 1 0.7. Die teoretiese ACF gegee word deur 'n plot van hierdie volg ACF. Die plot net aangedui is die teoretiese ACF vir 'n MA (1) met 1 0.7. In die praktyk, 'n monster gewoond gewoonlik verskaf so 'n duidelike patroon. Die gebruik van R, gesimuleerde ons N 100 monster waardes gebruik te maak van die model x t 10 w t 0,7 w t-1 waar w t IID N (0,1). Vir hierdie simulasie, 'n tydreeks plot van die steekproefdata volg. Ons kan nie sê baie van hierdie plot. Die monster ACF vir die gesimuleerde data volg. Ons sien 'n skerp styging in lag 1 gevolg deur die algemeen nie-beduidende waardes vir lags afgelope 1. Let daarop dat die monster ACF kom nie ooreen met die teoretiese patroon van die onderliggende MA (1), en dit is dat al outokorrelasies vir lags afgelope 1 sal wees 0 . 'n ander voorbeeld sou 'n effens verskillende monster ACF hieronder getoon, maar sal waarskynlik dieselfde breë funksies. Theroretical Eienskappe van 'n tydreeks met 'n MA (2) model vir die MA (2) model, teoretiese eienskappe is soos volg: Let daarop dat die enigste nie-nul waardes in die teoretiese ACF is vir lags 1 en 2. outokorrelasies vir hoër lags is 0 . So, 'n monster ACF met 'n beduidende outokorrelasies by lags 1 en 2, maar nie-beduidende outokorrelasies vir hoër lags dui op 'n moontlike MA (2) model. IID N (0,1). Die koëffisiënte is 1 0.5 en 2 0.3. Want dit is 'n MA (2), sal die teoretiese ACF nul waardes het net by lags 1 en 2. Waardes van die twee nie-nul outokorrelasies is 'n plot van die teoretiese ACF volg. Soos byna altyd die geval is, monster data gewoond te tree heeltemal so perfek as teorie. Ons gesimuleerde N 150 monster waardes vir die model x t 10 w t 0,5 w t-1 0,3 w t-2. waar w t IID N (0,1). Die tydreekse plot van die data volg. Soos met die tydreeks plot vir die MA (1) voorbeeld van die data, kan nie vir jou sê baie daaruit. Die monster ACF vir die gesimuleerde data volg. Die patroon is tipies vir situasies waar 'n MA (2) model nuttig kan wees. Daar is twee statisties beduidende spykers by lags 1 en 2, gevolg deur nie-beduidende waardes vir ander lags. Let daarop dat as gevolg van steekproeffout, die monster ACF nie die teoretiese patroon presies ooreenstem. ACF vir Algemene MA (Q) Models n eiendom van MA (Q) modelle in die algemeen is dat daar nie-nul outokorrelasies vir die eerste Q lags en outokorrelasies 0 vir alle lags GT q. Nie-uniekheid van verband tussen waardes van 1 en (rho1) in MA (1) Model. In die MA (1) model, vir enige waarde van 1. die wedersydse 01/01 gee dieselfde waarde vir so 'n voorbeeld, gebruik 0,5 vir 1. en gebruik dan 1 / (0,5) 2 vir 1. Jy sal kry (rho1) 0.4 in beide gevalle. Om 'n teoretiese beperking genoem inverteerbaarheid bevredig. Ons beperk MA (1) modelle om waardes met absolute waarde minder as 1. In die voorbeeld net gegee, 1 0.5 sal 'n toelaatbare parameter waarde wees nie, terwyl 1 1 / 0.5 2 nie. Inverteerbaarheid van MA modelle 'n MA-model word gesê omkeerbare te wees indien dit algebraïes gelykstaande aan 'n konvergerende oneindige orde AR model. Bevestig deur die, bedoel ons dat die AR koëffisiënte daal tot 0 as ons terug beweeg in die tyd. Inverteerbaarheid is 'n beperking geprogrammeer in die tyd reeks sagteware wat gebruik word om die koëffisiënte van modelle te skat met MA terme. Dit is nie iets wat ons gaan vir die data-analise. Bykomende inligting oor die inverteerbaarheid beperking vir MA (1) modelle word in die bylaag. Gevorderde teorie Nota. Vir 'n MA (Q) model met 'n bepaalde ACF, daar is net een omkeerbare model. Die noodsaaklike voorwaarde vir inverteerbaarheid is dat die koëffisiënte waardes sodanig dat die vergelyking 1- 1 y. - Q y q 0 het oplossings vir y wat buite die eenheidsirkel val. R-kode vir die voorbeelde in Voorbeeld 1, ons geplot die teoretiese ACF van die model x t 10 w t. 7W t-1. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik word om die teoretiese ACF plot was: acfma1ARMAacf (Mac (0,7), lag. max10) 10 lags van ACF vir MA (1) met theta1 0.7 lags0: 10 skep 'n veranderlike genaamd lags wat wissel van 0 tot 10. plot (lags, acfma1, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (1) met theta1 0.7) abline (H0) voeg n horisontale as om die plot die eerste opdrag bepaal die ACF en slaan dit in 'n voorwerp vernoem acfma1 (ons keuse van naam). Die plot opdrag (die 3de gebod) erwe lags teenoor die ACF waardes vir lags 1 tot 10. Die ylab parameter etikette die y-as en die belangrikste parameter sit 'n titel op die plot. Om te sien die numeriese waardes van die ACF net gebruik die opdrag acfma1. Die simulasie en erwe is gedoen met die volgende opdragte. xcarima. sim (N150, lys (Mac (0,7))) Simuleer N 150 waardes van MA (1) xxc10 voeg 10 tot gemiddelde 10. Simulasie gebreke maak beteken 0. plot (x, typeb, mainSimulated MA (1) data) ACF (x, xlimc (1,10), mainACF vir gesimuleerde steekproefdata) In Voorbeeld 2, ons geplot die teoretiese ACF van die model xt 10 wt 0,5 w t-1 0,3 w t-2. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik was acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (2) met theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, lys (Mac (0.5, 0.3))) xxc10 plot (x, typeb, hoof Gesimuleerde MA (2) Series) ACF (x, xlimc (1,10), mainACF vir gesimuleerde MA (2) Data) Bylae: Bewys van eiendomme van MA (1) vir belangstellende studente, hier is bewyse vir teoretiese eienskappe van die MA (1) model. Variansie: (teks (xt) teks (mu wt theta1 w) 0 teks (WT) teks (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wanneer h 1, die vorige uitdrukking 1 W 2. Vir enige h 2, die vorige uitdrukking 0 . die rede hiervoor is dat per definisie van onafhanklikheid van die WT. E (w k w j) 0 vir enige k j. Verder, omdat die w t het intussen 0, E (w j w j) E (w j 2) w 2. Vir 'n tydreeks, Pas hierdie resultaat aan die ACF hierbo kry. 'N omkeerbare MA model is die een wat geskryf kan word as 'n oneindige orde AR model wat konvergeer sodat die AR koëffisiënte konvergeer na 0 as ons oneindig terug in die tyd beweeg. Wel demonstreer inverteerbaarheid vir die MA (1) model. Ons het toe plaasvervanger verhouding (2) vir w t-1 in vergelyking (1) (3) (ZT wt theta1 (Z - theta1w) wt theta1z - theta2w) op tydstip t-2. vergelyking (2) word Ons het toe plaasvervanger verhouding (4) vir w t-2 in vergelyking (3) (ZT wt theta1 Z - theta21w wt theta1z - theta21 (Z - theta1w) wt theta1z - theta12z theta31w) As ons voortgaan ( oneindig), sou ons die oneindige orde AR model kry (ZT wt theta1 Z - theta21z theta31z - theta41z kolletjies) Nota egter dat as 1 1, die koëffisiënte die lags van Z vermenigvuldig sal toeneem (oneindig) in grootte as ons terug beweeg in tyd. Om dit te voorkom, moet ons 1 LT1. Dit is die voorwaarde vir 'n omkeerbare MA (1) model. Oneindige Bestel MA model In week 3, goed sien dat 'n AR (1) model kan omgeskakel word na 'n oneindige orde MA model: (xt - mu wt phi1w phi21w kolle phik1 w kolle som phij1w) Hierdie opsomming van verlede wit geraas terme is bekende as die oorsaaklike voorstelling van 'n AR (1). Met ander woorde, x t is 'n spesiale tipe MA met 'n oneindige aantal terme terug gaan in die tyd. Dit is 'n oneindige orde MA of MA () genoem. 'N Eindige orde MA is 'n oneindige orde AR en enige eindige orde AR is 'n oneindige orde MA. Onthou in Week 1, het ons opgemerk dat 'n vereiste vir 'n stilstaande AR (1) is dat 1 LT1. Kom ons bereken die Var (x t) met behulp van die oorsaaklike verteenwoordiging. Die laaste stap gebruik 'n basiese feit oor meetkundige reeks wat vereis (phi1lt1) anders sal die reeks divergeer. navigasie


No comments:

Post a Comment