class: center, middle, inverse, title-slide .title[ # Macroeconometría ] .subtitle[ ## Series de Tiempo Multivariadas ] .author[ ### Mauricio Tejada ] .institute[ ### Ingeniería Comercial ] --- layout: true <div class="my-footer"><img src="img/logo2.png" style="height: 35px;"/></div> --- class: separator-blue, middle # Modelos de Vectores Autoregresivos (VAR) --- ## Modelos VAR en su forma estructural - El modelo: `$$y_{t}=\alpha+\beta_{0}x_{t}+\beta_{1}x_{t-1}+...+\beta_{r}x_{t-r}+u_{t}$$` adolece de un problema: **falta de retroalimentación**. No tenemos seguridad de que `\(x_{t}\)` sea realmente exógena. - El modelo que toma en cuenta posible endogeneidad (determinación conjunta de `\(y\)` y `\(x\)`) es: `$$\begin{aligned} y_{t} = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\ x_{t} = & b_{20}-b_{21}y_{t}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt} \end{aligned}$$` - Este es un ejemplo de un vector autoregresivo (VAR) de primer orden. - Supuestos: (1) `\((y_{t},x_{t})\)` son estacionarias; (2) `\((\epsilon_{Yt},\epsilon_{Xt})\)` son ruido blanco con `\(\sigma_{Y}\)` y `\(\sigma_{X}\)` y no están correlacionados `\(\mathbb{E}[\epsilon_{ys}\epsilon_{xw}]=0\ \ \forall s,w\)`. - El modelo está escrito en forma estructural: Tanto `\(y_{t}\)` como `\(x_{t}\)` tienen efectos contemporáneos sobre el otro. --- ## Modelos VAR en su forma reducida - Escribamos el modelo en forma matricial: `$$\left[\begin{array}{cc} 1 & b_{12}\\ b_{21} & 1 \end{array}\right]\left[\begin{array}{c} y_{t}\\ x_{t} \end{array}\right]=\left[\begin{array}{c} b_{10}\\ b_{20} \end{array}\right]+\left[\begin{array}{cc} \gamma_{11} & \gamma_{12}\\ \gamma_{21} & \gamma_{22} \end{array}\right]\left[\begin{array}{c} y_{t-1}\\ x_{t-1} \end{array}\right]+\left[\begin{array}{c} \epsilon_{Yt}\\ \epsilon_{Xt} \end{array}\right]$$` - Definimos `\(\mathrm{z}_{t}=\left(y_{t},x_{t}\right)'\)`, entonces en forma compacta: `$$B \mathrm{z}_{t}=\Gamma_{0}+\Gamma_{1}\mathrm{z}_{t-1}+\mathrm{\varepsilon}_{t}$$` donde: `\(A_{0}=B^{-1}\Gamma_{0}\)`, `\(A_{1}=B^{-1}\Gamma_{1}\)` y `\(\mathrm{e}_{t}=B^{-1}\mathrm{\varepsilon}_{t}\)`. - Extendiendo la ecuación anterior: `$$\begin{aligned} y_{t} & = & a_{10}+a_{11}y_{t-1}+a_{12}x_{t-1}+e_{1t}\\ x_{t} & = & a_{20}+a_{21}y_{t-1}+a_{22}x_{t-1}+e_{2t} \end{aligned}$$` tenemos un **VAR en su forma reducida** (sin valores contemoporáneos en el lado derecho de las ecuaciones). --- ## Modelos VAR en su forma reducida - Note que: `$$B^{-1}=\left[\begin{array}{cc} 1 & b_{12}\\ b_{21} & 1 \end{array}\right]^{-1}=\frac{1}{1-b_{12}b_{21}}\left[\begin{array}{cc} 1 & -b_{12}\\ -b_{21} & 1 \end{array}\right]$$` - Usando este resultado: `$$e_{1t}=\frac{\epsilon_{yt}-b_{12}\epsilon_{xt}}{1-b_{12}b_{21}}\,\,\,\,\,\,\,\,\,e_{2t}=\frac{\epsilon_{xt}-b_{21}\epsilon_{yt}}{1-b_{12}b_{21}}$$` - La matriz de varianzas y covarianzas de los errores de la forma reducida es: `$$\Sigma=\left[\begin{array}{cc} \mathbb{E}[e_{1t}^{2}] & \mathbb{E}[e_{1t}e_{2t}]\\ \mathbb{E}[e_{1t}e_{2t}] & \mathbb{E}[e_{2t}^{2}] \end{array}\right]$$` donde: `$$\mathbb{E}[e_{1t}^{2}]=\frac{\sigma_{y}^{2}+b_{12}^{2}\sigma_{z}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\,\mathbb{E}[e_{2t}^{2}]=\frac{\sigma_{z}^{2}+b_{21}^{2}\sigma_{y}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\, \mathbb{E}[e_{1t}e_{2t}]=\frac{-(b_{21}\sigma_{y}^{2}+b_{12}\sigma_{z}^{2})}{(1-b_{12}b_{21})^{2}}$$` --- ## Estabilidad del modelo VAR - El modelo VAR es estable si todos los autovalores de `\(A_{1}\)` en: `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$` son menores que 1. - El VAR será estable si todas las variables incluidas en el modelo son estacionarias. **Problemas de estabilidad son signo de la presencia de no estacionariedad en las variables del VAR**. --- ## Estimación de los modelos VAR - Sims(1980) critica los modelos estructurales (ecuaciones simultáneas) en dos dimensiones: - Restricciones arbitrareas (y en algunos casos increíbles). - Decisión acerca de si una variable es endógena o exógena. - Consideremos la siguiente generalización VAR(p): `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+A_{2}\mathrm{z}_{t-2}+...+A_{p}\mathrm{z}_{t-p}+e_{t}$$` donde `\(\mathrm{z}_{t}\)` es un vector de `\(n\)` variables y `\(p\)` es el número de rezagos (entonces, tenemos `\(n+pn^{2}\)` parámetros a estimar). - Decisiones: - ¿Qué variables incluir en `\(\mathrm{z}_{t}\)`? Teoría económica. - ¿Cuantos rezagos `\((p)\)` incluir? Pruebas estadísticas formales. - El lado derecho de la forma reducida del VAR tiene únicamente variables predeterminadas (las mismas en todas las ecuaciones). Así, **cada ecuación puede ser estimada por separado por MCO**, esto a pesar de estar los errores de las ecuaciones correlacionados. --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - Es posible recuperar los parámetros del VAR estructural y los shocks estructurales? - La respuesta es no a menos que se impongan ciertas restricciones. - Retomemos el VAR(1) con 2 variables: `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$` - Note que: `\(\hat{A}_{0}=B^{-1}\Gamma_{0}\)`, `\(\hat{A}_{1}=B^{-1}\Gamma_{1}\)` y `\(\hat{\Sigma}=\left(B^{-1}\right)^{2}V(\varepsilon_{t})\)`. - Forma reducida: `\(2+4\times1+3=9\)` - Forma Estructural: `\(2+4\times1+2+2=10\)` - Es necesaria `\(1\)` restricción. En general en un VAR(p) con `\(n\)` variables se requieren `\(\frac{n^{2}-n}{2}\)` restricciones. --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - Imponer `\(b_{21}=0\)` en el VAR estructural: `\(y\)` **no tiene efecto contemporáneo en** `\(x\)`. `$$\begin{aligned} y_{t} = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\ x_{t} = & b_{20}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt} \end{aligned}$$` y `\(e_{1t} = \epsilon_{yt}-b_{12}\epsilon_{xt}\)`, `\(e_{2t} = \epsilon_{xt}\)`. - Los parámetros estructurales están identificados a partir de los estimados de la forma reducida: `$$\begin{aligned} \hat{a}_{10} & = & b_{10}-b_{12}b_{20}\\ \hat{a}_{11} & = & \gamma_{11}-b_{12}\gamma_{21}\\ \hat{a}_{12} & = & \gamma_{12}-b_{12}\gamma_{22}\\ \hat{a}_{20} & = & b_{20}\\ \hat{a}_{21} & = & \gamma_{21}\\ \hat{a}_{22} & = & \gamma_{22}\\ \hat{\mathbb{V}(e_{1})} & = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\ \hat{\mathbb{V}(e_{2})} & = & \sigma_{x}^{2}\\ \hat{Cov(e_{1},e_{2})} & = & -b_{12}\sigma_{x}^{3} \end{aligned}$$` --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - En general para un VAR con `\(k\)` variables: `\(B\)` es una matriz triangular (superior). `$$B=\left[\begin{array}{cccc} 1 & b_{12} & ... & b_{1k}\\ 0 & 1 & ... & b_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & 0 & 1 \end{array}\right]$$` - **Interpretación**: `\((y_{1t},y_{2t},y_{3t},...,y_{kt})\)` están ordenandas de más endógena a menos endógena. - `\(y_{1t}\)` es afectados contemporáneamente por `\((y_{2t},y_{3t},...,y_{kt})\)`. - `\(y_{2t}\)` es afectados contemporáneamente por `\((y_{3t},...,y_{kt})\)`. ... - `\(y_{kt}\)` es afectados contemporáneamente por `\(y_{kt}\)`. --- ## Resultados de un VAR - ¿Cómo presentar los resultados de un VAR? (1) Funciones de Impulso Respuesta; (2) Descomposición de la Varianza. - **Función de Impulso Respuesta**: Es la representación gráfica de los efectos de shocks sobre las variables del modelo VAR `\(j\)` periodos adelante. - Usemos por simplicidad un VAR(1) de dos variable con intercepto cero: `$$\begin{aligned} y_{t} = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{Yt}-b_{12}\epsilon_{Xt}\right)\\ x_{t} = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{Xt}\right) \end{aligned}$$` - Efecto de un shock `\(\epsilon_{yt}\)` de tamaño `\(\sigma_{y}\)` (el mismo ejercicio se puede hacer con un shock en `\(\epsilon_{yt}\)`): | | `\(Y\)` | `\(X\)` | | --- | --- | --- | | `\(0\)` | `\(\sigma_{Y}\)` | 0 | | `\(1\)` | `\(a_{11}\sigma_{Y}\)` | `\(a_{21}\sigma_{Y}\)` | | `\(2\)` | `\(a_{11}^{2}\sigma_{Y}+a_{12}a_{21}\sigma_{Y}\)` | `\(a_{21}a_{11}\sigma_{Y}+a_{22}a_{21}\sigma_{Y}\)` | | | ... | ... | --- ## Resultados de un VAR - **Descomposición de la Varianza**: - Recordemos nuevamente que: `$$\begin{aligned} y_{t} = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{yt}-b_{12}\epsilon_{xt}\right)\\ x_{t} = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{xt}\right) \end{aligned}$$` - La predicción a un período adelante es: `$$\begin{aligned} \mathbb{E}_{t}y_{t+1} = & a_{11}Y_{t}+a_{12}x_{t}+\left(\epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\right)\\ \mathbb{E}_{t}x_{t+1} = & a_{21}Y_{t}+a_{22}x_{t}+\left(\epsilon_{xt+1}\right) \end{aligned}$$` - Los errores de predicción satisfacen: `$$\begin{aligned} y_{t+1}-\mathbb{E}_{t}y_{t+1} = & \epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\\ x_{t+1}-\mathbb{E}_{t}x_{t+1} = & \epsilon_{xt+1} \end{aligned}$$` --- ## Resultados de un VAR - Aplicando el operador varianza: `$$\begin{aligned} \sigma_{y}^{2}(1) = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\ \sigma_{x}^{2}(1) = & \sigma_{x}^{2} \end{aligned}$$` - Entonces, para el caso de `\(y\)`: `$$\begin{aligned} \%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{yt} = & \frac{\sigma_{y}^{2}}{\sigma_{y}^{2}(1)}\\ \%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{xt} = & \frac{b_{12}^{2}\sigma_{x}^{2}}{\sigma_{y}^{2}(1)} \end{aligned}$$` - Para el caso de `\(x\)` `$$\begin{aligned} \%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{yt} = & 0\\ \%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{xt} = & \frac{\sigma_{x}^{2}}{\sigma_{x}^{2}(1)} \end{aligned}$$` - Este ejercicio se repite para 2, 3, ..., `\(j\)` periodos adelante. --- ## Elección del rezago óptimo - Aumento en el número de rezago reduce sustancialmente los grados de libertad. - Con `\(n\)` variable y `\(p\)` rezagos, un rezago adicional implica estimar `\(n\times p\)` nuevos parámetros. - Existe un `\(p\)` óptimo tal que cualquier rezago menor genera mala especificación y cualquier rezago mayor tiene muy pocos grados de libertad. - Una alternativa es usar los criterios de información: `$$\begin{aligned} AIC = & Tlog|\Sigma|+2N\\ BIC = & Tlog|\Sigma|+Nlog(T) \end{aligned}$$` donde `\(N\)` es el total de parámetros estimados en todas las ecuaciones. --- ## Elección del rezago óptimo - Otra alternativa es usar un test de exclusión de rezagos: - Elegir un rezago suficientemente grande, digamos `\(P_{NR}\)`. Estimar el VAR y calcular `\(\Sigma_{NR}\)`. - Asumimos que `\(p\)` puede ser menor y estimamos un VAR con `\(P_{R}(<P_{NR})\)` rezagos y calculamos: `\(\Sigma_{R}\)`. `$$\mathrm{H}_{0}:A_{P_{NR}}=A_{P_{NR}-1}=...=\mathrm{0}$$` - Calcular el siguiente estadístico: `$$LR=\left(T-c\right)\left\{ log|\Sigma_{R}|-log|\Sigma_{NR}|\right\}\sim\chi_{(P_{NR}-P_{R})\times n\times n}^{2}$$` donde `\(T\)` = No. Observaciones y `\(c\)` No de parámetros estimados en cada ecuación del modelo no restringido `\((p=P_{NR})\)`. --- ## Test de causalidad de Granger - Una variable Granger causa a otra si tiene información relevante a predecir el comportamiento de dicha variable. - Suponga un VAR(2) con `\(2\)` variables: `$$\begin{aligned} y_{t} = & a_{10}+a_{11}^{1}y_{t-1}+a_{12}^{1}x_{t-1}+a_{11}^{2}y_{t-2}+a_{12}^{2}x_{t-2}+e_{1t}\\ x_{t} = & a_{20}+a_{21}^{1}y_{t-1}+a_{22}^{1}x_{t-1}+a_{21}^{2}y_{t-2}+a_{22}^{2}x_{t-2}+e_{2t} \end{aligned}$$` entonces: - Decimos que `\(x_{t}\)` no Granger causa a `\(y_{t}\)` si: `\(a_{12}^{1}=a_{12}^{2}=0\)`. - Decimos que `\(y_{t}\)` no Granger causa a `\(x_{t}\)` si: `\(a_{21}^{1}=a_{21}^{2}=0\)`. - Un test F sobre cada ecuación permite probar las hipótesis de causalidad a la Granger. --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Usemos datos del PNB, del deflactor de precios del PNB y de la tasa de interés para los EEUU: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa-1.png" width="90%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Partamos por un VAR(1): ``` ## $dlrealgnp.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.25266954 0.06606677 3.8244570 1.732178e-04 ## fedfunds.t.l1 -0.07020124 0.02304962 -3.0456568 2.622027e-03 ## dlgnpdeflactor.t.l1 0.04945582 0.13238764 0.3735683 7.091060e-01 ## const 0.97519927 0.14212025 6.8617898 7.657579e-11 ## ## $fedfunds.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.3485736 0.06949273 5.015972 1.129131e-06 ## fedfunds.t.l1 0.9171332 0.02424488 37.827905 3.430035e-95 ## dlgnpdeflactor.t.l1 0.4953839 0.13925273 3.557445 4.637648e-04 ## const -0.2334530 0.14949003 -1.561662 1.198877e-01 ## ## $dlgnpdeflactor.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.02010743 0.023300013 0.8629793 3.891428e-01 ## fedfunds.t.l1 0.02032199 0.008128996 2.4999383 1.319413e-02 ## dlgnpdeflactor.t.l1 0.79216934 0.046689639 16.9667052 4.162995e-41 ## const 0.04951477 0.050122072 0.9878836 3.243574e-01 ``` --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Selección de Rezagos: ``` ## $selection ## AIC(n) HQ(n) SC(n) FPE(n) ## 6 3 1 6 ## ## $criteria ## 1 2 3 4 5 6 ## AIC(n) -3.14791384 -3.26471095 -3.42992284 -3.48193451 -3.52660357 -3.55322434 ## HQ(n) -3.06951159 -3.12750700 -3.23391720 -3.22712718 -3.21299455 -3.18081362 ## SC(n) -2.95405698 -2.92546144 -2.94528068 -2.85189970 -2.75117611 -2.63240423 ## FPE(n) 0.04294225 0.03821098 0.03239686 0.03076337 0.02943229 0.02867737 ## 7 ## AIC(n) -3.53813090 ## HQ(n) -3.10691849 ## SC(n) -2.47191814 ## FPE(n) 0.02913899 ``` - Al **mejor modelo parece ser un VAR(6)** según el criterio AIC. --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Estabilidad del VAR: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_roots-1.png" width="95%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Test de causalidad de Granger: ``` ## ## Granger causality H0: dlrealgnp.t do not Granger-cause fedfunds.t ## dlgnpdeflactor.t ## ## data: VAR object var_est ## F-Test = 4.4243, df1 = 12, df2 = 564, p-value = 8.64e-07 ``` ``` ## ## Granger causality H0: dlgnpdeflactor.t do not Granger-cause dlrealgnp.t ## fedfunds.t ## ## data: VAR object var_est ## F-Test = 2.8497, df1 = 12, df2 = 564, p-value = 0.0008107 ``` ``` ## ## Granger causality H0: fedfunds.t do not Granger-cause dlrealgnp.t ## dlgnpdeflactor.t ## ## data: VAR object var_est ## F-Test = 3.78, df1 = 12, df2 = 564, p-value = 1.52e-05 ``` --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Análisis de impulso respuesta: .pull-left[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_firy-1.png" width="98%" style="display: block; margin: auto;" /> ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_firpi-1.png" width="98%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Análisis de descomposición de la varianza del error de predicción: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_dv-1.png" width="70%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Es posible también realizar predicciones usando un modelo VAR: ``` ## $dlrealgnp.t ## fcst lower upper CI ## [1,] 0.6051134 -0.8884103 2.098637 1.493524 ## [2,] 1.3391177 -0.2010514 2.879287 1.540169 ## [3,] 0.9948993 -0.6508928 2.640691 1.645792 ## [4,] 1.0483830 -0.6236753 2.720441 1.672058 ## ## $fedfunds.t ## fcst lower upper CI ## [1,] 4.251206 2.736735 5.765676 1.514471 ## [2,] 4.038232 1.640145 6.436320 2.398087 ## [3,] 4.370730 1.388617 7.352844 2.982114 ## [4,] 4.514533 0.956865 8.072200 3.557668 ## ## $dlgnpdeflactor.t ## fcst lower upper CI ## [1,] 0.5956998 0.08574974 1.1056498 0.5099500 ## [2,] 0.4162482 -0.14849685 0.9809932 0.5647450 ## [3,] 0.4810127 -0.13007987 1.0921053 0.6110926 ## [4,] 0.4997431 -0.15425397 1.1537401 0.6539971 ``` --- class: separator-blue, middle # Cointegración y modelo de Corrección de error --- ## Cointegración: Ideas básicas - **Regresión Espúrea**: Consideremos dos procesos de caminata aleatoria independientes: `$$\begin{aligned} y_{t} & = & y_{t-1}+u_{t}\\ x_{t} & = & x_{t-1}+v_{t} \end{aligned}$$` con `\(\mathbb{E}[u_{s}v_{t}]=0\)` para todo `\(t,s\)`, y `\(\mathbb{E}[u_{t}u_{t-j}]=\mathbb{E}[v_{t}v_{t-j}]=0\)` para todo `\(j\)`. - Por construcción no hay ninguna relación entre las variables `\(y_{t}\)` y `\(x_{t}\)`. Ambas están construidas con procesos independientes. - ¿Qué sucedería si corremos por MCO la siguiente regresión?: `$$y_{t}=\alpha+\beta x_{t}+w_{t}$$` - ¿Qué valor se debiera esperar para la estimación de `\(\beta\)`? ¿y `\(R^{2}\)`? --- ## Cointegración: Ideas básicas .pull-left[ - Usemos simulaciones para responder estas preguntas. .regression[ <table style="text-align:center"><tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td>y</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">x</td><td>-1.242<sup>***</sup> (0.220)</td></tr> <tr><td style="text-align:left">Constant</td><td>-13.457<sup>***</sup> (0.688)</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">R<sup>2</sup></td><td>0.246</td></tr> <tr><td style="text-align:left">F Statistic</td><td>31.976<sup>***</sup> (df = 1; 98)</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> </table> ]] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/sim_rw-1.png" width="85%" style="display: block; margin: auto;" /> ] - Note que `\(R^{2}\)` alto, `\(F\)` grande, estadísticos `\(t\)` mayores que 2. Si alguna variable incluida en la regresión tiene raíz unitaria la regresión captura únicamente la tendencia común presente en ellas y no tiene ningún sentido económico. --- ## Cointegración y tendencias estocásticas comunes - **Cointegración**: Hay un caso particular en que no ocurre el fenómeno de regresión espúrea. Retomemos los procesos de caminata aleatoria: `$$y_{t}=\sum_{i=0}^{\infty}u_{t-i}\ \ \text{y} \ \ x_{t}= \sum_{i=0}^{\infty}v_{t-i}$$` - Reemplazando en la ecuación MCO. `$$\sum_{i=0}^{\infty}u_{t-i}=\alpha+\beta\sum_{i=0}^{\infty}v_{t-i}+w_{t}$$` alternativamente: `$$w_{t}=\sum_{i=0}^{\infty}u_{t-i}-\alpha-\beta\sum_{i=0}^{\infty}v_{t-i}$$` - Si `\(w_{t}\)` es `\(I(1)\)` entonces la regresión es espúrea. Sin embargo, si `\(w_{t}\)` es `\(I(0)\)` **las tendencias estocásticas se cancelan** y por tanto las dos series que cointegran. --- ## Cointegración y tendencias estocásticas comunes .pull-left[ - **Interpretación**: Sentido económico para una tendencia común. - Existencia de una relación de equilibrio estable de largo plazo entre dos o más variables. Para lo anterior se requiere de un movimiento coordinado en el tiempo (con algunos desvíos transitorios). ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/tendenciascomunes-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Cointegración y tendencias estocásticas comunes - Suponga `\(w_{t}=0,\)` entonces proporcionalidad en tendencias estocásticas: `$$\sum_{i=0}^{\infty}u_{t-i}=\alpha+\beta\sum_{i=0}^{\infty}v_{t-i}$$` - **Condición 1**: Para que exista el movimiento coordinado en tendencia ambos procesos tiene que tener el mismo número de raíces unitarias, por ejemplo I(1). - **Condición 2**: Cualquier desvío de la tendencia que hace que las series no muestren un comportamiento similar es netamente transitorio o desaparece relativamente rápido. - La Tendencia `\(\rightarrow\)` Relación de largo plazo. - Desvío `\(\rightarrow\)` Discrepancia de corto plazo (ej por shock). `$$\underset{I(1)}{y_{t}}=\alpha+\beta\underset{I(1)}{x_{t}}+\underset{I(0)}{w_{t}}$$` --- ## Cointegración y tendencias etocásticas comunes .pull-left[ - Entonces `\(w_{t}\)` es un shocks transitorio. Recordemos que en una serie integrada los shocks tienen efectos permanentes. En una serie estacionaria el efecto de los shocks es transitorio. - Si en una regresión los **errores son estacionarios**, entonces existe una relación de equilibrio estable de largo plazo. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/cointresids-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Cointegración y tendencias estocásticas comunes **Definición** *Si dos o más series de tiempo están integradas de orden 1, puede existir una combinación lineal entre ellas que esté integrada de orden 0. El conjunto de parámetros que define la combinación lineal se denomina vector de cointegración.* - En general, suponga que se tiene `\(M\)` variables `\(Y_{t}=[Y_{1t},...,Y_{Mt}]\)` integradas de orden 1, la relación de largo plazo será: `$$Y_{1t}-\beta_{1}-\beta_{2}Y_{2t}-...-\beta_{M}Y_{Mt}=0$$` con `\(\beta=(\beta_{1},...,\beta_{M})\)` que es el vector de cointegración. - En el corto plazo el sistema puede no estar en equilibrio: `$$Y_{1t}-\beta_{1}-\beta_{2}Y_{2t}-...-\beta_{M}Y_{Mt}=\epsilon_{t}$$` donde `\(\epsilon_{t}\)` es el error de equilibrio (desviaciones). Esteerror debe ser `\(I(0)\)`. - Nota: Si existen `\(M\)` variables en el sistema, podrían haber a lo más `\(M-1\)` vectores de cointegración. --- ## Test de cointegración - **Test Engle y Granger (1987)**: Implementación: 1. Verificar (test ADF) el orden de integración de las series: `\(y_{t},x_{1t},...,x_{Kt}\)` 2. Estimar por mínimos cuadrados ordinarios la regresión: `$$y_{t}=\beta_{0}+\beta_{1}x_{1t}+...+\beta_{K}x_{Kt}+w_{t}$$` 3. Calcular los errores del modelo: `\(\hat{w}_{t}=y_{t}-\left(\hat{\beta}_{0}+\hat{\beta}_{1}x_{1t}+...+\hat{\beta}_{K}x_{Kt}\right)\)`. 4. Aplicar el test DF a los errores estimados `\(\hat{w}_{t}\)` sin constante y sin tendencia. `$$\Delta\hat{w}_{t}=\phi\hat{w}_{t-1}+\delta_{1}\Delta\hat{w}_{t-1}+...\delta_{p}\Delta\hat{w}_{t-p}+\eta_{t}$$` donde `\(H_{0}:\phi=0\)` 5. Si los errores son estacionario (rechazamos la hipótesis nula) entonces existe cointegración: `\(\left|\frac{\hat{\phi}-0}{\sqrt{\hat{var(\phi)}}}\right|>\left|VC_{EG}\right|\)`. --- ## Test de cointegración - Los valores críticos son distintos ya que por definición al estimar MCO minimizamos la varianza de los errores. <img src="img/vcenglegranger.png" width="70%" style="display: block; margin: auto;" /> --- ## Corrección de error y representación VAR - Suponga dos variables `\(I(1),\)` `\((y_{t},x_{t}),\)` que cointegran y el vector de cointegración es `\([1,-\theta]\)`. - Note que las variables `\(\Delta y_{t}\)`, `\(\Delta x_{t}\)`, y `\((y_{t}-\theta x_{t})\)` son `\(I(0)\)`. - El modelo de corrección de error (suponga un VEC(1)) es: `$$\begin{aligned} \Delta y_{t} = & \alpha_{y}(y_{t-1}-\theta x_{t-1})+a_{11}\Delta y_{t-1}+a_{12}\Delta x_{t-1}+\epsilon_{yt}\\ \Delta x_{t} = & \alpha_{x}(y_{t-1}-\theta x_{t-1})+a_{21}\Delta y_{t-1}+a_{22}\Delta x_{t-1}+\epsilon_{xt} \end{aligned}$$` - Los parámetros `\((\alpha_{y},\alpha_{x})\)` son la velocidad de ajuste (proporción del desequilibrio es corregido en `\(t\)`). - Matricialmente el VEC(1) sería (tomemos en cuenta que `\(m_t=[y_t,x_t]\)`): `$$\Delta m_t = \alpha \beta' m_{t-1} + A_1 \Delta m_{t-1} + \epsilon_{t}$$` `$$\left[\begin{array}{c} \Delta y_{t}\\ \Delta x_{t} \end{array}\right]=\left[\begin{array}{cc} \alpha_{y} & \alpha_{x}\end{array}\right]\left[\begin{array}{cc} 1 & -\theta\\ 1 & -\theta \end{array}\right]\left[\begin{array}{c} y_{t-1}\\ x_{t-1} \end{array}\right]+\left[\begin{array}{cc} a_{11} & a_{12}\\ a_{21} & a_{22} \end{array}\right]\left[\begin{array}{c} \Delta y_{t}\\ \Delta x_{t} \end{array}\right]+\left[\begin{array}{c} \epsilon_{yt}\\ \epsilon_{xt} \end{array}\right]$$` --- ## Nota sobre el modelo de corrección de error - Para entender mejor el VEC derivemos sus ecuaciones a partir de la relación de largo plazo: `$$y_{t} = \theta x_{t} + u_t$$` - Si `\(y_{t},x_{t}\)` cointegran quiere decir que `\(u_t\)` es estacionario. Un modelo que caracteriza ese proceso sería: `$$u_t = \rho u_{t-1} + \epsilon_t \ \ \ \ |\rho|<1$$` - Combinando la ecuación anterior con `\(u_t = y_{t} - \theta x_{t}\)` tenemos: `$$\begin{aligned} y_{t} - \theta x_{t} &= \rho (y_{t-1} - \theta x_{t-1}) + \epsilon_t \\ y_{t} &= \theta x_{t} + \rho (y_{t-1} - \theta x_{t-1}) + \epsilon_t \end{aligned}$$` - Sumando y restando `\(y_{t-1},x_{t-1}\)` de ambos lados: $$ `\begin{aligned} \Delta y_{t} &=-\left(1-\rho\right)\left(y_{t-1}-\theta x_{t-1}\right)+\left(\theta \Delta x_{t}+\epsilon_t\right) \\ &=\alpha\left(y_{t-1}-\theta x_{t-1}\right)+\tilde{\epsilon}_{t} \end{aligned}` $$ - Note que mientras más persistente es el desequilibrio `\(u_t\)` ( `\(\rho\)` cercano a 1), más lento es el ajuste `\(\alpha\)`. --- ## Nota sobre el modelo de corrección de error - Alternativamente se puede ver el VEC como un modelo de rezagos distribuidos. - Consideremos el siguiente ejemplo: `$$y_{t}=\phi y_{t-1}+\gamma x_{t}+\epsilon_t$$` - Substrayendo `\(y_{t-1}\)` y `\(\gamma x_{t-1}\)` de ambos lados: $$ `\begin{aligned} \Delta y_{t} &=\gamma \Delta x_{t}-\left(1-\phi\right) y_{t-1}+\gamma x_{t-1}+\epsilon_t \\ &=-\left(1-\phi\right)\left(y_{t-1}-\frac{\gamma}{1-\phi} x_{t-1}\right)+(\gamma \Delta x_{t}+\epsilon_t) \end{aligned}` $$ - En estado estacionario (equilibrio de largo plazo) $$ \bar{y}=\phi \bar{y}+\gamma \bar{x} \rightarrow \bar{y}=\frac{\gamma}{1-\phi} \bar{x} $$ - Entonces `\(\frac{\gamma}{1-\phi}\)` describe la relación de largo plazo y tenemos la equivalencia con el VEC. --- ## El modelo de corrección de error (caso general) - Podemos generalizar el modelo de corrección de error a `\(k\)` variables y `\(p\)` rezagos. También debemos distinguir 5 casos en función de los componentes deterministicos que lleve. - **Caso 1**: Sin interceptos ni tendencias: `$$\Delta m_t=\alpha \beta' m_{t-1}+\sum_{j=1}^{p-1} A_j \Delta m_{t-j}+\epsilon_{t}$$` - **Caso 2**: Con intercepto solo en la relación de largo plazo (intercepto restringido): `$$\Delta m_t=\alpha \beta' (m_{t-1}+\mu)+\sum_{j=1}^{p-1} A_j \Delta m_{t-j}+\epsilon_{t}$$` - **Caso 3**: Con intercepto en el VEC pero no en la relación de largo plazo. `$$\Delta m_t= A_0 + \alpha \beta' (m_{t-1})+\sum_{j=1}^{p-1} A_j \Delta m_{t-j}+\epsilon_{t}$$` --- ## El modelo de corrección de error (caso general) - Podemos generalizar el modelo de corrección de error a `\(k\)` variables y `\(p\)` rezagos. También debemos distinguir 5 casos en función de los componentes deterministicos que lleve. - **Caso 4**: Con intercepto en el VEC y tendencia deterministica en la relación de largo plazo (tendencia restringida): `$$\Delta m_t= A_0 + \alpha \beta' (m_{t-1} + \gamma (t-1))+\sum_{j=1}^{p-1} A_j \Delta m_{t-j}+\epsilon_{t}$$` - **Caso 4**: Con intercepto y tendencia deterministica en el VEC: `$$\Delta m_t= A_0 + \Gamma t + \alpha \beta' m_{t-1}+\sum_{j=1}^{p-1} A_j \Delta m_{t-j}+\epsilon_{t}$$` - **Todo lo aprendido en el análisis VAR aplica en este caso**: Estimación MCO ecuación por ecuación (previa estimación de la relación de largo plazo), elección de `\(p\)` en base a criterios de información AIC o BIC, FIR, DV, etc. --- ## Ejemplo 2: El enfoque de Engle-Granger y la función consumo keynesiana .pull-left[ - Buscamos analizar la relación de largo plazo y el ajuste a corto plazo en la función consumo. - Recodemos que: `$$\log cons_t = \alpha + \beta \log pib_t + u_t$$` donde `\(cons_t\)` es el consumo real de bienes y servicios y `\(pib_t\)` es el PIB real. - Tenemos datos trimestrales de consumo y PIB reales para EEUU para el periodo entre 1947 y 2012. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/funcion_consumo-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 2: El enfoque de Engle-Granger y la función consumo keynesiana .pull-left[ - Regresión de largo plazo: ``` ## Estimate Std. Error t value ## (Intercept) -0.9616851 0.018573721 -51.77665 ## lrgdp.ts 1.0622889 0.002149558 494.18946 ``` - Test de raíz unitaria a los errores de regresión ``` ## lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag) ``` ``` ## Estimate Std. Error t value ## z.lag.1 -0.09191482 0.02470425 -3.720607 ## z.diff.lag -0.07776701 0.06056230 -1.284083 ``` - Dado que el valor crítico EG es -3.3, tenemos evidencia suficiente para rechazar la hipótesis nula de presencia de raíz unitaria en los errores. **Las series cointegran**. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/errores_funcion_consumo-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 2: El enfoque de Engle-Granger y la función consumo keynesiana - Modelo de **corrección de error**: .regression[ <table style="text-align:center"><tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td>d(lrcons.ts)</td><td>d(lrgdp.ts)</td></tr> <tr><td style="text-align:left"></td><td>(1)</td><td>(2)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">L(d(lrcons.ts), 1:2)1</td><td>-0.002 (0.076)</td><td>0.332<sup>***</sup> (0.083)</td></tr> <tr><td style="text-align:left">L(d(lrcons.ts), 1:2)2</td><td>0.321<sup>***</sup> (0.077)</td><td>0.218<sup>**</sup> (0.084)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)1</td><td>0.137<sup>**</sup> (0.069)</td><td>0.141<sup>*</sup> (0.076)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)2</td><td>-0.086 (0.065)</td><td>0.020 (0.071)</td></tr> <tr><td style="text-align:left">L(u)</td><td>-0.014 (0.024)</td><td>0.088<sup>***</sup> (0.027)</td></tr> <tr><td style="text-align:left">Constant</td><td>0.005<sup>***</sup> (0.001)</td><td>0.002<sup>**</sup> (0.001)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Observations</td><td>261</td><td>261</td></tr> <tr><td style="text-align:left">R<sup>2</sup></td><td>0.133</td><td>0.244</td></tr> <tr><td style="text-align:left">F Statistic (df = 5; 255)</td><td>7.810<sup>***</sup></td><td>16.443<sup>***</sup></td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td colspan="2" style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> </table> ] --- ## Limitaciones del enfoque de Engle y Granger (1987) - En enfoque basado en residuos de Engle y Granger (1987) tiene varias **limitaciones importantes**. 1. El investigador debe saber con certeza que las **variables son I(1)**. - Probar si las variables subyacentes son I(1) puede introducir un grado adicional de incertidumbre en el análisis. 2. El investigador necesita especificar las **variables del lado izquierdo** por adelantado: $$ `\begin{aligned} &y_{t}=\beta_x x_{t}+e_{t} \\ &x_{t}=\beta_y y_{t}+v_{t} \end{aligned}` $$ - ¿Podria `\(e_t\)` ser I(0) pero `\(v_t\)` no? Invertir el orden puede dar resultados diferentes. - No se pueden identificar varios vectores de cointegración (o su forma) - Dependencia de un procedimiento de dos pasos: errores del primer paso se trasmiten al segundo paso. --- ## Test de cointegración de Pesaran, Shin, y Smith (2001) - Para evitar introducir un grado adicional de incertidumbre en el análisis al probar que las variable son I(1) podríamos intentar probar cointegración directamente en el VEC. - Pesaran, Shin y Smith (2001) sugieren estimaer un modelo de corrección de errores, como si tuviéramos un modelo de rezagos distribuidos, y testear directamente cointegración. - **Ejemplo**: Supongamos que estamos interesados en probar la existencia de una relación de largo plazo entre `\(y_t\)`, `\(x_t\)` y `\(z_t\)` pero **no estamos seguros si estas variables son I(1) o I(0)**. --- ## Test de cointegración de Pesaran, Shin, y Smith (2001) - Tenemos el siguiente modelo de corrección de error VEC(1) para la dinámica de `\(y_t\)` es: `$$\begin{aligned} \Delta y_{t} &= \alpha_{y}(y_{t-1}-\theta_x x_{t-1}-\theta_z z_{t-1})+a_{11}\Delta y_{t-1}+a_{12}\Delta x_{t-1}+a_{13}\Delta z_{t-1}+\epsilon_{yt}\\ \Delta y_{t} &= \delta_y y_{t-1} +\delta_x x_{t-1} + \delta_z z_{t-1}+a_{11}\Delta y_{t-1}+a_{12}\Delta x_{t-1}+a_{13}\Delta z_{t-1}+\epsilon_{yt} \end{aligned}$$` - Entonces, la siguiente hipótesis nula implicaría ausencia de cointegración: `$$H_0: \delta_y = \delta_x = \delta_z = 0$$` ya que la dinámica de `\(y_t\)`, `\(x_t\)` y `\(z_t\)` puede ser representada por un VAR(1) estacionario. En otras palabras, no existe componente de corrección de error. - Pesaran, Shin, y Smith (2001) tabulan lo valores críticos para el test F (los cuáles depende de si el modelo tiene constante y constante + tendencia en el VEC o en la relación de largo plazo). --- ## Test de cointegración de Pesaran, Shin, y Smith (2001) - **Pasos del test Pesaran, Shin, and Smith (2001)** [usando de nuevo el ejemplo con 3 variables]: 1. Estimar la regresión de `\(\Delta y_{t}\)` contra `\(p-1\)` rezagos de `\(\Delta y_{t}\)`, `\(\Delta x_{t}\)`, y `\(\Delta x_{t}\)` (con `\(p\)` rezago con mejor ajuste) y contra el `\(y_{t-1}\)`, `\(x_{t-1}\)`, y `\(z_{t-1}\)` *[Nota: Elegir previamente el mejor modelo: constante, contantes + tendencia, en el VEC y/o en la relación de largo plazo]* 2. Realizar la prueba F para la hipótesis nula de que los coeficientes de `\(y_{t-1}\)`, `\(x_{t-1}\)`, y `\(z_{t-1}\)` son todos simultáneamente cero. 3. Comparar estadístico F del paso 2 los valores críticos superior e inferior ( `\(F_U\)` y `\(F_L\)`) apropiados de Pesaran, Shin, and Smith (2001) para un nivel de significancia dado: – Si `\(F > F_U\)`, entonces rechace `\(H_0\)` (existe una potencial relación de largo plazo). – Si `\(F < F_L\)`, entonces no rechace `\(H_0\)` (no parece existir una relación de largo plazo). – Si `\(F_L < F < F_U\)`, entonces la prueba no esconcluyente. --- ## Ejemplo 3: Test de Pesaran, Shin, y Smith (2001) y la función consumo keynesiana .pull-left[ .regression[ <table style="text-align:center"><tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td>d(lrcons.ts)</td><td>d(lrgdp.ts)</td></tr> <tr><td style="text-align:left"></td><td>(1)</td><td>(2)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">L(d(lrcons.ts), 1:2)1</td><td>-0.008 (0.076)</td><td>0.325<sup>***</sup> (0.083)</td></tr> <tr><td style="text-align:left">L(d(lrcons.ts), 1:2)2</td><td>0.317<sup>***</sup> (0.077)</td><td>0.212<sup>**</sup> (0.084)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)1</td><td>0.132<sup>*</sup> (0.069)</td><td>0.134<sup>*</sup> (0.075)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)2</td><td>-0.091 (0.065)</td><td>0.013 (0.071)</td></tr> <tr><td style="text-align:left">L(lrcons.ts)</td><td>-0.014 (0.024)</td><td>0.089<sup>***</sup> (0.026)</td></tr> <tr><td style="text-align:left">L(lrgdp.ts)</td><td>0.014 (0.026)</td><td>-0.096<sup>***</sup> (0.028)</td></tr> <tr><td style="text-align:left">Constant</td><td>0.003 (0.024)</td><td>0.102<sup>***</sup> (0.027)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Observations</td><td>261</td><td>261</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td colspan="2" style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> </table> ] ] .pull-right[ - Los valores críticos de Pesaran, Shin, y Smith (2001) para el modelo con constante en la relación de largo plazo son `\(F_L=3.10\)` y `\(F_U=3.87\)` para `\(k=2\)` variables y 5% de nivel de significancia. - Test F para la ecuación de `d(lrcons.ts)`: ``` ## [1] 1.379842 ``` **no existiría una relación de largo plazo** según la ecuación de consumo. - Test F para la ecuación de `d(lrgdp.ts)`: ``` ## [1] 7.406756 ``` **existiría una relación de largo plazo** según la ecuación del producto. ] --- ## Múltiples relaciones de cointegración - Recoredmos que otra deficiencia del enfoque deEngle-Granger es que no permite más de una relación de cointegración. - Tomemos ahora un **ejemplo concreto**: Suponga que tenemos las siguientes variables: `$$[p_t,p^*_t,e_t,r_t,r^*_t]$$` donde `\(p_t\)` y `\(p_t^∗\)` son los precios de los bienes nacionales y extranjeros; `\(e_t\)` es el tipo de cambio; y `\(r_t\)` y `\(r_t^∗\)` son las tasas de interés nacional y extranjera. - Si tenemos la combinación lineal: `$$\beta_{1} p_t+ \beta_{2}p^*_t + \beta_{3}e_t + \beta_{4} r_t + \beta_{5}r^*_t$$` entonces la teoría económica nos indicaría que existen dos vectores de cointegración (relaciones de largo plazo) `\(\beta=[1,-1,-1,0,0]\)` y `\(\beta=[0,0,0,1,-1]\)`: `$$\begin{aligned} p_t-p_t^*-e_t & \sim I(0) \\ r_t-r_t^* & \sim I(0) \end{aligned}$$` --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - Para ganar intuición consideremos un VAR(1) para tres variables I(1): `\(m_t=[y_t,x_t,z_t]\)`. `$$m_t = \Gamma m_{t-1} + e_t \ \ \ e_t \sim \mathcal{N}(0,\Sigma)$$` - En forma matricial: `\begin{equation*} \left[\begin{array}{c} y_{t} \\ x_{t} \\ z_{t} \end{array}\right]=\left[\begin{array}{ll} \gamma_{11} & \gamma_{12} & \gamma_{13} \\ \gamma_{21} & \gamma_{22} & \gamma_{23} \\ \gamma_{31} & \gamma_{32} & \gamma_{33} \end{array}\right]\left[\begin{array}{l} y_{t-1} \\ x_{t-1} \\ z_{t-1} \end{array}\right]+\left[\begin{array}{l} e_{1 t} \\ e_{2 t} \\ e_{3 t} \end{array}\right] \end{equation*}` - Restando de ambos lados el primer rezago tenemos: `$$m_t - m_{t-1} = \Gamma m_{t-1} - m_{t-1} + e_t \Rightarrow \Delta m_t = -(I - \Gamma) m_{t-1} + e_t = -\Pi m_{t-1} + e_t$$` - `\(\Delta m_t\)` y `\(e_t\)` son I(0), por lo que para que se cumpla la relación: `\(\Pi=0\)` o `\(\Pi m_{t-1} \sim I(0)\)`. --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - Concentrémonos en el competente `\(d_{t-1} = \Pi m_{t-1}\)` y supongamos que es I(0). Casos: 1. Si el rango de `\(\Pi\)` es 3 (= número de variables), entonces `\(\Pi\)` es invertible y `\(m_t = \Pi^{-1} d_t\)` es I(0) lo cual contradice que `\(m_t\)` sea I(1). Entonces rango `\(\Pi\)` tiene que ser menor que 3. 2. Si el rango de `\(\Pi\)` es 0, entonces `\(\Pi\)` es la matriz nula y `\(d_t = 0\)`. 3. Para que ambos se cumplan al mismo tiempo, `\(d_t \sim I(0)\)` y `\(m_t \sim I(1)\)`, el rango tiene que estar entre 1 y 2. - Si el rango de `\(\Pi\)` es `\(r < 3\)` entonces: `$$\Pi = \alpha \beta'$$` con `\(\alpha\)` y `\(\beta\)` matrices `\(3 \times r\)` de rango `\(r\)`. --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - `\(\beta\)` y `\(\alpha\)` son matrices con los `\(r\)` vectores de cointegración y sus `\(r\)` vectores de velocidades de ajuste. `$$\Pi m_{t-1}=\alpha\beta^{\prime}m_{t-1} \sim I(0) \ \ \ \text{corrección de error}$$` - Como tenemos `\(k=3\)` y supongamos que `\(r=2\)` entonces: $$ `\begin{aligned} {\left[\begin{array}{c} \Delta y_{t} \\ \Delta x_{t} \\ \Delta z_{t} \end{array}\right]=} & \left[\begin{array}{ll} \alpha_{11} & \alpha_{12} \\ \alpha_{21} & \alpha_{22} \\ \alpha_{31} & \alpha_{32} \end{array}\right] {\left[\begin{array}{lll} \beta_{11} & \beta_{21} & \beta_{31} \\ \beta_{12} & \beta_{22} & \beta_{32} \end{array}\right]\left[\begin{array}{l} y_{t-1} \\ x_{t-1} \\ z_{t-1} \end{array}\right]+\left[\begin{array}{c} e_{1, t} \\ e_{2, t} \\ e_{3, t} \end{array}\right] } \end{aligned}` $$ - Con `\(r=2\)` existen dos relaciones de cointegración, que denotamos por `\(\beta_1'm_{t-1}\)` y `\(\beta_2'm_{t-1}\)`. - Tendríamos **dos relaciones lineales** entre las variables que aseguran que este sistema combinado sea **estacionario**. --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - En general, si `\(m_t\)` tiene `\(k\)` variables y tenemos el siguiente VAR(p): `$$m_t=\Gamma_1 m_{t-1}+\Gamma_2 m_{t-2}+\ldots+\Gamma_p m_{t-p}+e_t, e_t \sim \mathcal{N}(0, \Sigma)$$` - Entonces la representación VEC es: `$$\Delta m_t=- \Pi m_{t-1} + \Phi_1 \Delta m_{t-1}+\Phi_2 \Delta m_{t-2}+\ldots+\Phi_{p-1} \Delta m_{t-p+1}+e_t$$`. con `\(\Pi=I-\Gamma_1-\Gamma_2-\ldots-\Gamma_p\)` y `\(\Phi_j=-\sum_{i=j+1}^p \Gamma_i\)`. - Para que exista cointegración el rango de `\(\Pi\)`, `\(r\)`, debe ser menor que el número de variables `\(k\)`. - El orden `\(p\)` puede ser obtenido usando criterios de información, como AIC o BIC. - El test de Johansen (1991) se basa directamente en la representación VEC. --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - Testear cointegración en el caso multivariado implica determinar el rango de `\(\Pi\)`. - En la práctica, debemos determinar los autovalores de `\(\Pi\)` y ordenarlos de tal forma que `\(\hat{\lambda}_1>\hat{\lambda}_2>\ldots>\hat{\lambda}_n\)`. - Con esto construimos dos estadísticos: **Máximo autovalor** y **Traza**. - **Máximo autovalor**: Buscamos testear las siguientes hipótesis: $$ `\begin{aligned} H_r &: \operatorname{Rango}(\Pi)=r<m \\ H_{r+1} &: \operatorname{Rango}(\Pi)=r+1 \end{aligned}` $$ para `\(r=0,1,2, \ldots, m-1\)`. El estadístico es: `$$\lambda_{\max }(r, r+1)=-T \ln \left(1-\hat{\lambda}_{r+1}\right)$$` con `\(T\)` el número de observaciones y `\(\hat{\lambda}_i\)` los autovalores de `\(\hat{\Pi}\)`. --- ## Múltiples relaciones de cointegración: El test de Johansen (1991) - **Traza**: Buscamos testear ahora las siguientes hipótesis: $$ `\begin{aligned} H_r &: \operatorname{Rango}(\Pi)=r<m \\ H_{m} &: \operatorname{Rango}(\Pi)=m \ \ \text{estacionariedad} \end{aligned}` $$ para `\(r=0,1,2, \ldots, m-1\)`. El estadístico es: `$$\lambda_{\text {traza}}(r)=-T \sum_{i=r+1}^n \ln \left(1-\hat{\lambda}_i\right)$$` - Para ambas pruebas, la distribución asintótica no es estándar y depende de los componentes deterministas incluidos (constante y tendencia). - Los valores críticos tabulados se pueden encontrar en Johansen (1988) u Osterwald-Lenum (1992). - Los valores calculados deben ser mayores que las tablas para rechazar la hipótesis nula. --- ## Ejemplo 3: Co-movimientos en los precios de los commodities <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/unnamed-chunk-12-1.png" width="80%" style="display: block; margin: auto;" /> --- ## Ejemplo 3: Co-movimientos en los precios de los commodities ``` ## ## ###################### ## # Johansen-Procedure # ## ###################### ## ## Test type: trace statistic , without linear trend and constant in cointegration ## ## Eigenvalues (lambda): ## [1] 9.751469e-02 6.746359e-02 3.431689e-02 7.899340e-03 -9.139625e-17 ## ## Values of teststatistic and critical values of test: ## ## test 10pct 5pct 1pct ## r <= 3 | 1.80 7.52 9.24 12.97 ## r <= 2 | 9.73 17.85 19.96 24.60 ## r <= 1 | 25.58 32.00 34.91 41.07 ## r = 0 | 48.87 49.65 53.12 60.16 ## ... ``` --- ## Ejemplo 3: Co-movimientos en los precios de los commodities ``` ## ## ###################### ## # Johansen-Procedure # ## ###################### ## ## Test type: maximal eigenvalue statistic (lambda max) , without linear trend and constant in cointegration ## ## Eigenvalues (lambda): ## [1] 9.751469e-02 6.746359e-02 3.431689e-02 7.899340e-03 -9.139625e-17 ## ## Values of teststatistic and critical values of test: ## ## test 10pct 5pct 1pct ## r <= 3 | 1.80 7.52 9.24 12.97 ## r <= 2 | 7.93 13.75 15.67 20.20 ## r <= 1 | 15.86 19.77 22.00 26.81 ## r = 0 | 23.29 25.56 28.14 33.24 ## ... ``` --- ## Ejemplo 3: Co-movimientos en los precios de los commodities - Potenciales vectores de cointegración <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:right;"> log_oro.l4 </th> <th style="text-align:right;"> log_plata.l4 </th> <th style="text-align:right;"> log_platino.l4 </th> <th style="text-align:right;"> log_paladio.l4 </th> <th style="text-align:right;"> constant </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> log_oro.l4 </td> <td style="text-align:right;"> 1.000 </td> <td style="text-align:right;"> 1.000 </td> <td style="text-align:right;"> 1.000 </td> <td style="text-align:right;"> 1.000 </td> <td style="text-align:right;"> 1.000 </td> </tr> <tr> <td style="text-align:left;"> log_plata.l4 </td> <td style="text-align:right;"> -0.057 </td> <td style="text-align:right;"> -1.244 </td> <td style="text-align:right;"> -0.573 </td> <td style="text-align:right;"> -0.490 </td> <td style="text-align:right;"> -0.513 </td> </tr> <tr> <td style="text-align:left;"> log_platino.l4 </td> <td style="text-align:right;"> -2.216 </td> <td style="text-align:right;"> 0.246 </td> <td style="text-align:right;"> -0.255 </td> <td style="text-align:right;"> 0.096 </td> <td style="text-align:right;"> -0.584 </td> </tr> <tr> <td style="text-align:left;"> log_paladio.l4 </td> <td style="text-align:right;"> 0.300 </td> <td style="text-align:right;"> 0.229 </td> <td style="text-align:right;"> -0.126 </td> <td style="text-align:right;"> 0.053 </td> <td style="text-align:right;"> 0.532 </td> </tr> <tr> <td style="text-align:left;"> constant </td> <td style="text-align:right;"> 6.355 </td> <td style="text-align:right;"> -6.537 </td> <td style="text-align:right;"> -2.554 </td> <td style="text-align:right;"> -6.496 </td> <td style="text-align:right;"> -4.248 </td> </tr> </tbody> </table> - Velocidades de ajuste asociadas a cada vector de cointegración <table> <thead> <tr> <th style="text-align:left;"> </th> <th style="text-align:right;"> log_oro.l4 </th> <th style="text-align:right;"> log_plata.l4 </th> <th style="text-align:right;"> log_platino.l4 </th> <th style="text-align:right;"> log_paladio.l4 </th> <th style="text-align:right;"> constant </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> log_oro.d </td> <td style="text-align:right;"> -0.014 </td> <td style="text-align:right;"> 0.011 </td> <td style="text-align:right;"> 0.011 </td> <td style="text-align:right;"> -0.005 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> log_plata.d </td> <td style="text-align:right;"> -0.016 </td> <td style="text-align:right;"> 0.076 </td> <td style="text-align:right;"> 0.058 </td> <td style="text-align:right;"> -0.003 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> log_platino.d </td> <td style="text-align:right;"> 0.001 </td> <td style="text-align:right;"> 0.017 </td> <td style="text-align:right;"> 0.034 </td> <td style="text-align:right;"> -0.010 </td> <td style="text-align:right;"> 0 </td> </tr> <tr> <td style="text-align:left;"> log_paladio.d </td> <td style="text-align:right;"> 0.000 </td> <td style="text-align:right;"> -0.091 </td> <td style="text-align:right;"> 0.088 </td> <td style="text-align:right;"> -0.005 </td> <td style="text-align:right;"> 0 </td> </tr> </tbody> </table>