class: center, middle, inverse, title-slide # Macroeconometría ## Series de Tiempo Multivariadas ### Mauricio Tejada ### Ingeniería Comercial --- layout: true <div class="my-footer"><img src="img/logo2.jpg" style="height: 35px;"/></div> --- class: separator, middle # Modelos de Vectores Autoregresivos (VAR) --- ## Modelos VAR en su forma estructural - El modelo: `$$y_{t}=\alpha+\beta_{0}x_{t}+\beta_{1}x_{t-1}+...+\beta_{r}x_{t-r}+u_{t}$$` adolece de un problema: **falta de retroalimentación**. No tenemos seguridad de que `\(x_{t}\)` sea realmente exógena. - El modelo que toma en cuenta posible endogeneidad (determinación conjunta de `\(y\)` y `\(x\)`) es: `$$\begin{aligned} y_{t} = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\ x_{t} = & b_{20}-b_{21}y_{t}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt} \end{aligned}$$` - Este es un ejemplo de un vector autoregresivo (VAR) de primer orden. - Supuestos: (1) `\((y_{t},x_{t})\)` son estacionarias; (2) `\((\epsilon_{Yt},\epsilon_{Xt})\)` son ruido blanco con `\(\sigma_{Y}\)` y `\(\sigma_{X}\)` y no están correlacionados `\(\mathbb{E}[\epsilon_{ys}\epsilon_{xw}]=0\ \ \forall s,w\)`. - El modelo está escrito en forma estructural: Tanto `\(y_{t}\)` como `\(x_{t}\)` tienen efectos contemporáneos sobre el otro. --- ## Modelos VAR en su forma reducida - Escribamos el modelo en forma matricial: `$$\left[\begin{array}{cc} 1 & b_{12}\\ b_{21} & 1 \end{array}\right]\left[\begin{array}{c} y_{t}\\ x_{t} \end{array}\right]=\left[\begin{array}{c} b_{10}\\ b_{20} \end{array}\right]+\left[\begin{array}{cc} \gamma_{11} & \gamma_{12}\\ \gamma_{21} & \gamma_{22} \end{array}\right]\left[\begin{array}{c} y_{t-1}\\ x_{t-1} \end{array}\right]+\left[\begin{array}{c} \epsilon_{Yt}\\ \epsilon_{Xt} \end{array}\right]$$` - Definimos `\(\mathrm{z}_{t}=\left(y_{t},x_{t}\right)'\)`, entonces en forma compacta: `$$B \mathrm{z}_{t}=\Gamma_{0}+\Gamma_{1}\mathrm{z}_{t-1}+\mathrm{\varepsilon}_{t}$$` donde: `\(A_{0}=B^{-1}\Gamma_{0}\)`, `\(A_{1}=B^{-1}\Gamma_{1}\)` y `\(\mathrm{e}_{t}=B^{-1}\mathrm{\varepsilon}_{t}\)`. - Extendiendo la ecuación anterior: `$$\begin{aligned} y_{t} & = & a_{10}+a_{11}y_{t-1}+a_{12}x_{t-1}+e_{1t}\\ x_{t} & = & a_{20}+a_{21}y_{t-1}+a_{22}x_{t-1}+e_{2t} \end{aligned}$$` tenemos un **VAR en su forma reducida** (sin valores contemoporáneos en el lado derecho de las ecuaciones). --- ## Modelos VAR en su forma reducida - Note que: `$$B^{-1}=\left[\begin{array}{cc} 1 & b_{12}\\ b_{21} & 1 \end{array}\right]^{-1}=\frac{1}{1-b_{12}b_{21}}\left[\begin{array}{cc} 1 & -b_{12}\\ -b_{21} & 1 \end{array}\right]$$` - Usando este resultado: `$$e_{1t}=\frac{\epsilon_{yt}-b_{12}\epsilon_{xt}}{1-b_{12}b_{21}}\,\,\,\,\,\,\,\,\,e_{2t}=\frac{\epsilon_{xt}-b_{21}\epsilon_{yt}}{1-b_{12}b_{21}}$$` - La matriz de varianzas y covarianzas de los errores de la forma reducida es: `$$\Sigma=\left[\begin{array}{cc} \mathbb{E}[e_{1t}^{2}] & \mathbb{E}[e_{1t}e_{2t}]\\ \mathbb{E}[e_{1t}e_{2t}] & \mathbb{E}[e_{2t}^{2}] \end{array}\right]$$` donde: `$$\mathbb{E}[e_{1t}^{2}]=\frac{\sigma_{y}^{2}+b_{12}^{2}\sigma_{z}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\,\mathbb{E}[e_{2t}^{2}]=\frac{\sigma_{z}^{2}+b_{21}^{2}\sigma_{y}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\, \mathbb{E}[e_{1t}e_{2t}]=\frac{-(b_{21}\sigma_{y}^{2}+b_{12}\sigma_{z}^{2})}{(1-b_{12}b_{21})^{2}}$$` --- ## Estabilidad del modelo VAR - El modelo VAR es estable si todos los autovalores de `\(A_{1}\)` en: `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$` son menores que 1. - El VAR será estable si todas las variables incluidas en el modelo son estacionarias. **Problemas de estabilidad son signo de la presencia de no estacionariedad en las variables del VAR**. --- ## Estimación de los modelos VAR - Sims(1980) critica los modelos estructurales (ecuaciones simultáneas) en dos dimensiones: - Restricciones arbitrareas (y en algunos casos increíbles). - Decisión acerca de si una variable es endógena o exógena. - Consideremos la siguiente generalización VAR(p): `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+A_{2}\mathrm{z}_{t-2}+...+A_{p}\mathrm{z}_{t-p}+e_{t}$$` donde `\(\mathrm{z}_{t}\)` es un vector de `\(n\)` variables y `\(p\)` es el número de rezagos (entonces, tenemos `\(n+pn^{2}\)` parámetros a estimar). - Decisiones: - ¿Qué variables incluir en `\(\mathrm{z}_{t}\)`? Teoría económica. - ¿Cuantos rezagos `\((p)\)` incluir? Pruebas estadísticas formales. - El lado derecho de la forma reducida del VAR tiene únicamente variables predeterminadas (las mismas en todas las ecuaciones). Así, **cada ecuación puede ser estimada por separado por MCO**, esto a pesar de estar los errores de las ecuaciones correlacionados. --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - Es posible recuperar los parámetros del VAR estructural y los shocks estructurales? - La respuesta es no a menos que se impongan ciertas restricciones. - Retomemos el VAR(1) con 2 variables: `$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$` - Note que: `\(\hat{A}_{0}=B^{-1}\Gamma_{0}\)`, `\(\hat{A}_{1}=B^{-1}\Gamma_{1}\)` y `\(\hat{\Sigma}=\left(B^{-1}\right)^{2}V(\varepsilon_{t})\)`. - Forma reducida: `\(2+4\times1+3=9\)` - Forma Estructural: `\(2+4\times1+2+2=10\)` - Es necesaria `\(1\)` restricción. En general en un VAR(p) con `\(n\)` variables se requieren `\(\frac{n^{2}-n}{2}\)` restricciones. --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - Imponer `\(b_{21}=0\)` en el VAR estructural: `\(y\)` **no tiene efecto contemporáneo en** `\(x\)`. `$$\begin{aligned} y_{t} = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\ x_{t} = & b_{20}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt} \end{aligned}$$` y `\(e_{1t} = \epsilon_{yt}-b_{12}\epsilon_{xt}\)`, `\(e_{2t} = \epsilon_{xt}\)`. - Los parámetros estructurales están identificados a partir de los estimados de la forma reducida: `$$\begin{aligned} \hat{a}_{10} & = & b_{10}-b_{12}b_{20}\\ \hat{a}_{11} & = & \gamma_{11}-b_{12}\gamma_{21}\\ \hat{a}_{12} & = & \gamma_{12}-b_{12}\gamma_{22}\\ \hat{a}_{20} & = & b_{20}\\ \hat{a}_{21} & = & \gamma_{21}\\ \hat{a}_{22} & = & \gamma_{22}\\ \hat{\mathbb{V}(e_{1})} & = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\ \hat{\mathbb{V}(e_{2})} & = & \sigma_{x}^{2}\\ \hat{Cov(e_{1},e_{2})} & = & -b_{12}\sigma_{x}^{3} \end{aligned}$$` --- ## Identificación del VAR estructural a partir del VAR en forma Reducida - En general para un VAR con `\(k\)` variables: `\(B\)` es una matriz triangular (superior). `$$B=\left[\begin{array}{cccc} 1 & b_{12} & ... & b_{1k}\\ 0 & 1 & ... & b_{2k}\\ \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & 0 & 1 \end{array}\right]$$` - **Interpretación**: `\((y_{1t},y_{2t},y_{3t},...,y_{kt})\)` están ordenandas de más endógena a menos endógena. - `\(y_{1t}\)` es afectados contemporáneamente por `\((y_{2t},y_{3t},...,y_{kt})\)`. - `\(y_{2t}\)` es afectados contemporáneamente por `\((y_{3t},...,y_{kt})\)`. ... - `\(y_{kt}\)` es afectados contemporáneamente por `\(y_{kt}\)`. --- ## Resultados de un VAR - ¿Cómo presentar los resultados de un VAR? (1) Funciones de Impulso Respuesta; (2) Descomposición de la Varianza. - **Función de Impulso Respuesta**: Es la representación gráfica de los efectos de shocks sobre las variables del modelo VAR `\(j\)` periodos adelante. - Usemos por simplicidad un VAR(1) de dos variable con intercepto cero: `$$\begin{aligned} y_{t} = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{Yt}-b_{12}\epsilon_{Xt}\right)\\ x_{t} = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{Xt}\right) \end{aligned}$$` - Efecto de un shock `\(\epsilon_{yt}\)` de tamaño `\(\sigma_{y}\)` (el mismo ejercicio se puede hacer con un shock en `\(\epsilon_{yt}\)`): | | `\(Y\)` | `\(X\)` | | --- | --- | --- | | `\(0\)` | `\(\sigma_{Y}\)` | 0 | | `\(1\)` | `\(a_{11}\sigma_{Y}\)` | `\(a_{21}\sigma_{Y}\)` | | `\(2\)` | `\(a_{11}^{2}\sigma_{Y}+a_{12}a_{21}\sigma_{Y}\)` | `\(a_{21}a_{11}\sigma_{Y}+a_{22}a_{21}\sigma_{Y}\)` | | | ... | ... | --- ## Resultados de un VAR - **Descomposición de la Varianza**: - Recordemos nuevamente que: `$$\begin{aligned} y_{t} = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{yt}-b_{12}\epsilon_{xt}\right)\\ x_{t} = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{xt}\right) \end{aligned}$$` - La predicción a un período adelante es: `$$\begin{aligned} \mathbb{E}_{t}y_{t+1} = & a_{11}Y_{t}+a_{12}x_{t}+\left(\epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\right)\\ \mathbb{E}_{t}x_{t+1} = & a_{21}Y_{t}+a_{22}x_{t}+\left(\epsilon_{xt+1}\right) \end{aligned}$$` - Los errores de predicción satisfacen: `$$\begin{aligned} y_{t+1}-\mathbb{E}_{t}y_{t+1} = & \epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\\ x_{t+1}-\mathbb{E}_{t}x_{t+1} = & \epsilon_{xt+1} \end{aligned}$$` --- ## Resultados de un VAR - Aplicando el operador varianza: `$$\begin{aligned} \sigma_{y}^{2}(1) = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\ \sigma_{x}^{2}(1) = & \sigma_{x}^{2} \end{aligned}$$` - Entonces, para el caso de `\(y\)`: `$$\begin{aligned} \%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{yt} = & \frac{\sigma_{y}^{2}}{\sigma_{y}^{2}(1)}\\ \%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{xt} = & \frac{b_{12}^{2}\sigma_{x}^{2}}{\sigma_{y}^{2}(1)} \end{aligned}$$` - Para el caso de `\(x\)` `$$\begin{aligned} \%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{yt} = & 0\\ \%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{xt} = & \frac{\sigma_{x}^{2}}{\sigma_{x}^{2}(1)} \end{aligned}$$` - Este ejercicio se repite para 2, 3, ..., `\(j\)` periodos adelante. --- ## Elección del rezago óptimo - Aumento en el número de rezago reduce sustancialmente los grados de libertad. - Con `\(n\)` variable y `\(p\)` rezagos, un rezago adicional implica estimar `\(n\times p\)` nuevos parámetros. - Existe un `\(p\)` óptimo tal que cualquier rezago menor genera mala especificación y cualquier rezago mayor tiene muy pocos grados de libertad. - Una alternativa es usar los criterios de información: `$$\begin{aligned} AIC = & Tlog|\Sigma|+2N\\ BIC = & Tlog|\Sigma|+Nlog(T) \end{aligned}$$` donde `\(N\)` es el total de parámetros estimados en todas las ecuaciones. --- ## Elección del rezago óptimo - Otra alternativa es usar un test de exclusión de rezagos: - Elegir un rezago suficientemente grande, digamos `\(P_{NR}\)`. Estimar el VAR y calcular `\(\Sigma_{NR}\)`. - Asumimos que `\(p\)` puede ser menor y estimamos un VAR con `\(P_{R}(<P_{NR})\)` rezagos y calculamos: `\(\Sigma_{R}\)`. `$$\mathrm{H}_{0}:A_{P_{NR}}=A_{P_{NR}-1}=...=\mathrm{0}$$` - Calcular el siguiente estadístico: `$$LR=\left(T-c\right)\left\{ log|\Sigma_{R}|-log|\Sigma_{NR}|\right\}\sim\chi_{(P_{NR}-P_{R})\times n\times n}^{2}$$` donde `\(T\)` = No. Observaciones y `\(c\)` No de parámetros estimados en cada ecuación del modelo no restringido `\((p=P_{NR})\)`. --- ## Test de causalidad de Granger - Una variable Granger causa a otra si tiene información relevante a predecir el comportamiento de dicha variable. - Suponga un VAR(2) con `\(2\)` variables: `$$\begin{aligned} y_{t} = & a_{10}+a_{11}^{1}y_{t-1}+a_{12}^{1}x_{t-1}+a_{11}^{2}y_{t-2}+a_{12}^{2}x_{t-2}+e_{1t}\\ x_{t} = & a_{20}+a_{21}^{1}y_{t-1}+a_{22}^{1}x_{t-1}+a_{21}^{2}y_{t-2}+a_{22}^{2}x_{t-2}+e_{2t} \end{aligned}$$` entonces: - Decimos que `\(x_{t}\)` no Granger causa a `\(y_{t}\)` si: `\(a_{12}^{1}=a_{12}^{2}=0\)`. - Decimos que `\(y_{t}\)` no Granger causa a `\(x_{t}\)` si: `\(a_{21}^{1}=a_{21}^{2}=0\)`. - Un test F sobre cada ecuación permite probar las hipótesis de causalidad a la Granger. --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Usemos datos del PNB, del deflactor de precios del PNB y de la tasa de interés para los EEUU: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa-1.png" width="90%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Partamos por un VAR(1): ``` ## $dlrealgnp.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.25266954 0.06606677 3.8244570 1.732178e-04 ## fedfunds.t.l1 -0.07020124 0.02304962 -3.0456568 2.622027e-03 ## dlgnpdeflactor.t.l1 0.04945582 0.13238764 0.3735683 7.091060e-01 ## const 0.97519927 0.14212025 6.8617898 7.657579e-11 ## ## $fedfunds.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.3485736 0.06949273 5.015972 1.129131e-06 ## fedfunds.t.l1 0.9171332 0.02424488 37.827905 3.430035e-95 ## dlgnpdeflactor.t.l1 0.4953839 0.13925273 3.557445 4.637648e-04 ## const -0.2334530 0.14949003 -1.561662 1.198877e-01 ## ## $dlgnpdeflactor.t ## Estimate Std. Error t value Pr(>|t|) ## dlrealgnp.t.l1 0.02010743 0.023300013 0.8629793 3.891428e-01 ## fedfunds.t.l1 0.02032199 0.008128996 2.4999383 1.319413e-02 ## dlgnpdeflactor.t.l1 0.79216934 0.046689639 16.9667052 4.162995e-41 ## const 0.04951477 0.050122072 0.9878836 3.243574e-01 ``` --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Selección de Rezagos: ``` ## $selection ## AIC(n) HQ(n) SC(n) FPE(n) ## 6 3 1 6 ## ## $criteria ## 1 2 3 4 5 6 ## AIC(n) -3.14791384 -3.26471095 -3.42992284 -3.48193451 -3.52660357 -3.55322434 ## HQ(n) -3.06951159 -3.12750700 -3.23391720 -3.22712718 -3.21299455 -3.18081362 ## SC(n) -2.95405698 -2.92546144 -2.94528068 -2.85189970 -2.75117611 -2.63240423 ## FPE(n) 0.04294225 0.03821098 0.03239686 0.03076337 0.02943229 0.02867737 ## 7 ## AIC(n) -3.53813090 ## HQ(n) -3.10691849 ## SC(n) -2.47191814 ## FPE(n) 0.02913899 ``` - Al **mejor modelo parece ser un VAR(6)** según el criterio AIC. --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Estabilidad del VAR: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_roots-1.png" width="95%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Test de causalidad de Granger: ``` ## ## Granger causality H0: dlrealgnp.t do not Granger-cause fedfunds.t ## dlgnpdeflactor.t ## ## data: VAR object var_est ## F-Test = 4.4243, df1 = 12, df2 = 564, p-value = 8.64e-07 ``` ``` ## ## Granger causality H0: dlgnpdeflactor.t do not Granger-cause ## dlrealgnp.t fedfunds.t ## ## data: VAR object var_est ## F-Test = 2.8497, df1 = 12, df2 = 564, p-value = 0.0008107 ``` ``` ## ## Granger causality H0: fedfunds.t do not Granger-cause dlrealgnp.t ## dlgnpdeflactor.t ## ## data: VAR object var_est ## F-Test = 3.78, df1 = 12, df2 = 564, p-value = 1.52e-05 ``` --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Análisis de impulso respuesta: .pull-left[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_firy-1.png" width="98%" style="display: block; margin: auto;" /> ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_firpi-1.png" width="98%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios Análisis de descomposición de la varianza del error de predicción: <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/var_usa_dv-1.png" width="70%" style="display: block; margin: auto;" /> --- ## Ejemplo 1: Modelo VAR para identificar shocks monetarios - Es posible también realizar predicciones usando un modelo VAR: ``` ## $dlrealgnp.t ## fcst lower upper CI ## [1,] 0.6051134 -0.8884103 2.098637 1.493524 ## [2,] 1.3391177 -0.2010514 2.879287 1.540169 ## [3,] 0.9948993 -0.6508928 2.640691 1.645792 ## [4,] 1.0483830 -0.6236753 2.720441 1.672058 ## ## $fedfunds.t ## fcst lower upper CI ## [1,] 4.251206 2.736735 5.765676 1.514471 ## [2,] 4.038232 1.640145 6.436320 2.398087 ## [3,] 4.370730 1.388617 7.352844 2.982114 ## [4,] 4.514533 0.956865 8.072200 3.557668 ## ## $dlgnpdeflactor.t ## fcst lower upper CI ## [1,] 0.5956998 0.08574974 1.1056498 0.5099500 ## [2,] 0.4162482 -0.14849685 0.9809932 0.5647450 ## [3,] 0.4810127 -0.13007987 1.0921053 0.6110926 ## [4,] 0.4997431 -0.15425397 1.1537401 0.6539971 ``` --- class: separator, middle # Cointegración y modelo de Corrección de error --- ## Cointegración: Ideas básicas - **Regresión Espúrea**: Consideremos dos procesos de caminata aleatoria independientes: `$$\begin{aligned} y_{t} & = & y_{t-1}+u_{t}\\ x_{t} & = & x_{t-1}+v_{t} \end{aligned}$$` con `\(\mathbb{E}[u_{s}v_{t}]=0\)` para todo `\(t,s\)`, y `\(\mathbb{E}[u_{t}u_{t-j}]=\mathbb{E}[v_{t}v_{t-j}]=0\)` para todo `\(j\)`. - Por construcción no hay ninguna relación entre las variables `\(y_{t}\)` y `\(x_{t}\)`. Ambas están construidas con procesos independientes. - ¿Qué sucedería si corremos por MCO la siguiente regresión?: `$$y_{t}=\alpha+\beta x_{t}+w_{t}$$` - ¿Qué valor se debiera esperar para la estimación de `\(\beta\)`? ¿y `\(R^{2}\)`? --- ## Cointegración: Ideas básicas .pull-left[ - Usemos simulaciones para responder estas preguntas. .regression[ <table style="text-align:center"><tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td>y</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">x</td><td>-1.242<sup>***</sup> (0.220)</td></tr> <tr><td style="text-align:left">Constant</td><td>-13.457<sup>***</sup> (0.688)</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">R<sup>2</sup></td><td>0.246</td></tr> <tr><td style="text-align:left">F Statistic</td><td>31.976<sup>***</sup> (df = 1; 98)</td></tr> <tr><td colspan="2" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> </table> ]] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/sim_rw-1.png" width="85%" style="display: block; margin: auto;" /> ] - Note que `\(R^{2}\)` alto, `\(F\)` grande, estadísticos `\(t\)` mayores que 2. Si alguna variable incluida en la regresión tiene raíz unitaria la regresión captura únicamente la tendencia común presente en ellas y no tiene ningún sentido económico. --- ## Cointegración y tendencias estocásticas comunes - **Cointegración**: Hay un caso particular en que no ocurre el fenómeno de regresión espúrea. Retomemos los procesos de caminata aleatoria: `$$y_{t}=\sum_{i=0}^{\infty}u_{t-i}\ \ \text{y} \ \ x_{t}= \sum_{i=0}^{\infty}v_{t-i}$$` - Reemplazando en la ecuación MCO. `$$\sum_{i=0}^{\infty}u_{t-i}=\alpha+\beta\sum_{i=0}^{\infty}v_{t-i}+w_{t}$$` alternativamente: `$$w_{t}=\sum_{i=0}^{\infty}u_{t-i}-\alpha-\beta\sum_{i=0}^{\infty}v_{t-i}$$` - Si `\(w_{t}\)` es `\(I(1)\)` entonces la regresión es espúrea. Sin embargo, si `\(w_{t}\)` es `\(I(0)\)` **las tendencias estocásticas se cancelan** y por tanto las dos series que cointegran. --- ## Cointegración y tendencias estocásticas comunes .pull-left[ - **Interpretación**: Sentido económico para una tendencia común. - Existencia de una relación de equilibrio estable de largo plazo entre dos o más variables. Para lo anterior se requiere de un movimiento coordinado en el tiempo (con algunos desvíos transitorios). ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/tendenciascomunes-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Cointegración y tendencias estocásticas comunes - Suponga `\(w_{t}=0,\)` entonces proporcionalidad en tendencias estocásticas: `$$\sum_{i=0}^{\infty}u_{t-i}=\alpha+\beta\sum_{i=0}^{\infty}v_{t-i}$$` - **Condición 1**: Para que exista el movimiento coordinado en tendencia ambos procesos tiene que tener el mismo número de raíces unitarias, por ejemplo I(1). - **Condición 2**: Cualquier desvío de la tendencia que hace que las series no muestren un comportamiento similar es netamente transitorio o desaparece relativamente rápido. - La Tendencia `\(\rightarrow\)` Relación de largo plazo. - Desvío `\(\rightarrow\)` Discrepancia de corto plazo (ej por shock). `$$\underset{I(1)}{y_{t}}=\alpha+\beta\underset{I(1)}{x_{t}}+\underset{I(0)}{w_{t}}$$` --- ## Cointegración y tendencias etocásticas comunes .pull-left[ - Entonces `\(w_{t}\)` es un shocks transitorio. Recordemos que en una serie integrada los shocks tienen efectos permanentes. En una serie estacionaria el efecto de los shocks es transitorio. - Si en una regresión los **errores son estacionarios**, entonces existe una relación de equilibrio estable de largo plazo. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/cointresids-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Cointegración y tendencias estocásticas comunes **Definición** *Si dos o más series de tiempo están integradas de orden 1, puede existir una combinación lineal entre ellas que esté integrada de orden 0. El conjunto de parámetros que define la combinación lineal se denomina vector de cointegración.* - En general, suponga que se tiene `\(M\)` variables `\(Y_{t}=[Y_{1t},...,Y_{Mt}]\)` integradas de orden 1, la relación de largo plazo será: `$$Y_{1t}-\beta_{1}-\beta_{2}Y_{2t}-...-\beta_{M}Y_{Mt}=0$$` con `\(\beta=(\beta_{1},...,\beta_{M})\)` que es el vector de cointegración. - En el corto plazo el sistema puede no estar en equilibrio: `$$Y_{1t}-\beta_{1}-\beta_{2}Y_{2t}-...-\beta_{M}Y_{Mt}=\epsilon_{t}$$` donde `\(\epsilon_{t}\)` es el error de equilibrio (desviaciones). Esteerror debe ser `\(I(0)\)`. - Nota: Si existen `\(M\)` variables en el sistema, podrían haber a lo más `\(M-1\)` vectores de cointegración. --- ## Test de cointegración - **Test Engle y Granger (1987)**: Implementación: 1. Verificar (test ADF) el orden de integración de las series: `\(y_{t},x_{1t},...,x_{Kt}\)` 2. Estimar por mínimos cuadrados ordinarios la regresión: `$$y_{t}=\beta_{0}+\beta_{1}x_{1t}+...+\beta_{K}x_{Kt}+w_{t}$$` 3. Calcular los errores del modelo: `\(\hat{w}_{t}=y_{t}-\left(\hat{\beta}_{0}+\hat{\beta}_{1}x_{1t}+...+\hat{\beta}_{K}x_{Kt}\right)\)`. 4. Aplicar el test DF a los errores estimados `\(\hat{w}_{t}\)` sin constante y sin tendencia. `$$\Delta\hat{w}_{t}=\phi\hat{w}_{t-1}+\delta_{1}\Delta\hat{w}_{t-1}+...\delta_{p}\Delta\hat{w}_{t-p}+\eta_{t}$$` donde `\(H_{0}:\phi=0\)` 5. Si los errores son estacionario (rechazamos la hipótesis nula) entonces existe cointegración: `\(\left|\frac{\hat{\phi}-0}{\sqrt{\hat{var(\phi)}}}\right|>\left|VC_{EG}\right|\)`. --- ## Test de cointegración - Los valores críticos son distintos ya que por definición al estimar MCO minimizamos la varianza de los errores. <img src="img/vcenglegranger.png" width="70%" style="display: block; margin: auto;" /> --- ## Corrección de error y representación VAR - Suponga dos variables `\(I(1),\)` `\((y_{t},x_{t}),\)` que cointegran y el vector de cointegración es `\([1,-\theta]\)`. - Note que las variables `\(\Delta y_{t}\)`, `\(\Delta x_{t}\)`, y `\((y_{t}-\theta x_{t})\)` son `\(I(0)\)`. - El modelo de corrección de error (suponga un VEC(1)) es: `$$\begin{aligned} \Delta y_{t} = & \alpha_{y}(y_{t-1}-\theta x_{t-1})+a_{11}\Delta y_{t-1}+a_{12}\Delta x_{t-1}+\epsilon_{yt}\\ \Delta x_{t} = & \alpha_{x}(y_{t-1}-\theta x_{t-1})+a_{21}\Delta y_{t-1}+a_{22}\Delta x_{t-1}+\epsilon_{xt} \end{aligned}$$` - Los parámetros `\((\alpha_{y},\alpha_{x})\)` son interpretados como velocidad de ajuste (que proporción del desequilibrio es corregido en un período). - Todo lo aprendido en el análisis VAR aplica en este caso: Estimación MCO ecuación por ecuación, elección de `\(p\)`, FIR, DV, etc. --- ## Ejemplo 2: La función consumo keynesiana .pull-left[ - Buscamos analizar la relación de largo plazo y el ajuste a corto plazo en la función consumo. - Recodemos que: `$$\log cons_t = \alpha + \beta \log pib_t + u_t$$` donde `\(cons_t\)` es el consumo real de bienes y servicios y `\(pib_t\)` es el PIB real. - Tenemos datos trimestrales de consumo y PIB reales para EEUU para el periodo entre 1947 y 2012. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/funcion_consumo-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 2: La función consumo keynesiana .pull-left[ - Regresión de largo plazo: ``` ## Estimate Std. Error t value ## (Intercept) -0.9616851 0.018573721 -51.77665 ## rgdp.ts 1.0622889 0.002149558 494.18946 ``` - Test de raíz unitaria a los errores de regresión ``` ## lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag) ``` ``` ## Estimate Std. Error t value ## z.lag.1 -0.09191482 0.02470425 -3.720607 ## z.diff.lag -0.07776701 0.06056230 -1.284083 ``` - Dado que el valor crítico EG es -3.3, tenemos evidencia sucifiente para rechazacar la hipótesis nula de presencia de raíz unitaria en los errores. **Las series cointegran**. ] .pull-right[ <img src="7_Series_de_Tiempo_Multivariadas_files/figure-html/errores_funcion_consumo-1.png" width="90%" style="display: block; margin: auto;" /> ] --- ## Ejemplo 2: La función consumo keynesiana - Modelo de **corrección de error**: .regression[ <table style="text-align:center"><tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"></td><td>d(lrcons.ts)</td><td>d(lrgdp.ts)</td></tr> <tr><td style="text-align:left"></td><td>(1)</td><td>(2)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">L(d(lrcons.ts), 1:2)1</td><td>-0.002 (0.076)</td><td>0.332<sup>***</sup> (0.083)</td></tr> <tr><td style="text-align:left">L(d(lrcons.ts), 1:2)2</td><td>0.321<sup>***</sup> (0.077)</td><td>0.218<sup>**</sup> (0.084)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)1</td><td>0.137<sup>**</sup> (0.069)</td><td>0.141<sup>*</sup> (0.076)</td></tr> <tr><td style="text-align:left">L(d(lrgdp.ts), 1:2)2</td><td>-0.086 (0.065)</td><td>0.020 (0.071)</td></tr> <tr><td style="text-align:left">L(u)</td><td>-0.014 (0.024)</td><td>0.088<sup>***</sup> (0.027)</td></tr> <tr><td style="text-align:left">Constant</td><td>0.005<sup>***</sup> (0.001)</td><td>0.002<sup>**</sup> (0.001)</td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left">Observations</td><td>261</td><td>261</td></tr> <tr><td style="text-align:left">R<sup>2</sup></td><td>0.133</td><td>0.244</td></tr> <tr><td style="text-align:left">F Statistic (df = 5; 255)</td><td>7.810<sup>***</sup></td><td>16.443<sup>***</sup></td></tr> <tr><td colspan="3" style="border-bottom: 1px solid black"></td></tr><tr><td style="text-align:left"><em>Note:</em></td><td colspan="2" style="text-align:right"><sup>*</sup>p<0.1; <sup>**</sup>p<0.05; <sup>***</sup>p<0.01</td></tr> </table> ]