Macroeconometría

.title[
# Macroeconometría
]
.subtitle[
## Series de Tiempo Multivariadas
]
.author[
### Mauricio Tejada
]
.institute[
### Ingeniería Comercial
]

---

---

# Modelos de Vectores Autoregresivos (VAR)

---

## Modelos VAR en su forma estructural

- El modelo:
`$$y_{t}=\alpha+\beta_{0}x_{t}+\beta_{1}x_{t-1}+...+\beta_{r}x_{t-r}+u_{t}$$`
    adolece de un problema: **falta de retroalimentación**. No tenemos seguridad de que `$x_{t}$` sea realmente exógena.

- El modelo que toma en cuenta posible endogeneidad (determinación conjunta de `$y$` y `$x$`) es:
`$$\begin{aligned}
    y_{t}  = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\
    x_{t}  = & b_{20}-b_{21}y_{t}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt}
\end{aligned}$$`

- Este es un ejemplo de un vector autoregresivo (VAR) de primer orden.

- Supuestos: (1) `$(y_{t},x_{t})$` son estacionarias; (2) `$(\epsilon_{Yt},\epsilon_{Xt})$` son ruido blanco con `$\sigma_{Y}$` y `$\sigma_{X}$` y no están correlacionados `$\mathbb{E}[\epsilon_{ys}\epsilon_{xw}]=0\ \ \forall s,w$`.

- El modelo está escrito en forma estructural: Tanto `$y_{t}$` como `$x_{t}$` tienen efectos contemporáneos sobre el otro.

---

## Modelos VAR en su forma reducida

- Escribamos el modelo en forma matricial:
`$$\left[\begin{array}{cc}
1 & b_{12}\\
b_{21} & 1
\end{array}\right]\left[\begin{array}{c}
y_{t}\\
x_{t}
\end{array}\right]=\left[\begin{array}{c}
b_{10}\\
b_{20}
\end{array}\right]+\left[\begin{array}{cc}
\gamma_{11} & \gamma_{12}\\
\gamma_{21} & \gamma_{22}
\end{array}\right]\left[\begin{array}{c}
y_{t-1}\\
x_{t-1}
\end{array}\right]+\left[\begin{array}{c}
\epsilon_{Yt}\\
\epsilon_{Xt}
\end{array}\right]$$`

- Definimos `$\mathrm{z}_{t}=\left(y_{t},x_{t}\right)'$`, entonces en forma compacta: 
`$$B \mathrm{z}_{t}=\Gamma_{0}+\Gamma_{1}\mathrm{z}_{t-1}+\mathrm{\varepsilon}_{t}$$`
    donde: `$A_{0}=B^{-1}\Gamma_{0}$`, `$A_{1}=B^{-1}\Gamma_{1}$` y `$\mathrm{e}_{t}=B^{-1}\mathrm{\varepsilon}_{t}$`.

- Extendiendo la ecuación anterior:
`$$\begin{aligned}
y_{t} & = & a_{10}+a_{11}y_{t-1}+a_{12}x_{t-1}+e_{1t}\\
x_{t} & = & a_{20}+a_{21}y_{t-1}+a_{22}x_{t-1}+e_{2t}
\end{aligned}$$`
    tenemos un **VAR en su forma reducida** (sin valores contemoporáneos en el lado derecho de las ecuaciones).
---

## Modelos VAR en su forma reducida

- Note que:
`$$B^{-1}=\left[\begin{array}{cc}
1 & b_{12}\\
b_{21} & 1
\end{array}\right]^{-1}=\frac{1}{1-b_{12}b_{21}}\left[\begin{array}{cc}
1 & -b_{12}\\
-b_{21} & 1
\end{array}\right]$$`

- Usando este resultado:
`$$e_{1t}=\frac{\epsilon_{yt}-b_{12}\epsilon_{xt}}{1-b_{12}b_{21}}\,\,\,\,\,\,\,\,\,e_{2t}=\frac{\epsilon_{xt}-b_{21}\epsilon_{yt}}{1-b_{12}b_{21}}$$`

- La matriz de varianzas y covarianzas de los errores de la forma reducida es:
`$$\Sigma=\left[\begin{array}{cc}
    \mathbb{E}[e_{1t}^{2}] & \mathbb{E}[e_{1t}e_{2t}]\\
    \mathbb{E}[e_{1t}e_{2t}] & \mathbb{E}[e_{2t}^{2}]
    \end{array}\right]$$`
    donde: 
    `$$\mathbb{E}[e_{1t}^{2}]=\frac{\sigma_{y}^{2}+b_{12}^{2}\sigma_{z}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\,\mathbb{E}[e_{2t}^{2}]=\frac{\sigma_{z}^{2}+b_{21}^{2}\sigma_{y}^{2}}{(1-b_{12}b_{21})^{2}}\,\,\,\,\, \mathbb{E}[e_{1t}e_{2t}]=\frac{-(b_{21}\sigma_{y}^{2}+b_{12}\sigma_{z}^{2})}{(1-b_{12}b_{21})^{2}}$$`

---

## Estabilidad del modelo VAR

- El modelo VAR es estable si todos los autovalores de `$A_{1}$` en: 
`$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$`
    son menores que 1.

- El VAR será estable si todas las variables incluidas en el modelo son estacionarias. **Problemas de estabilidad son signo de la presencia de no estacionariedad en las variables del VAR**.

---

## Estimación de los modelos VAR

- Sims(1980) critica los modelos estructurales (ecuaciones simultáneas) en dos dimensiones:

- Restricciones arbitrareas (y en algunos casos increíbles).
    
    - Decisión acerca de si una variable es endógena o exógena.

- Consideremos la siguiente generalización VAR(p):
`$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+A_{2}\mathrm{z}_{t-2}+...+A_{p}\mathrm{z}_{t-p}+e_{t}$$`
    donde `$\mathrm{z}_{t}$` es un vector de `$n$` variables y `$p$` es el número de rezagos (entonces, tenemos `$n+pn^{2}$` parámetros a estimar).

- Decisiones:
    
    - ¿Qué variables incluir en `$\mathrm{z}_{t}$`? Teoría económica.
    
    - ¿Cuantos rezagos `$(p)$` incluir? Pruebas estadísticas formales.

- El lado derecho de la forma reducida del VAR tiene únicamente variables predeterminadas (las mismas en todas las ecuaciones). Así, **cada ecuación puede ser estimada por separado por MCO**, esto a pesar de estar los errores de las ecuaciones correlacionados.

---

## Identificación del VAR estructural a partir del VAR en forma Reducida

- Es posible recuperar los parámetros del VAR estructural y los shocks estructurales?

- La respuesta es no a menos que se impongan ciertas restricciones.

- Retomemos el VAR(1) con 2 variables:
`$$\mathrm{z}_{t}=A_{0}+A_{1}\mathrm{z}_{t-1}+e_{t}$$`

- Note que: `$\hat{A}_{0}=B^{-1}\Gamma_{0}$`, `$\hat{A}_{1}=B^{-1}\Gamma_{1}$` y `$\hat{\Sigma}=\left(B^{-1}\right)^{2}V(\varepsilon_{t})$`. 
    
    - Forma reducida: `$2+4\times1+3=9$`
    
    - Forma Estructural: `$2+4\times1+2+2=10$`

- Es necesaria `$1$` restricción. En general en un VAR(p) con `$n$` variables se requieren `$\frac{n^{2}-n}{2}$` restricciones.

---

## Identificación del VAR estructural a partir del VAR en forma Reducida

- Imponer `$b_{21}=0$` en el VAR estructural: `$y$` **no tiene efecto contemporáneo en** `$x$`.
`$$\begin{aligned}
y_{t}  = & b_{10}-b_{12}x_{t}+\gamma_{11}y_{t-1}+\gamma_{12}x_{t-1}+\epsilon_{yt}\\
x_{t}  = & b_{20}+\gamma_{21}y_{t-1}+\gamma_{22}x_{t-1}+\epsilon_{xt}
\end{aligned}$$`

y `$e_{1t} = \epsilon_{yt}-b_{12}\epsilon_{xt}$`, `$e_{2t} = \epsilon_{xt}$`.

- Los parámetros estructurales están identificados a partir de los estimados de la forma reducida:
`$$\begin{aligned}
\hat{a}_{10} & = & b_{10}-b_{12}b_{20}\\
\hat{a}_{11} & = & \gamma_{11}-b_{12}\gamma_{21}\\
\hat{a}_{12} & = & \gamma_{12}-b_{12}\gamma_{22}\\
\hat{a}_{20} & = & b_{20}\\
\hat{a}_{21} & = & \gamma_{21}\\
\hat{a}_{22} & = & \gamma_{22}\\
\hat{\mathbb{V}(e_{1})} & = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\
\hat{\mathbb{V}(e_{2})} & = & \sigma_{x}^{2}\\
\hat{Cov(e_{1},e_{2})} & = & -b_{12}\sigma_{x}^{3}
\end{aligned}$$`

---

## Identificación del VAR estructural a partir del VAR en forma Reducida

- En general para un VAR con `$k$` variables: `$B$` es una matriz triangular (superior).
`$$B=\left[\begin{array}{cccc}
1 & b_{12} & ... & b_{1k}\\
0 & 1 & ... & b_{2k}\\
\vdots & \vdots & \ddots & \vdots\\
0 & 0 & 0 & 1
\end{array}\right]$$`

- **Interpretación**:  `$(y_{1t},y_{2t},y_{3t},...,y_{kt})$` están ordenandas de más endógena a menos endógena.

- `$y_{1t}$` es afectados contemporáneamente por `$(y_{2t},y_{3t},...,y_{kt})$`.

- `$y_{2t}$` es afectados contemporáneamente por `$(y_{3t},...,y_{kt})$`.

...

- `$y_{kt}$` es afectados contemporáneamente por `$y_{kt}$`.

---

## Resultados de un VAR

- ¿Cómo presentar los resultados de un VAR? (1) Funciones de Impulso Respuesta; (2) Descomposición de la Varianza.
   
- **Función de Impulso Respuesta**: Es la representación gráfica de los efectos de shocks sobre las variables del modelo VAR `$j$` periodos adelante.

- Usemos por simplicidad un VAR(1) de dos variable con intercepto cero:
`$$\begin{aligned}
y_{t}  = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{Yt}-b_{12}\epsilon_{Xt}\right)\\
x_{t}  = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{Xt}\right)
\end{aligned}$$`

- Efecto de un shock `$\epsilon_{yt}$` de tamaño `$\sigma_{y}$` (el mismo ejercicio se puede hacer con un shock en `$\epsilon_{yt}$`):

| | `$Y$` | `$X$` |
| --- | --- | --- |
| `$0$` | `$\sigma_{Y}$` | 0 | 
| `$1$` | `$a_{11}\sigma_{Y}$` | `$a_{21}\sigma_{Y}$` |
| `$2$` | `$a_{11}^{2}\sigma_{Y}+a_{12}a_{21}\sigma_{Y}$` |  `$a_{21}a_{11}\sigma_{Y}+a_{22}a_{21}\sigma_{Y}$` |
| | ... | ... |

---

## Resultados de un VAR

- **Descomposición de la Varianza**:

- Recordemos nuevamente que:
`$$\begin{aligned}
y_{t}  = & a_{11}y_{t-1}+a_{12}x_{t-1}+\left(\epsilon_{yt}-b_{12}\epsilon_{xt}\right)\\
x_{t}  = & a_{21}y_{t-1}+a_{22}x_{t-1}+\left(\epsilon_{xt}\right)
\end{aligned}$$`

- La predicción a un período adelante es:
`$$\begin{aligned}
\mathbb{E}_{t}y_{t+1}  = & a_{11}Y_{t}+a_{12}x_{t}+\left(\epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\right)\\
\mathbb{E}_{t}x_{t+1}  = & a_{21}Y_{t}+a_{22}x_{t}+\left(\epsilon_{xt+1}\right)
\end{aligned}$$`

- Los errores de predicción satisfacen:
`$$\begin{aligned}
y_{t+1}-\mathbb{E}_{t}y_{t+1}  = & \epsilon_{yt+1}-b_{12}\epsilon_{xt+1}\\
x_{t+1}-\mathbb{E}_{t}x_{t+1}  = & \epsilon_{xt+1}
\end{aligned}$$`

---

## Resultados de un VAR

- Aplicando el operador varianza:
`$$\begin{aligned}
\sigma_{y}^{2}(1)  = & \sigma_{y}^{2}+b_{12}^{2}\sigma_{x}^{2}\\
\sigma_{x}^{2}(1)  = & \sigma_{x}^{2}
\end{aligned}$$`

- Entonces, para el caso de `$y$`:
`$$\begin{aligned}
\%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{yt}  = & \frac{\sigma_{y}^{2}}{\sigma_{y}^{2}(1)}\\
\%\sigma_{y}^{2}(1)\,debido\,a\,\epsilon_{xt}  = & \frac{b_{12}^{2}\sigma_{x}^{2}}{\sigma_{y}^{2}(1)}
\end{aligned}$$`

- Para el caso de `$x$`
`$$\begin{aligned}
\%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{yt}  = & 0\\
\%\sigma_{x}^{2}(1)\,debido\,a\,\epsilon_{xt}  = & \frac{\sigma_{x}^{2}}{\sigma_{x}^{2}(1)}
\end{aligned}$$`

- Este ejercicio se repite para 2, 3, ..., `$j$` periodos adelante.

---

## Elección del rezago óptimo

- Aumento en el número de rezago reduce sustancialmente los grados de libertad.

- Con `$n$` variable y `$p$` rezagos, un rezago adicional implica estimar `$n\times p$` nuevos parámetros.

- Existe un `$p$` óptimo tal que cualquier rezago menor genera mala especificación y cualquier rezago mayor tiene muy pocos grados de libertad.

- Una alternativa es usar los criterios de información:
`$$\begin{aligned}
AIC  = & Tlog|\Sigma|+2N\\
BIC  = & Tlog|\Sigma|+Nlog(T)
\end{aligned}$$`
  donde `$N$` es el total de parámetros estimados en todas las ecuaciones.

---

## Elección del rezago óptimo

- Otra alternativa es usar un test de exclusión de rezagos:
    
  -  Elegir un rezago suficientemente grande, digamos `$P_{NR}$`. Estimar el VAR y calcular `$\Sigma_{NR}$`.
  
  - Asumimos que `$p$` puede ser menor y estimamos un VAR con `$P_{R}(<P_{NR})$` rezagos y calculamos: `$\Sigma_{R}$`.
`$$\mathrm{H}_{0}:A_{P_{NR}}=A_{P_{NR}-1}=...=\mathrm{0}$$`

- Calcular el siguiente estadístico:
`$$LR=\left(T-c\right)\left\{ log|\Sigma_{R}|-log|\Sigma_{NR}|\right\}\sim\chi_{(P_{NR}-P_{R})\times n\times n}^{2}$$`

donde `$T$` = No. Observaciones y `$c$` No de parámetros estimados en cada ecuación del modelo no restringido `$(p=P_{NR})$`.

---

## Test de causalidad de Granger

- Una variable Granger causa a otra si tiene información relevante a predecir el comportamiento de dicha variable.

- Suponga un VAR(2) con `$2$` variables:
`$$\begin{aligned}
y_{t}  = & a_{10}+a_{11}^{1}y_{t-1}+a_{12}^{1}x_{t-1}+a_{11}^{2}y_{t-2}+a_{12}^{2}x_{t-2}+e_{1t}\\
x_{t}  = & a_{20}+a_{21}^{1}y_{t-1}+a_{22}^{1}x_{t-1}+a_{21}^{2}y_{t-2}+a_{22}^{2}x_{t-2}+e_{2t}
\end{aligned}$$`
  entonces:  
  
  - Decimos que `$x_{t}$` no Granger causa a `$y_{t}$` si: `$a_{12}^{1}=a_{12}^{2}=0$`.
  
  - Decimos que `$y_{t}$` no Granger causa a `$x_{t}$` si: `$a_{21}^{1}=a_{21}^{2}=0$`.

- Un test F sobre cada ecuación permite probar las hipótesis de causalidad a la Granger.

---