8 IV-Regression
Warning: package 'gt' was built under R version 4.3.3
Wie in Kapitel Kapitel 4 erläutert, können Regressionsmodelle unter Endogenitätsproblemen leiden: Der Fehlerterm in unserem Regressionsmodell ist mit dem/den interessierenden Regressor(en) korreliert, sodass der zugehörige Koeffizient inkonsistent geschätzt wird und damit nicht als kausaler Effekt interpretiert werden darf. Die häufigsten Ursachen für Endogenität, die in empirischen Anwendungen auftreten, sind ausgelassene Variablen, Messfehler und simultane Kausalität.
Durch Hinzufügen potenziell relevanter Variablen in die Regression kann das Risiko einer verzerrten Schätzung des interessierenden kausalen Effekts anhand multipler Regression verringert werden. Wenn jedoch wichtige ausgelassene Variablen unbeobachtbar (U) sind oder aus anderen Gründen nicht zur Verfügung stehen, kann multiple Regression die Endogenität nicht beheben. Diese Problematik ergibt sich insbesondere bei simultaner Kausalität: Wenn die Kausalität von der Behandlungsvariable (B) zur Outcomevariable (Y) und umgekehrt verläuft, gibt es Backdoors, die nicht durch das Hinzufügen von Kontrollvariablen zum Regressionsmodell geschlossen werden können.
Eine allgemeinere Technik, um Backdoors aufgrund unbeobachtbarer Variablen zu schließen, ist die Regression mit Instrumentvariablen (IV). Bei IV-Regression wird exogene Variation in einer Instrumentvariablen (Z) verwendet, um den Teil der Variation in der Behandlungsvariable zu isolieren, der nicht durch unbeobachtbare Faktoren verursacht wird, die sowohl B als auch Y beeinflussen. Der kausale Effekt von B auf Y wird dann anhand dieser exogene Variation in B geschätzt. Ein Forschungsdesign, in dem der kausale Effekt von B auf Y mit IV-Regression geschätzt werden kann, ist in Abbildung 8.1 dargestellt.
8.1 Der einfache lineare IV-Schätzer
Im folgenden nehmen wir an, dass sämtliche Zusammenhänge linear sind. Zunächst betrachten wir das einfache Regressionsmodell
\[\begin{align} Y_i = \beta_0 + \beta_1 B_i + u_i \ \ , \ \ i=1,\dots,n, \label{eq:simpleiv} \end{align}\]
wobei der Fehlerterm \(u_i\) mit dem Regressor \(B_i\) korreliert ist (d.h. \(B\) ist ein endogener Regressor), sodass der KQ-Schätzer für den kausalen Effekt \(\beta_1\) inkonsistent ist.
Damit \(Z\) ein gültiges Instrument für \(B\) in dem in Abbildung 8.1 gezeigten Forschungsdesign ist, müssen die folgenden Bedingungen erfüllt sein:
Sei \(\text{Cov}(A,B)\) die Kovarianz zwischen den Variablen \(A\) und \(B\). \(Z\) muss zwei Bedingungen erfüllen, um ein gültiges Instrument zu sein:
-
1. Relevanz des Instruments für die endogene Variable
\(B\) und \(Z\) müssen korreliert sein (Pfeil von Z nach B in Abbildung 8.1): \[\begin{align} \text{Cov}(B,Z) \neq 0 \label{eq:ivassum1} \end{align}\]
-
2. Exogenität des Instruments hinsichtlich der Outcome-Variable
Das Instrument \(Z\) darf nicht mit dem Fehlerterm \(u\) in der Modellgleichung \(\eqref{eq:simpleiv}\) korreliert sein (keine Pfade von Z nach Y außer durch B in Abbildung 8.1): \[\begin{align} \text{Cov}(Z,u) = 0 \label{eq:ivassum2} \end{align}\]
Unter diesen Annahmen erlaubt das Forschungsdesign die Anwendung des einfachsten IV-Ansatzes, wobei eine endogene Variable \(B\) durch eine Instrumentvariable \(Z\) instrumentiert wird. Die folgende Umformung zeigt, warum der kausale Effekt von B auf Y anhand der (Ko)Variation in diesen Variablen identifiziert werden kann:
\[\begin{alignat*}{2} \textup{Cov}(Z,Y) &= \textup{Cov}(Z,\beta_0 + \beta_1 B + u) &\quad& \text{(Gl. \eqref{eq:simpleiv})} \\ \\ \textup{Cov}(Z,Y) &= \textup{Cov}(Z, \beta_1 B + u) &\quad& \text{($\beta_0$ konstant)} \\ \\ \textup{Cov}(Z,Y) &= \beta_1\textup{Cov}(Z,B) &\quad& \text{($\beta_1$ konstant, $Z$ exogen)} \\ \\ \beta_1 &= \frac{\textup{Cov}(Z,Y) }{\textup{Cov}(Z,B)} &\quad& \text{($Z$ relevant)} \end{alignat*}\]
Eine naheliegende Implementierung gemäß dieses Identifikationsprinzips ist der einfache IV-Schätzer
\[\begin{align} \widehat{\beta}_{\textup{IV}} = \frac{\widehat{\textup{Cov}}(Z,Y) }{\widehat{\textup{Cov}}(Z,B)}, \label{eq:simpleivest} \end{align}\]
wobei lediglich die Kovarianzfunktion \(\textup{Cov}(\cdot,\cdot)\) durch ihr Stichprobenäquivalent \(\widehat{\textup{Cov}}(\cdot,\cdot)\) ersetzt wird.
Erwartungswert und Konsistenz
Eine hilfreiche Darstellung von \(\eqref{eq:simpleivest}\) ist
\[\begin{align*} \widehat{\beta}_\textup{IV} = \beta_1 + \frac{\sum_{i=1}^n (Z_i-\overline Z) u_i}{\sum_{i=1}^n (Z_i - \overline{Z})B_i}. \end{align*}\]
Anhand dieser Form kann der Erwartungswert sowie das Verhalten für große Stichproben untersucht werden. Eine wichtige Eigenschaft ist
\[\begin{align} \textup{E}\big(\widehat{\beta}_\textup{IV}\big) = \beta_1 + \underbrace{\textup{E}\bigg(\frac{\sum_{i=1}^n (Z_i-\overline Z) u_i}{\sum_{i=1}^n (Z_i - \overline{Z})B_i}\bigg)}_{\neq0},\label{eq:ivbiasterm} \end{align}\]
sodass \(\widehat{\beta}_\textup{IV}\) bei Endogenität von \(X\) ein verzerrter Schätzer von \(\beta_1\) ist.1 Glücklicherweise kann man zeigen, dass
1 Beachte, dass der endogene Regressor \(B_i\) mit \(u_i\) korreliert, sodass der Erwartungswert des Bruchs in \(\eqref{eq:ivbiasterm}\) ungleich \(0\) ist.
\[\begin{align*} \frac{\sum_{i=1}^n (Z_i-\overline Z) u_i}{\sum_{i=1}^n (Z_i - \overline{Z})B_i}\to 0 \quad \text{für} \quad n\to\infty \end{align*}\]
bei Gültigkeit der IV-Annahmen \(\eqref{eq:ivassum1}\) und \(\eqref{eq:ivassum2}\), d.h. \(\widehat{\beta}_\textup{IV}\) ist ein konsistener Schätzer für \(\beta_1\),
\[\begin{align*} \widehat{\beta}_\textup{IV} \to \beta_1 \quad \text{für} \quad n\to\infty. \end{align*}\]
Schwache Instrumente
Beachte, dass die Annahme der Relevanz des Instruments für die Herleitung des Identifikationsprinzips und des Schätzers \(\eqref{eq:simpleivest}\) von entscheidender Bedeutung ist: Sind \(Z\) und \(B\) unkorreliert, so ist \(\text{Cov}(B,Z) = 0\) und \(\beta_1\) damit nicht identifizierbar. Weiterhin würde \(\widehat{\text{Cov}}(B,Z)\to0\) wenn \(n\to\infty\), sodass \(\widehat{\beta}_{\textup{IV}}\to\infty\)!
In empirischen Anwendungen ist \(\text{Cov}(B,Z) = 0\) unwahrscheinlich. Die Kovarianz von \(B\) und \(Z\) kann jedoch gering sein. In diesem Fall bezeichnet man \(Z\) als ein schwaches Instrument. Anhand von Gleichung \(\eqref{eq:simpleivest}\) können wir die Konsequenzen der Verwendung eines schwachen Instruments ableiten: Ein sehr schwacher linearer Zusammenhang von \(B\) und \(Z\) — und damit tendenziell \(\widehat{\text{Cov}}(B,Z) \approx 0\) — kann trotz Relevanz von \(Z\) zu einem Schätzer mit großer Varianz führen.
Die Relevanz eines Instruments kann mit einem Hypothesentests geprüft werden. Wie die “Stärke” eines Instruments beurteilt werden sollte, ist eine nicht-triviale Frage. Wir betrachten diesen Aspekt näher in Kapitel 8.2.
8.1.1 Identifizierbarer Behandlungseffekt
Regression ermöglicht in der Regel die Schätzung eines durchschnittlichen Behandlungseffekts (ATE) für eine betrachtete Population mit heterogenen Behandlungseffekten (in Modell \(\eqref{eq:simpleiv}\) unterstellen wir den empirisch unwahrscheinlichen Fall eines einheitlichen kausalen Effekts \(\beta_1\)). Das Adjustieren für Endogenität mit IV-Regression hat hier einen Preis: Beachte, dass im IV-Design ein Teil der beobachteten Variation der Behandlungsvariable \(B\) (wie in \(\eqref{eq:simpleiv}\) angenommen) endogen ist und wir den Effekt von \(B\) auf \(Y\) anhand der exogenen Variation eines validen Instruments \(Z\) schätzen. Daher können wir grundsätzlich nur einen lokalen durchschnittlichen Behandlungseffekt (LATE) identifizieren: Der LATE ist eine gewichtete Variante des ATE, wobei Beobachtungen, deren Behandlung gut durch \(Z\) erklärt wird den größten Einfluss haben.2
2 Siehe Kapitel 10 und 19 in Huntington-Klein (2021) für nicht-technische Erläuterungen und Beispiel zu LATE.
8.2 2SLS-Verfahren
Der einfache IV-Schätzer \(\eqref{eq:simpleivest}\) ist ein Spezialfall eines allgemeineren Regressionsverfahrens, das in zwei Schritten Durchgeführt wird. Im fall von Modell \(\eqref{eq:simpleiv}\) erfolgt die Schätzung anhand der folgenden einfachen Regressionen:
-
1. Stufe: Regression von \(B\) auf \(Z\)
Regressiere die endogene Variable \(B\) auf das Instrument \(Z\): \[\begin{align} B_i = \alpha_0 + \alpha_1 Z_i + u_i, \quad 1,\dots,n. \end{align}\] Berechne die geschätzten Werte \[\begin{align} \widehat{B}_i = \widehat{\alpha}_0 + \widehat{\alpha}_1 Z_i. \end{align}\]
Die \(\widehat{B}_i\) aus dieser Regression sind “bereinigt”: Die Variation in den \(\widehat{B}_i\) wird lediglich durch die exogene Variation in \(Z\) verursacht.
-
2. Stufe: Regression von \(Y\) auf \(\widehat{B}\)
Regressiere die Beobachtungen der abhängigen Variable \(Y_i\) auf die geschätzten Werte \(\widehat{B}_i\) aus der 1. Stufe: \[\begin{align} Y_i = \gamma_0 + \gamma_1 \widehat{B}_i + e_i. \end{align}\] Der geschätzte Koeffizient \(\widehat{\gamma}_1\) aus dieser Regression ist der Two-Stage-Least-Squares-Schätzer (2SLS-Schätzer) von \(\beta_1\).
8.2.1 Äquivalenz von 2SLS und einfacher IV-Schätzer
Der KQ-Schätzer von \(\gamma_1\) in der 2. Stufe ist \[\begin{align} \widehat{\gamma}_1 = \frac{\sum (\widehat{B}_i - \overline{\widehat{B}})(Y_i - \bar{Y})}{\sum (\widehat{B}_i - \bar{\widehat{B}})^2} = \frac{\widehat{\text{Cov}}(\widehat{B}, Y)}{\widehat{\textup{Var}}(\widehat{B}_i)}. \end{align}\] Da \(\widehat{B}_i = \widehat{\alpha}_0 + \widehat{\alpha}_1 Z_i\), die angepassten Werte aus der 1. Stufe, eine lineare Funktion von \(Z_i\) sind, können wir \(\widehat{\text{Cov}}(\widehat{B}, Y)\) wie folgt schreiben: \[\begin{align} \widehat{\text{Cov}}(\widehat{B}, Y) = \widehat{\alpha}_1 \widehat{\text{Cov}}(Z, Y) \end{align}\] Eine ähnliche Umformung zeigt, dass \[\begin{align} \widehat{\text{Var}}(\widehat{B}) = \widehat{\alpha}_1^2 \widehat{\text{Var}}(Z). \end{align}\]
Kombinieren wir diese Ergebnisse, erhalten wir folgende Darstellung für den KQ-Schätzer von \(\gamma_1\) in der 2. Stufe: \[\begin{align} \widehat{\gamma}_1 = \frac{\widehat{\text{Cov}}(\widehat{B}, Y)}{\widehat{\text{Var}}(\widehat{B})} = \frac{\widehat{\alpha}_1 \widehat{\text{Cov}}(Z, Y)}{\widehat{\alpha}_1^2 \widehat{\text{Var}}(Z)} = \frac{\widehat{\text{Cov}}(Z, Y)}{\widehat{\alpha}_1 \widehat{\text{Var}}(Z)} \end{align}\]
Der KQ-Schätzer von \(\widehat{\alpha}_1\) in der 1. Stufe ist definiert als \(\widehat{\alpha}_1 = \frac{\widehat{\text{Cov}}(Z, B)}{\widehat{\text{Var}}(Z)}\). Somit gilt \[\begin{align} \widehat{\gamma}_1 = \frac{\widehat{\text{Cov}}(Z, Y)}{\frac{\widehat{\text{Cov}}(Z, B)}{\widehat{\text{Var}}(Z)} \widehat{\text{Var}}(Z)} = \frac{\widehat{\text{Cov}}(Z, Y)}{\widehat{\text{Cov}}(Z, B)} = \widehat{\beta}_{\textup{IV}}.\label{eq:equiviv} \end{align}\]
8.2.2 Wozu 2SLS?
In der Praxis werden IV-Schätzungen mit statistischer Software häufig anhand einer Implementierung des 2SLS-Verfahren durchgeführt. Gründe hierfür sind:
-
Bedingte Exogenität. Für den in Abbildung 8.1 dargestellten DGP ist die Exogenität von Z gegeben. In empirischen Anwendungen kann es jedoch schwierig sein, ein Instrument Z zu finden, dass plausibel nur mit dem endogenen Regressor korreliert. Eine schwächere Bedingung als Exogenität ist Exogenität nach Kontrolle für beobachtbare gemeinsame Determinanten (X) von Z und Y.3
Diese Situation ist in Abbildung 8.2 dargestellt: Aufgrund der Pfeile von X zu Z und Y ist die Bedingung \(\eqref{eq:ivassum2}\) verletzt. Durch Kontrolle für X in beiden Regressionen des 2SLS-Verfahrens können die Pfade durch X geschlossen werden.
Mehrere endogene Variablen / Instrumente. Der 2SLS-Ansatz kann leicht für mehrere endogene Variablen (und mehrere Instrumentvariablen) erweitert werden. Für jede der endogenen Variablen erfolgt hierbei eine separate Regression in der ersten Stufe des 2SLS-Verfahrens, wobei jeweils mehrere Instrumente verwendet werden und zusätzlich für beobachtbare Kovariablen X kontrolliert werden kann.
-
Statistische Inferenz. Die Berechnung von \(\widehat{\beta}_\textup{IV}\) erfordert Sorgfalt bei der Konstruktion von Inferenzstatistiken. Die in Kapitel 8.2.1 gezeigte Äquivalenz impliziert, dass wir bei der Schätzung der Variabilität von \(\widehat{\beta}_\textup{IV}\) die Unsicherheit aus den beiden KQ-Schätzungen des 2SLS-Verfahrens berücksichtigen müssen. Korrigierte Standardfehlerformeln können vergleichsweise einfach anhand der Regressionsdarstellung hergeleitet werden und sind statistischer Software implementiert (bspw.
ivreg
in R).Weiterhin ermöglicht das Regressions-Framework diagnostische Tests. So kann die Relevanz von Instrumenten anhand von F-Tests für die Koeffizienten in den Regressionen der ersten Stufe des 2SLS-Verfahrens überprüft werden. Sofern mehr Instrumente als endogene Variablen vorliegen, kann die Exogenität der Instrumente getestet werden.
3 Formal: \(\textup{Cov}(Z,u\vert X) = 0\).
8.2.3 Interaktive Illustrationen: 2SLS-Verfahren
Der DGP im nachfolgenden interaktiven Beispiel ist
\[\begin{align} \begin{split} X_i =&\, \gamma \cdot Z_i + v_i,\\ Y_i =&\, \beta_1 \cdot X_i + u_i, \end{split} \label{eq:OJSIVDGP} \end{align}\] wobei \(Z_i \sim N(0, .25^2)\). Die Fehlerterme \(v_i\) und \(u_i\) sind \(N(0,1)\)-verteilt und folgen einer gemeinsam Normalverteilung mit Korrelationsparameter \(\rho\), \[\begin{align} \begin{pmatrix} v_i \\ u_i \end{pmatrix} \sim N \bigg[ \begin{pmatrix} 0 \\ 0 \end{pmatrix} \begin{pmatrix} 1 & \rho \\ \rho & 1 \end{pmatrix} \bigg]. \end{align}\]
Wir sind daran interessiert, den Parameter \(\beta_1\) zu schätzen, um den Effekt von \(X\) auf \(Y\) zu bestimmen, wobei wir \(n=1000\) Beobachtungen von \((X_i, Y_i, Z_i)\) verwenden.
Beachte, dass \(X_i\) eine Funktion der (exogenen) Variable \(Z_i\) und des Fehlerterms \(v_i\) ist. Wenn die Fehlerterme \((v_i, u_i)’\) im DGP \(\eqref{eq:OJSIVDGP}\) korreliert sind (\(\rho\neq0\)), dann besteht Korrelation zwischen \(X_i\) und \(u_i\). Dies impliziert, dass \(X\) ein endogener Regressor im “naiven” Regressionsmodell \[\begin{align} Y_i = \beta_0 + \beta_1 X_i + e_i, \quad i = 1,\dots,N. \end{align}\] Der KQ-Schätzer von \(\beta_1\) ist dann verzerrt und inkonsistent.
Wenn \(Z\) Erklärungskraft für \(X\) hat, d.h. \(\gamma\neq0\) mit \(|\gamma|\) nicht zu klein gewählt ist (\(Z\) ist relevant), und \(Z\) nur über \(X\) auf \(Y\) wirkt (\(Z\) ist exogen in der Gleichung von \(Y_i\)), dann kann der kausale Effekt von \(X\) auf \(Y\) anhand einer Instrumentvariablen-Regression mit \(Z\) konsistent geschätzt werden.
Die folgende Interaktive Grafik berechnet den 2SLS-Schätzer Analog zu der in Kapitel 8.2 erläuterten Vorgehensweise:
-
Schätze das Regressionsmodell
\[\begin{align} X_i = \alpha_0 + \alpha_1 \cdot Z_i + \epsilon_i \end{align}\] und berechnen Sie die angepassten Werte \(\widehat{X}_i\). Dieser Schritt isoliert die exogene Variation in \(X_i\), die auf \(Z_i\) zurückzuführen ist.
-
Schätze den Effekt von \(X\) auf \(Y\) unter Verwendung von \(\widehat{X}_i\), dem exogenen Teil von \(X_i\) aus 1., in der Regression
\[\begin{align} Y_i = \delta_0 + \delta_1 \cdot \widehat{X}_i + \varepsilon_i. \end{align}\] Der KQ-Schätzer \(\widehat{\delta}_1\) von \(\delta_1\) ist der 2SLS-Schätzer von \(\beta_1\).
Die Grafik illustriert das Verhalten des IV-Schätzers (lila Grade) im Vergleich zum KQ-Schätzer (gestrichelte Grade) und zum wahren Zusammenhang (grüne Grade) für eine simulierte Stichprobe (gegeben der gewählten Parameter) anhand der geschätzten Regressionslinien. Die voreingestellten Parameter-Kombinationen zeigen
- die Verzerrung von 2SLS, wenn \(Z\) ein schwaches Instrument für \(X\) ist,
- eine Situation in der \(X\) exogen ist (KQ ist unverzerrt), was zu vergleichbaren Schätzungen führt (sofern \(Z\) kein schwaches Instrument ist)
- eine starke Verzerrung von KQ, wenn \(X\) endogen und irrelevant (\(\beta_1 = 0\)) ist.
Anhand der obigen interaktiven Grafik lässt sich zwar die Verzerrung der Schätzer einschätzen, jedoch nicht die Unsicherheit der Schätzung. Um die Verteilung der Schätzer in endlichen Stichproben zu illustrieren, zeigt die nachstehende Grafik Kerndichteschätzungen basierend auf \(N\) simulierte Stichproben der Größe \(n\) für den gewählten DGP.4 Die Applikation gibt weiterhin den R-Code für eine Simulation der Daten gemäß der gewählten Parameter aus.
4 Beachte, dass die Simulation insbesondere für große \(N\) und \(n\) einige Sekunden dauern kann (grauer Balken am linken Rand zeigt laufende Berechnung an).
Die voreingestellten Parameter-Kombinationen zeigen:
Wenn \(Z\) ein schwaches Instrument ist, kann der IV-Schätzer auch in großen Stichproben eine hohe Verzerrung haben und eine deutlich größere Varianz als der KQ-Schätzer haben.
Wenn der interessierende Regressor (Behandlungsvariable) \(X\) exogen ist, hat der IV-Schätzer eine größere Varianz als der KQ-Schätzer.
Wenn die Endogenität von \(X\) “stark” ist (d.h. hohe Korrelation von \(u\) und \(v\)), kann der IV-Schätzer auch in kleinen Stichproben hilfreich sein, sofern das Instrument \(Z\) nicht zu schwach ist: IV hat dann eine deutlich geringere Verzerrung als KQ, aber eine größere Varianz.
8.2.4 Schätzung mit R
Wir zeigen nachfolgend, wie die Daten aus den vorherigen interaktiven Beispielen in R generiert, die IV-Regression durchgeführt und ein (grafischer) Vergleich mit der naiven KQ-Schätzung implementiert werden kann.
8.3 Beispiel: Der schwache Staat, die Bauern und die Mafia
Acemoglu, De Feo, und De Luca (2020) untersuchen den Aufstieg und die Auswirkungen der sizilianischen Mafia gegen Ende des 19. Jahrhunderts. Die Studie argumentiert, dass die Verbreitung der Mafia teilweise auf das Aufkommen sozialistischer Bauern-Organisationen (Fasci siciliani) zurückzuführen ist, die in einem Umfeld schwacher staatlicher Präsenz die Rechte der Bauern verteidigten. Grundbesitzer, Verwalter und lokale Politiker wandten sich also an die Mafia, um diese sozialistische “Bedrohung” zu bekämpfen und die Kontrolle über die landwirtschaftlich arbeitende Bevölkerung zu behalten. Die Studie identifiziert einen signifikanten (positiven) kausalen Zusammenhang zwischen dem Aufstieg der Fasci und der Ausbreitung der Mafia in Sizilien.
8.3.1 Identifikationsstrategie
Die Beziehung zwischen dem Aufkommen der Fasci und der Mafiaaktivität im einfachen Regressionsmodell \[\begin{align} \textup{Mafiaaktivität} = \beta_0 + \beta_1 \textup{Fasci siciliani} + \varepsilon \label{eq:fascimafiamod1} \end{align}\] ist wahrscheinlich aufgrund mehrerer Faktoren endogen:
Externe Faktoren, die sowohl die Entstehung der Fasci siciliani als auch der Mafia beeinflussen, sind wahrscheinlich. Beispielsweise könnten wirtschaftliche Notlagen und politische Instabilität sowohl die Organisation der Bauern als auch die Etablierung der Mafia begünstigen.
Simultante Kasalität: Die Präsenz der Fasci könnte die Mafiaaktivitäten beeinflussen und umgekehrt: Intensive Mafiaaktivitäten könnten die Notwendigkeit für Bauernorganisationen erhöhen, was wiederum die Mafia stärkt. Außerdem erschwert die zeitliche Nähe zwischen der Entstehung der Fasci und der Verbreitung der Mafia die Identifizierung der Kausalrichtung.
Wir können das Modell \(\eqref{eq:fascimafiamod1}\) um (messbare) unter 1. fallende Regressoren erweitern, um einer verzerrten Schätzung aufgrund relevanter ausgelassener Variablen vorzubeugen. Eine Verzerrung aufgrund der in 2. beschriebenen simultanen Kausalität kann jedoch nicht durch multiple Regression vermieden werden. Acemoglu, De Feo, und De Luca (2020) nutzen die folgende Identifikationsstrategie: Eine extreme Dürre im Jahr 1893 (insbesondere Regenausfall im Frühling) hatte einen erheblichen negativen Einfluss auf die landwirtschaftliche Produktion in Sizilien und verursachte große Not unter den Bauern, was die Entstehung der Fasci beförderte. Die Dürre kann als natürliches Experiment betrachtet werden, wobei durch die Variation in der Niederschlagsmenge (das Instrument) die Variation im Aufkommen von Fasci-Organisationen in verschiedenen Gemeinden, die unabhängig von der späteren Mafiaaktivität ist, isoliert werden kann. Anhand dieser exogenen Variation im Organisationsgrad der Bauern kann der (lokale) kausale Effekt auf die Entwicklung der Mafia identifiziert werden.
8.3.2 Reproduktion der Kernergebnisse mit R
Wir lesen zunächst den Datensatz ADD_Mafia_municipality.csv
5 ein und verschaffen uns einen Überblick.
5 Der Datensatz stammt aus dem MIT Economics Data Archive und liegt im STATA-Format .dta
vor. Wir verwenden hier eine in das .csv
formatierte Version.
Tabelle 8.1 gibt einen Überblick der in ADD_dat
verfügbaren Variablen auf Gemeinde-Ebene und deren Definition.
Variable | Beschreibung |
---|---|
peasants_fasci | Präsenz Fasci in 1893-Q4 (Dummy) |
sp3m1893_n30 | Dürre-Intensität: Relative Regenmenge im Frühling 1893 (ggü. Mittel v. 1841 bis 1881) |
cl1_stn_sp1893_n30 | Nächste aktive Wetterstation (Frühling 1893) |
predr_peas_fasci | Präsenz Fasci vor März 1893 (Dummy) |
ruralcentre1861 | Landwirtschaftliche Gemeinde? (Dummy) |
Rural_rent | Durchschn. ländliche Pacht / Hektar in 1953 |
Urban_rent | Durchschn. städtische Pacht / Hektar in 1953 |
agricola_rel | Anteil bewirtschaftetes Land in 1853 |
seminatoritot_rel | Anteil Anbaufläche Getreide in 1853 |
sulfurproduction1868_70 | Durschn. Schwefel-Produktion / Jahr für 1868-1870 |
Citrus_groves | Anteil Anbaufläche Zitrusfrüchte in 1853 |
Olives_groves | Anteil Anbaufläche Oliven in 1853 |
Vineyards | Anteil Anbaufläche Wein in 1853 |
Mafia1885 | Intensität Mafia gem. Damiani (1885), Skala 0-3 |
Mafia1900 | Intensität Mafia gem. Cutrera (1900), Skala 0-3 |
lnpop1861 | Log(Einwohner) in 1861 |
lnsurface | Log(Fläche) in 1853 |
centreheight | Höhe des Gemeindezentrums (M.ü. NN) |
maxheight | Max. Höhe (M.ü. NN) |
slope2 | Durschn. Höhe (M.ü. NN) |
pa_pdist1856 | Entfernung (Postweg) von Palermo in 1856 |
port2_pdist1856 | Entfernung (Postweg) nächer Hafen in 1856 |
roads1799 | Direkter Zugang Postweg in 1799 (Dummy) |
ave_temp | Durschn. Jahrestemperatur |
sp3m_ave_n30 | Durschn. Regenmenge im Frühling für 1881-1941 |
var_sp3m_n30 | Varianz Regenmenge im Frühling für 1881-1941 |
distretto1853 | Distrikt-Zugehörigkeit in 1853 |
provincia1853 | Provinz-Zugehörigkeit in 1853 |
ADD_dat
— Charakteristika von sizilianischen Gemeinden im 19. Jahrhundert
Vor der Analyse filtern wir die Daten entsprechend der Vorgehensweise in Acemoglu, De Feo, und De Luca (2020): Es werden lediglich Gemeinden berücksichtigt, die in maximal 30km Entfernung zu einer Wetter-Station liegen (!is.na(sp3m1893_n30)
) und für die eine Messung der Mafiaaktivität gegen Ende des 19. Jahrhunderts (gemessen auf einer Skala von 0 bis 4, vgl. Cutrera (1900)) vorliegt (!is.na(Mafia1900)
).
8.3.2.1 First-Stage-Regressionen
Tabelle 3 in Acemoglu, De Feo, und De Luca (2020) präsentiert First-Stage-Regressionen Für den endogenen Regressor \(\textup{Fasci siciliani}\) in \(\eqref{eq:fascimafiamod1}\): Die Auswirkungen der Dürre in 1893 (das Instrument) auf den Organisationsgrad der Bauern (der endogene Regressor). Hierbei werden verschiedene, aus dem DAG in Abbildung 8.3 abgeleitete Spezifikationen betrachtet:
-
Panel A: Keine Fixed Effects
- Modell ohne Kovariablen
- Modell mit Kovariablen für Bildung von Bauernorganisationen
- Modell mit Kovariablen für Bildung von Bauernorganisationen und Indikatoren für Mafia-Präsenz
- Modell mit Kovariablen für Bildung von Bauernorganisationen, Indikatoren für Mafia-Präsenz und geologische Faktoren
- Panel B: Modelle wie in Panel A und Kontrolle für Provinz-Fixed-Effects
Wir schätzten nachfolgend sämtliche Regressionen mit feols
und berechnen nach Distrikt-Zugehörigkeit (distretto1853
) sowie nächstgelegener Wetterstation (cl1_stn_sp1893_n30
) geclusterte Standardfehler.6 Hierzu setzen wir vcov = ~ distretto1853 + cl1_stn_sp1893_n30
. Diese Spezifikation berücksichtigt, dass die Niederschlagsmenge in einer Gemeinde sowie viele Kovariablen eine Korrelation mit benachbarten Gemeinden aufweisen können. Cluster-robuste Standardfehler sind inbesondere nötig, weil die Niederschlagsdaten für viele Gemeinden aus benachbarten Wetterstationen interpoliert werden, was zu einer zusätzlichen Korrelation zwischen den Beobachtungen führt. Standardfehler mit Two-way-clustering sind eine gängige Methode zur Berücksichtigung derartiger Korrelation.
6 Siehe Kapitel Kapitel 7 für Erläuterungen zu Fixed-Effects und cluster-robusten Standardfehlern.
Der obige Code-Chunk führt die First-Stage-Regression ohne Kovariablen aus. Wir finden einen signifikanten positiven Effekt der Niederschlagsmenge auf den Organisationsgrad der Bauern.
Acemoglu, De Feo, und De Luca (2020) verwenden Bootstrap cluster-robuste Standardfehler (Cameron, Gelbach, und Miller 2008, 2011), die aufwendig zu implementieren sind, jedoch zu nahezu identischen Ergebnissen führen. Der nächste Code-Chunk zeigt, wie cluster-robuste Bootstrap-Inferenz für das geschätzte Modell fasci_mod
berechnet werden können. Hierfür nutzen wir fwildclusterboot::boottest()
.7
7 fwildclusterboot
implementiert Varianten des Wild Bootstrap (Liu 1988).
Die statistische Zusammenfassung umfasst die Punktschätzung, die robuste t-Statistik sowie das 95%-Konfidenzintervall für den Koeffizienten von sp3m1893_n30
. Mit diesen Komponenten können wir den Bootstrap-Standardfehler beispielsweise durch die folgende Transformation berechnen:
Bei der Interpretation des geschätzten Koeffizienten müssen wir berückstigen, dass die abhängige Variable binär ist: Die First-Stage-Regression ist ein lineares Wahrscheinlicheitsmodell. Eine positive Änderung der relativen Regenmenge um eine Einheit (100%) verringert die Wahrscheinlichkeit also um 100%. Diese Interpretation ist jedoch wenig aussagekräftig für einen Einordnung des Effekts der Dürre. Stattdessen betrachten wir die Verteilung relativen Regenmengen und vergleichen den Effekt für eine von starker Dürre betroffenen Gemeinden (25%-Quantil) und einer Gemeinde mit einem relativ geringen Rückgang des Niederschlags (75%-Quantil)
Für eine Gemeinde mit 75% des langjährigen mittleren Niederschlags ist die geschätzte Wahrscheinlichkeit der Bildung von Bauern-Organisationen nur etwa halb so groß, wie für eine von starker Dürre betroffene Gemeinde.
Zur Vermeidung von Backdoors durch ausgelassene Variablen betrachten Acemoglu, De Feo, und De Luca (2020) weitere Spezifikationen für die First- und Second-Stage-Regressionen, die zusätzlich für Determinanten der Fasci, der Mafia, sowie für geographische Faktoren kontrollieren. Weiterhin werden diese Regressionen mit Fixed Effekts auf der Provinz-Ebene gemäß der Grenzen von 1853 (provincia1853
) wiederholt, um für unbeobachtbare Heteogenitäten zwischen den verschiedenen Provinzen zu kontrollieren. Die nachfolgenden Code-Chunks zeigen die Implementierung dieser Regressionen mit fixtest::feols()
. Für eine bessere Übersicht der Ergebnisse verwenden wir in summary()
das Argument n = 1
, sodass jeweils nur die Schätzung des ersten Koeffizienten (Effekt der relativen Regenmenge) ausgegeben wird.
Für eine tabellarische Übersicht fassen wir die interessierenden Komponenten der Schätzungen mit modelsummary::modelsummary()
zusammen. Hierfür sammeln wir zunächst jeweils die Modelle mit und ohne Provinz-Fixed-Effects in benannten Listen, sodass die Ergebnisse später in separaten Panelen dargestellt werden können. Für die Formatierung von Labels für die Fixed Effects und Koeffizienten definieren wir mit tibble::tribble()
das tibble
-Objekt gm
und übergeben reguläre Ausdrücke für eine Auswahl an zusammenfassenden Statistiken.
Die Ergebnisse bestätigen die Vermutung der Autoren, dass der Effekt des relativen Niederschlags auf den Organisationsgrad der Bauern ohne Kontrolle für die betrachteten Kovariablen tendenziell überschätzt wird. Tatsächlich führt multiple Regression mit Fixed Effects und sämtlichen Kovariablen (letzte Spalte in Panel B) zu einem etwa 30% kleineren geschätzten Effekt als für die einfache Regression in Panel A.
8.3.2.2 Second-Stage-Regressionen
Mit fml = Mafia1900 ~ 1 | peasants_fasci ~ sp3m1893_n30
legen wir fest, dass Mafia1900
auf eine Konstante sowie die angepassten Werte des endogenen Regressors peasants_fasci
aus der ersten Stufe (instrumentiert durch sp3m1893_n30
) regressiert werden soll. Wie für die First-Stage-Regressionen schätzen wir jeweils vier verschiedene Spezfikationen, unterscheiden zwischen Modellen mit und ohne Provinz-Fixed-Effects und berechnen cluster-robuste Standardfehler.
Die Ergebnisse für die IV-Schätzung des kausalen Effekts von Bauernorganisationen auf die Präsenz der Mafia zu Beginn des 20. Jahrhundert sind in der obigen Tabelle dargestellt. Die LATE-Schätzung in Spalte 4 von Panel B hat folgende Interpretation: Die Präsenz der Fasci in einer Gemeinde erhöht die Intensität der Mafiaaktivität um etwa 1.56 Punkte.8
8 Nach Cutrera (1900) entspricht eine Erhöhung des Mafia-Index von 1 auf 2 einem Sprung von einer geringen Präsenz der Mafia zu einer signifikanten Präsenz.
Wie ist dieser Effekt einzuordnen? Wir berechnen zunächst die Anzahl an Gemeinden, in denen es im Jahr 1900 Fasci gibt.
Für diese 84 Gemeinden erwarten wir jeweils einen Effekt von 1.56 Punkten auf die im Jahr 1900 beobachtete gesamte Intensität des Einflusses der Mafia in Sizilien, gemessen als gewichtete Summe.
Die gesamte Mafia-Intensität für Sizilien zu Beginn des 20. Jahrhunderts berechnen wir analog.
Der Anteil der Gemeinden mit Bauernorganisationen im Jahr 1900 an dieser Summe erlaubt eine Einordnung des Effekts der Fasci auf die Verbreitung der Mafia.
Die Interpretation lautet, dass bis zu 38% der Stärke der Mafia im Jahr 1900 in Sizilien auf ihren Einsatz gegen die Fasci zurückzuführen sein könnte.
8.4 Case Study: Ökonomische Schocks und Bürgerkriege
Ein Kernproblem bei der Schätzung der kausalen Beziehung zwischen wirtschaftlichen Schocks und dem Auftreten von kriegerischen Auseinandersetzungen ist die Endogenität von Variablen, die wirtschaftliche Stabilität messen (vgl. Fearon und Laitin 2003). Beispielsweise kann eine Verschlechterung der wirtschaftlichen Bedingungen eines Landes die Wahrscheinlichkeit eines Konflikts im Inland erhöhen. Gleichermaßen beeinflussen kriegerische Handlung im Inland die wirtschaftliche Situation einer Volkswirtschaft negativ.
In der “Konfliktgleichung”
\[\begin{align} \textup{Konflikt-Wsk.} = \beta_0 + \beta_1\, \Delta\text{BIP} + \text{Kontrollv.} + \epsilon\label{eq:rainconf1} \end{align}\]liegt dann Endogenität des Regressors für “wirtschaftliche Stabilität”, hier \(\Delta\text{BIP}\), aufgrund von simultanter Kausalität vor. Die multiple Regression \(\eqref{eq:rainconf1}\) liefert dann eine verzerrte Schätzungen des interessierenden Effekts \(\beta_1\).
Miguel, Satyanath, und Sergenti (2004) untersuchen die kausale Beziehung zwischen wirtschaftlichen Schocks und dem Auftreten von Bürgerkriegen in 41 afrikanischen Sub-Sahara-Ländern für den Zeitraum von 1981 bis 1999.9 Hierbei adressieren die Autoren das Endogenitätsproblem in einem IV-Ansatz mit Instrumenten, die mit wirtschaftlichen Schocks korreliert sind, aber nicht unmittelbar mit der Wahrscheinlichkeit eines Bürgerkriegs zusammenhängen.
9 Füge rainconflict$country %>% unique()
im nächsten WebR-Chunk für eine Liste der Länder aus.
Die Identifikationsstrategie basiert auf metereologischen Faktoren: In den betrachteten Agrarökonomien sind Schocks in den Niederschlägen entscheidend für die Entwicklung des Bruttoinlandsprodukts. Ungünstige Wetterbedingungen, die landwirtschaftliche Erträge negativ beeinflussen, haben einen direkten (negativen) Effekt auf die wirtschaftliche Situation. Variation in der Regenmenge ist jedoch keine unmittelbare Determinante der Konfliktwahrscheinlichkeit und folglich exogen in Modellgleichung \(\eqref{eq:rainconf1}\). Maße für die Veränderungen in der Niederschlagsmenge sind somit plausible Instrumente für endogene Variablen, die Veränderungen im Bruttoinlandsprodukt messen.
Anhand von Länder-Paneldaten mit Informationen über wirtschaftliche Indikatoren, Konfliktereignisse und Niederschläge, isolieren Miguel, Satyanath, und Sergenti (2004) in einem IV-Ansatz die exogene Variation der wirtschaftlichen Entwicklung, d.h. Variation in \(\Delta\text{BIP}\) die nicht mit dem Fehlerterm in der Konfliktgleichung korreliert ist. Die Ergebnisse ihrer 2SLS-Schätzungen zeigen, dass negative ökonomische Schocks die Wahrscheinlichkeit eines Bürgerkriegs signifikant erhöhen. Miguel, Satyanath, und Sergenti (2004) zeigen weiterhin, dass ihre Ergebnisse robust gegenüber verschiedenen Modell-Spezifikationen unter Berücksichtigung diverser Kontrollvariablen sind.
Wir reproduzieren nachfolgend die zentralen Ergebnisse von Miguel, Satyanath, und Sergenti (2004) anhand eines Auszugs (rainconflict.csv
) aus dem der Studie zugrundeliegenden Datensatz. Der vollständige Datensatz ist, nach Registrierung, hier verfügbar.
Variable | Beschreibung |
---|---|
any_prior | Dummyvariable: Konflikt mit mind. 25 Toten im Jahr t |
war_prio | Dummyvariable: Konflikt mit mind. 1000 Toten im Jahr t |
ccode | Länderkennung (numerisch) |
country | Name des Landes |
gdp_g | (BIP_t - BIP_t-1) / BIP_t-1 |
gdp_g_l | (BIP_t-1 - BIP_t-2) / BIP_t-2 |
GPCP_g | (Niederschlag_t - Niederschlag_t-1) / Niederschlag_t-1 |
GPCP_g_l | GPCP_g in t-1 |
GPCP_g_fl | GPCP_g in t+1 |
gdp_1979 | Log Pro-Kopf-BIP in 1979 |
polity2_IV | Diff. zw. Demokratie- und Autokrarie-Score im Jahr t (Skala v. -10 bis 10) |
polity2l | polity2_IV im Jahr t-1 (Skala v. -10 bis 10) |
ethfrac | Ethno-linguistische Fragmentierung (Anteil) |
relfrac | Religiöse Fragmentierung (Anteil) |
oil | Dummy für Öl-exportierendes Land |
lmtnest | Log Anteil Gebirgsregionen an Landesfläche |
lpopl1 | Log Bevölkerung im Jahr t-1 |
tot_100_g | Handelsbedingungen (Index, 1995 = 100) |
year | Jahr der Beobachtung |
rainconflict
– Polit-ökonomische Charakteristika afrikanischer Länder v. 1981 bis 1999
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
Rows: 743 Columns: 19
── Column specification ────────────────────────────────────────────────────────
Delimiter: ";"
chr (1): country
dbl (18): any_prio, war_prio, ccode, gdp_g, gdp_g_l, GPCP_g, GPCP_g_l, GPCP_...
ℹ Use `spec()` to retrieve the full column specification for this data.
ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Mit dem Paket marginaleffects
können wir durchschnittliche marginale Einflüsse von Regressoren in einem nicht-linearen Modell (hier ein Probit-Modell) berechnen. Für ein Probit-Modell lässt sich der marginale Effekt eines Regressors \(X_j\) auf die Wahrscheinlichkeit, dass das Ereignis eintritt, wie folgt darstellen:
Die Wahrscheinlichkeitsfunktion des Probit-Modells ist definiert als \[\begin{align*} P(Y = 1 | \boldsymbol{x}) = \Phi(\boldsymbol{x}'\boldsymbol\beta), \end{align*}\] wobei \(\Phi\) die kumulative Verteilungsfunktion der Standardnormalverteilung ist, \(\boldsymbol{x}\) der Vektor der Regressoren und \(\boldsymbol{\beta}\) der Vektor der Koeffizienten.
Der marginale Effekt für den Regressor \(j\) ist dann die Ableitung von \(P(Y = 1 | \boldsymbol{x})\) bezüglich \(x_j\), \[\begin{align*} \frac{\partial P(Y = 1 | \boldsymbol{x})}{\partial x_j} = \phi(\boldsymbol{x}'\boldsymbol{\beta}) \cdot \beta_j, \end{align*}\] siehe auch Kapitel 4.2.2. Hierbei ist \(\phi(\cdot)\) die Dichtefunktion der Standardnormalverteilung und \(\beta_j\) der Koeffizient des Regressors \(x_j\).
Die Funktion marginaleffects::avg_slopes()
berechnet diesen Effekt anhand der geschätzten Koeffizienten \(\widehat{\boldsymbol{\beta}}\) für jede Beobachtung \(i=1,\dots,N\) und bestimmt den durchschnittlichen Effekt als das arithmetische Mittel über alle marginalen Effekte: \[\begin{align*}
\textup{Average Marginal Effect}(j) = \frac{1}{N} \sum_{i=1}^{N} \phi(\boldsymbol{x}_i' \widehat{\boldsymbol{\beta}}) \cdot \widehat\beta_j,
\end{align*}\]
wobei \(N\) die Anzahl der Beobachtungen ist und \(\boldsymbol{x}_i\) den Wert von \(\boldsymbol{x}\) für die \(i\)-te Beobachtung darstellt.
# Marginale Effekte berechnen
library(marginaleffects)
Warning: package 'marginaleffects' was built under R version 4.3.3
avg_slopes(mod_conf_probit)
Term Contrast Estimate Std. Error z Pr(>|z|) S 2.5 %
ethfrac mean(dY/dX) 0.220343 0.24242 0.909 0.3634 1.5 -0.25478
gdp_1979 mean(dY/dX) -0.062757 0.05833 -1.076 0.2820 1.8 -0.17709
gdp_g mean(dY/dX) -0.350169 0.30060 -1.165 0.2441 2.0 -0.93933
gdp_g_l mean(dY/dX) -0.127305 0.25061 -0.508 0.6115 0.7 -0.61849
lmtnest mean(dY/dX) 0.072189 0.03610 2.000 0.0455 4.5 0.00144
lpopl1 mean(dY/dX) 0.074428 0.04864 1.530 0.1260 3.0 -0.02091
oil mean(1) - mean(0) 0.015333 0.21000 0.073 0.9418 0.1 -0.39626
polity2l mean(dY/dX) 0.000686 0.00497 0.138 0.8902 0.2 -0.00906
relfrac mean(dY/dX) -0.270844 0.24133 -1.122 0.2617 1.9 -0.74384
year mean(dY/dX) 0.002769 0.00646 0.428 0.6684 0.6 -0.00990
97.5 %
0.6955
0.0516
0.2390
0.3639
0.1429
0.1698
0.4269
0.0104
0.2022
0.0154
Type: response
Columns: term, contrast, estimate, std.error, statistic, p.value, s.value, conf.low, conf.high, predicted_lo, predicted_hi, predicted