7  Panel-Daten

Hinweis

Für eine optimale technische Stabilität empfehlen wir, dieses Online-Lehrbuch auf einem Notebook oder Desktop-Computer zu nutzen. Die interaktiven Komponente, insbesondere die R-Konsole (WebR), sind rechenintensiv und funktionieren auf mobilen Geräten nur eingeschränkt.

Das Ziel dieses Kapitels ist es, ein Verständnis der Vor- und Nachteile von Panel-Daten-Modellen für die Schätzung kausaler Effekte mit R zu vermitteln. Durch die zusätzliche zeitliche Dimension \(T > 1\) in Panel-Daten eröffnen sich erweiterte Möglichkeiten der Identifikation und Modellierung: Die Verfügbarkeit mehrerer Beobachtungen pro Beobachtungseinheit über die Zeit ermöglicht es, für unbeobachtbare Heterogenitäten zu korrigieren. So kann die Schätzung kausaler Effekte unter weniger restriktiven Annahmen erfolgen als bei Querschnittsdaten (\(T = 1\)), wo wir annehmen, dass Kontrollieren für eine Menge beobachtbarer Kontrollvariablen ausreichend ist, um Confounding zu vermeiden.

Darüber hinaus ermöglichen Panel-Ansätze oft eine präzisere statistische Inferenz im Vergleich zu Verfahren für Querschnittsdaten, da die zusätzliche Information in der Zeitdimension die Varianz der Schätzung verringert. Verschiedene Identifikationsstrategien wie Differenz-in-Differenzen (Kapitel 9) oder Regressionsansätze mit Instrumentvariablen (Kapitel 8), machen sich diese zusätzliche Informationen zunutze.

7.1 Pooled Regression und unbeobachtbare Heterogenität

Ein Panel-Datensatz enthält Beobachtungen zu \(n\) Einheiten für (bis zu) \(T\) Zeitpunkte \(t=1,\dots,T\). Betrachte das Panel-Modell

\[\begin{align} Y_{it} = \beta_0 + \beta_1 B_{it} + \beta_2 X_i + \beta_3 U_i + \epsilon_{it},\label{eq:unobshetmodel} \end{align}\]

wobei \(U_i\) unbeobachtete und \(X_i\) beobachtete, zeitlich-invariante Heterogenitäten zwischen den Beobachtungseinheiten \(i=1,\dots,n\) sind. Wie zuvor ist \(B_{it}\) die Behandlungsvariable und \(\beta_1\) der interessierende kausale Effekt einer Veränderung von \(B_{it}\) auf \(Y_{it}\).

Angenommen wir beobachten \(Y_{it}\) und \(B_{it}\) für \(T=1\), also für eine Periode. Bei Korrelation zwischen den unbeobachtbaren zeit-invarianten Effekten \(U_i\) und der Behandlungsvariable \(B_{it}\) kann der kausale Effekt \(\beta_1\) nicht identifiziert werden. Diese Situation ist in Abbildung 7.1 dargestellt.

FE_dag_single_period U UiX XiU->X B Bt=1U->B Y Yt=1U->Y X->B X->Y B->Y
Abbildung 7.1: Backdoors durch beobachtete und unbeobachtete Variablen

Abbildung 7.1 zeigt Backdoors durch die \(U_i\), die wir mit einer “naiven” KQ-Schätzung der fehlspezifizierten Regression \[\begin{align} Y_{it} = \beta_0 + \beta_1 B_{it} + \beta_2 X_i + \varepsilon_{it},\quad t=1,\label{eq:femodelfail} \end{align}\] mit \(\varepsilon_{it} = U_i + \epsilon_{it}\) nicht schließen können.1

1 Wegen \(E(\varepsilon_{it}\vert B_{it})\neq 0\) ist der KQ-Schätzer von \(\beta_1\) nicht erwartungstreu und inkonsistent.

Wir betrachten nun eine Generalisierung des DGP in Abbildung 7.1 für \(T=2\) Perioden, dargestellt in Abbildung 7.2.

FE_dag2 U UiX XiU->X B1 Bt=1U->B1 Y1 Yt=1U->Y1 B2 Bt=2U->B2 Y2 Yt=2U->Y2 X->B1 X->Y1 X->B2 X->Y2 B1->Y1 B1->B2 B2->Y2
Abbildung 7.2: Panel-Design mit Backdoors durch beobachtete und unbeobachtete zeit-invariante Variablen

Der in Abbildung 7.2 gezeigte Zusammenhang führt (idealerweise) zwar zu einer Verdoppelung des Beobachtungsumfangs, jedoch besteht weiterhin das in Abbildung 7.1 gezeigte Endogenitätsproblem, falls die Regression \(\eqref{eq:femodelfail}\) nun anhand einer Zusammenlegung (Pooling) aller Beobachtungen für \(t\in\{1,2\}\) geschätzt wird:2 Die unbeobachteten zeit-invarianten Einflüsse \(U_i\) verursachen auch für Periode \(t=2\) Backdoor-Pfade.

2 Pooled Regression kann auch berechnet werden, wenn nicht für alle \(n\) Einheiten jeweils \(T\) Beobachtungen vorliegen (unbalanced Panel).

3 Der (R code für den) DGP ist diesem StackExchange-Post entnommen.

In diesem Kapitel betrachten wir Panel-Verfahren, welche den kausalen Effekt in Abbildung 7.2 und Verallgemeinerungen hiervon schätzen können. Bevor wir diese Methoden betrachten, veranschaulichen wir die verzerrte Schätzung eines Behandlungseffekts mit Pooled Regression in Modell \(\eqref{eq:femodelfail}\) bei unbeobachtbaren Heterogenitäten für einen simulierten Datensatz paneldata.csv. Der Datensatz enthält Beobachtungen von \(n=12\) Einheiten zu \(T=8\) Perioden. Alle Einheiten weisen unbeobachtbare zeit-invariante Heterogenitäten auf, die mit \(B_{it}\) korrelieren. Der wahre Behandlungseffekt beträgt \(\beta_1 = -1\).3

Wir lesen zunächst den Datensatz ein und selektieren die benötigten Variablen.

Mit der Funktion plm::is.pbalanced() überprüfen wir, ob im Panel-Datensatz für alle beobachteten Einheiten die gleiche Anzahl an Beobachtungsperioden vorliegt (balanced panel).4

4 Fehlende Beobachtungen sind typischerweise mit einem NA-Wert gekennzeichnet. Der Differenz-Schätzer kann auch berechnet werden, wenn der Datensatz nicht ausgeglichen (unbalanced) ist.

Zunächst schätzen wir eine Pooled Regression für die ersten beiden Zeitperioden, basierend auf einem entsprechend gefilterten Datensatz.5

5 Wir verweisen nachfolgend explizit auf Funktionen aus dplyr, falls Funktionen aus plm identische Namen haben.

Für die Schätzung von Modell \(\eqref{eq:femodelfail}\) nutzen wir fixest::feols().

Die Schätzung von \(\beta_1\) ist 3.81 und weist auf eine deutliche Verzerrung hin. Wir illustrieren diese Problematik in der nächsten Abbildung, in dem wir die für die Regression verwendeten Daten (Kreise) sowie die Beobachtungen späterer Perioden (Kreuze) nach Gruppenzugehörigkeit einfärben und die Schätzung der Pooled Regression abtragen.

Die obige Grafik zeigt einen negativen Verlauf des Zusammenhangs zwischen X und Y anhand der Variation der Beobachtungen innerhalb der farblich gekennzeichneten Gruppen. Dieser negative Zusammenhang kann aufgrund der Endogenität von \(X\) nicht erfasst werden.

Eine Erweiterung der Regression auf sämtliche Perioden (Pooling aller \(n\times T = 12 \times 8 = 96\) Beobachtungen) erhöht lediglich die Präzision der Schätzung (geringerer Standardfehler von \(\widehat{\beta}_1\)), nicht aber die Endogenität.

7.2 Regression in Differenzen

Wir betrachten erneut den in Abbildung 7.2 dargestellten DGP für \(T=2\) Zeitperioden. In dieser Situation können Backdoors durch die \(U_i\) anhand einer simplen Transformation von Modell \(\eqref{eq:femodel}\) geschlossen werden: Regression der Zeit-Differenzen zwischen den Perioden \(t=2\) und \(t=1\), \[\begin{align} \begin{split} \Delta Y_{it} = \beta_1 \Delta B_{it} + e_{it}, \qquad i=&\,1,\dots,n,\\ t=&\,1,2 \end{split} \label{eq:femodeldiff} \end{align}\] wobei \(\Delta Y_{it} := Y_{i2} - Y_{i1}\) und \(\Delta e_{it} := \epsilon_{i2} - \epsilon_{i1}\) für \(t=2\). Beachte, dass \(\Delta U_i=\Delta X_i=0\). Differenzieren der Komponenten führt zu einem Modell, in dem weder für (beobachtbare) \(X_i\) noch für (unbeobachtbare) \(U_i\) kontrolliert werden muss, damit \(\beta_1\) identifiziert werden kann.6 Der Behandlungseffekt \(\beta_1\) kann mit KQ geschätzt werden.7

6 Ein Nachteil der Differenzbildung ist also, dass wir die Koeffizienten der beobachtbaren, zeitlich konstanten Regressoren nicht schätzen können.

7 Der Differenzen-Schätzer ist erwartungstreu und konsistent, wenn \(E(\epsilon_{is}\vert B_{it})=0\) für \(s\geq t\).

Zur Transformation der Regressoren in fixest::feols() verwenden wir den Operator d(). Dieser benötigt die im Argument panel.id als Formel spezifizierten Identifikationsvariablen für Einheiten (ID) und Zeitpunkte (time).

Die Schätzung anhand der Regression in Differenzen liegt nahe beim wahren Behandlungseffekt \(\beta_1 = -1\). In der nächsten Grafik plotten wir die ersten Differenzen der Daten und den mit KQ geschätzten Zusammenhang.

Wie bei Pooling können wir den Differenzen-Schätzer für den gesamten Datensatz berechnen.

Beachte, dass der Standardfehler der Schätzers etwas größer ist als für den KQ-Schätzer in der Pooled Regression. Gründe hierfür sind der Verlust von \(12\) Beobachtungen bei der Bildung der \(T-1 = 7\) Differenzen und die standardmäßige Berechnung von cluster-robusten Standardfehlern durch feols(), siehe auch Kapitel 7.5.

7.3 Fixed-Effects-Regression

Die KQ-Schätzung der Regression in Differenzen hat den Nachteil, dass die Koeffizienten von einheiten-spezifischen Variablen nicht geschätzt werden können. Weiterhin impliziert die Differenzbildung einen Verlust des Beobachtungsumfangs bei der Schätzung des kausalen Effekts.8 Für den Datensatz paneldata.csv verlieren wir \(1/8\) der Stichprobe. Abhängig von der empirischen Fragestellung und der Datenverfügbarkeit (Verhältnis von \(T\) und \(n\)) kann Fixed-Effects-Regression eine nützliche Alternative zu Regression in Differenzen sein.

8 Eine Reduktion des Beobachtungsumfangs erhöht die Varianz der Schätzung. Für \(T=2\) ist der Differenzen-Schätzer äquivalent zu den Schätzern im Fixed-Effects-Modell, ist jedoch ineffizient für \(T>2\).

9 Beachte, dass eine bessere Anpassung an die Daten bei der Modellierung von paneldata.csv mit einheiten-spezifischen Achsenabschnitten anhand der Grafik für die gepoolte Regression plausibel scheint.

Wir betrachten erneut Modell \(\eqref{eq:unobshetmodel}\) und definieren \[\begin{align*} \alpha_i = \beta_0 + \beta_3 U_i. \end{align*}\] Nach einsetzen in \(\eqref{eq:unobshetmodel}\) erhalten wir das Modell \[\begin{align} Y_{it} = \alpha_i + \beta_1 B_{it} + \beta_2 X_i + \epsilon_{it} \label{eq:femodel}, \end{align}\] mit einheiten-spezifischen Konstanten (“fixe Effekte”) \(\alpha_i\) für \(i=1,\dots,n\), die als individuelle Achsenabschnitte interpretieren werden können. Das Modell \(\eqref{eq:femodel}\) wird daher auch als Fixed-Effects-Modell bezeichnet.9

7.3.1 Within- und LSDV-Schätzer

Für die Vermeidung von Backdoors durch die \(\alpha_i\) subtrahieren wir die einheiten-spezifischen Mittelwerte von den Komponenten (Within-Transformation)10, \[\begin{align} Y_{it} - \overline{Y}_i =&\, (\alpha_i - \overline{\alpha}_i) + \beta_1 (B_{it} - \overline{B}_i) + \beta_2 (X_i - \overline{X}_i) + (\epsilon_{it} - \overline{\epsilon}_i)\notag\\ \tilde Y_{it} =&\, \beta_1 \tilde B_{it} + \tilde\epsilon_{it}.\label{eq:fewithin} \end{align}\] Der Within-Schätzer von \(\beta_1\) ist der KQ-Schätzer in \(\eqref{eq:fewithin}\). Dieser Schätzer nutzt die Variabilität innerhalb der Beobachtungseinheiten über die Zeit, um die Koeffizienten der unabhängigen Variablen zu schätzen. Ähnlich wie für den Differenzen-Schätzer eliminieren die Mittelwert-Differenzen \(\alpha_i - \overline{\alpha}_i=0\) und \(X_i - \overline{X}_i=0\) den Einfluss zeit-invarianter Variablen.

10 Die Durchschnitte werden hierbei also über die Zeitperioden berechnet.

11 Für \(n-1\) Einheiten ist der individuelle Achsenabschnitt damit \(\beta_0 + \gamma_i\) und für eine Einheit \(\beta_0\). Diese Einheit (hier \(i=1\)) wird auch als Referenzkategorie bezeichnet. Alternativ kann das Modell mit \(n\) Dummies und ohne die Konstante \(\beta_0\) geschrieben werden.

12 KQ ist hier erwartungstreu und konsistent, sofern \(E(\epsilon_{is}\vert B_{it})=0\) für alle \(s\) und \(t\).

Das Modell \(\eqref{eq:femodel}\) kann weiterhin als eine Regression mit \(n-1\) Dummy-Variablen und einer Konstante geschrieben werden, \[\begin{align} Y_{it} = \beta_0 + \beta_2 B_{it} + \beta_2 X_i + \gamma_2 D^{(2)}_i + \gamma_3 D^{(3)}_i + \cdots + \gamma_n D^{(n)}_i + \epsilon_{it} \label{eq:drmodel}. \end{align}\] Die Darstellung \(\eqref{eq:drmodel}\) hat \(n\) verschiedene Achsenabschnitte – einen für jede Beobachtungseinheit – und kann ebenfalls mit KQ geschätzt werden.11 Der KQ-Schätzer ergibt für die Modelle \(\eqref{eq:femodel}\) und \(\eqref{eq:drmodel}\) numerisch äquivalente Schätzungen von \(\beta_1\), wenn \(X_i\) in der Dummy-Regression ausgelassen wird.12 Die Schätzung von \(\eqref{eq:drmodel}\) mit KQ wird in der Literatur auch als Least Squares Dummy Variables (LSDV) Regression bezeichnet.

Beachte, dass die Schätzung der Koeffizienten beobachtbarer zeitlich konstanter Regressoren wie \(X_{i}\) lediglich in Modell \(\eqref{eq:drmodel}\) möglich ist.

Fixed-Effects-Regressionen können mit fixest::feols() geschätzt werden.13 Je nach Spezifikation des Formula-Arguments (fml) wird ein effizienter Algorithmus für die entsprechende Transformation von \(\eqref{eq:femodel}\) angwandt. Für paneldata.csv erhalten wir mit fml = Y ~ X | ID per Referenz des Indikators ID eine Variante des Within-Schätzers.

13 Eine Alternative ist plm::plm() mit dem Argument method = "within".

Die Zusammenfassung der Schätzung zeigt einen signifikanten Koeffizienten, der mit einer Schätzung von \(-1.05\) nahe beim wahren Wert von \(\beta_1 = -1\) liegt. Die geschätzten einheiten-spezifischen Effekte können mit fixest::fixef() ausgelesen werden.

Mit fml = Y ~ X + factor(ID) erfolgt eine Schätzung der Dummy-Regression \(\eqref{eq:drmodel}\) mit \(n-1=11\) Dummies. Der Referenzeinheit ist ID == 1. Wir sehen, dass der geschätzte Koeffizient von \(X\) mit dem Ergebnis des Within-Schätzers übereinstimmt.

7.3.2 Zeit-Fixed-Effects

Neben zeit-invarianten Heterogenitäten zwischen den Beobachtungseinheiten können beobachtbare und unbeobachtbare Einflüsse vorliegen, die nicht zwischen den Einheiten, jedoch über die Zeit variieren. Ein DGP mit solchen zeitabhängigen Heterogenitäten ist in Abbildung 7.3 für \(T=2\) dargestellt.14

14 Zur Vereinfachung der Interpretierbarkeit vernachlässigt das DAG in Abbildung 7.3 zeitlich konstante Variablen.

FE_dag3 U1 Ut=1U2 Ut=2U1->U2 X1 Xt=1U1->X1 B1 Bt=1U1->B1 Y1 Yt=1U1->Y1 X2 Xt=2U2->X2 B2 Bt=2U2->B2 Y2 Yt=2U2->Y2 X1->X2 X1->B1 X1->Y1 X2->B2 X2->Y2 B1->Y1 B1->B2 B2->Y2
Abbildung 7.3: Panel-Design mit Backdoors durch beobachtete und unbeobachtete zeitabhängige Variablen

Für beobachtbare zeitabhängige Backdoor-Variablen \(X_t\) kann durch Aufnahme dieser in die Regression \(\eqref{eq:femodel}\) kontrolliert werden. Analog zum Fixed-Effects-Ansatz mit einheiten-spezifischen Konstanten können Backdoors durch unbeobachtbare zeitabhängige Einflüsse \(U_t\) durch Kontrolle für perioden-spezifische Dummies \(D_t^{(t)}\) (Time Fixed Effects) vermieden werden. Das Modell lautet dann

\[\begin{align*} Y_{it} = \beta_0 + \beta_1 B_{it} + \beta_2 X_t + \lambda_2 D_t^{(2)} + \cdots + \lambda_T D_t^{(T)} + \epsilon_{it}. \end{align*}\]

In empirischen Anwendung ist es häufig plausibel, für zeit- und einheiten-spezifische Effekte zu kontrollieren. Der entsprechende Regressionsansatz wird als Two Way Fixed Effects (TWFE) bezeichnet.

Ein TWFE-Modell für paneldata.csv kann mit feols() leicht unter Angabe der Identifikationsvariable für die Zeitperioden (time) innerhalb des fml-Arguments geschätzt werden.

Key Facts zu Fixed-Effects-Regression
  • Ein Fixed-Effects-Designs betrachten unbeobachtete, mit den erklärenden Variablen korrelierte Heterogenitäten als konstante parameter. Korrigieren für diese Heterogenitäten ist Voraussetzung für eine verzerrungsfreie Schätzung kausaler Effekte.

  • Fixed-Effects-Schätzer schließen Backdoors aufgrund von Heterogenitäten zwischen Beobachtungseinheiten die über die Zeit konstant sind (einheiten-spezifische Effekte) und/oder für Heterogenitäten, die identisch für die Beobachtungseinheiten sind, jedoch über die Zeit variieren (Zeit-Effekte):

    • KQ nach der Within-Transformation (Within-Schätzer) ist erwartungstreu und konsistent, solange die erklärenden Variablen zeitlich unkorreliert mit den Fehlertermen sind.

    • LSDV-Regression ist eine Variante die Backdoors durch unbeobachtbare Heterogenitäten mit Dummy-Variablen schließt. In einer LSDV-Regression können die Koeffizienten zeitlich konstanter Variablen geschätzt werden.

  • Statistische Inferenz für Fixed-Effects-Schätzer erfolgt anhand einer Approximation der asymptotischen Normalverteilung. Da die Fehlerterme heteroskedastisch und/oder über die Zeit korreliert sein können, sollten cluster-robuste Standardfehler verwendet werden, vgl. Kapitel 7.5.

  • Fixed-Effects-Modelle können in R mit dem Paketen fixest oder plm berechnet werden.

7.4 Random Effects

Der Fixed-Effects-Ansatz behandelt die einheiten-spezifischen Effekte \(\alpha_i\) in Modell \(\eqref{eq:femodel}\) als konstante Parameter, für die korrigiert oder kontrolliert werden muss. Der Random-Effects-Ansatz betrachtet die \(\alpha_i\) als Zufallsvariablen mit einer identischen Verteilung, unter der Annahme, dass die \(\alpha_i\) nicht mit den erklärenden Variablen korrelieren.15 Falls diese Annahmen erfüllt sind, ist der Random-Random-Effects-Schätzer effizienter als der Fixed-Effects-Schätzer: Der mittlere quadratische Fehler der Schätzung ist geringer.16

15 Erwartungstreue und Konsistenz und Effizienz erfordern \(E(\alpha_i\vert B_{it})=0\) und \(E(\epsilon_{it}\vert\alpha_i,B_{it})=0\).

16 Die Schätzung erfolgt meist mit der Generalized Least Squares (GLS) oder mit Maximum-Likelihood (ML).

Das einfache Random-Effects-Modell notieren wir als \[\begin{align*} Y_{it} =&\, \beta_0 + \beta_1 B_{it} + \varepsilon_{it}, \end{align*}\] wobei sich der Fehlerterm \(\varepsilon_{it}\) aus dem zufälligen individuellen Effekt \(\alpha_i\) und dem unabhängigen Fehler \(\epsilon_{it}\) zusammensetzt, \[\begin{align*} \varepsilon_{it} = \alpha_i + \epsilon_{it}. \end{align*}\]

Für ein Beispiel simulieren wir Daten gemäß der Vorschrift \[\begin{align} Y_{it} = \alpha_i + \beta B_{it} + \epsilon_{it}\label{eq:resim} \end{align}\] und wählen \[\begin{align*} & \alpha_i \overset{u.i.v}{\sim} N(0,2.5^2), \\ & \beta_1 = -1,\\ & B_{it} \sim N(0,1),\\ & \epsilon_{it} \overset{u.i.v}{\sim} N(0,0.75^2). \end{align*}\] Wie in paneldata.csv erzeugen wir Daten für \(n=12\) Individuen, die zu \(T=8\) Zeitperioden beobachtet werden. Mit diesen Komponenten wird die Outcome-Variable \(Y_{it}\) wie in \(\eqref{eq:resim}\) generiert. Der nachstehende Code erzeugt die Daten als Matrizen B und Y, die anschließend in ein langes Datenformat (tibble) umgewandelt werden.

Für die Anpassung des Random-Effect-Schätzers an den simulierten Datensatz RE_paneldata nutzen wir plm::plm() mit model = "random". Mit effect = "individual" legen wir einheiten-spezifische Random Effects fest.17

17 Analog zu Fixed-Effects-Modellen können mit effect = "twoway" einheiten- und zeit-spezifische zufällige Effekte modelliert werden.

Die Schätzung zeigt eine gute Anpassung an die Daten und der geschätzte Behandlungseffekt liegt mit \(-0.996\) nahe am wahren Koeffizienten \(\beta_1 = -1\).

Mit plm::ranef() erhalten wir Differenzen der geschätzten einheiten-spezifischen Effekte vom geschätzten Erwartungswert (Intercept).

Für die grafische Darstellung der Schätzung berechnen wir zunächst mit fitted() die angepassten Werte. Für ein mit plm() geschätztes Random-Effects-Modell werden die individuellen Effekte von fitted() nicht berücksichtigt und müssen daher manuell hinzugefügt werden. Hierfür lesen wir zunächst den geschätzten Erwartungswert der gemeinsamen Verteilung \(\widehat{\beta}_0\) aus und addieren anschließend die von ranef() ausgegebenen Differenzen der individuellen Effekte gruppenweise.

7.4.1 Verzerrung bei Endogenität

Die Random-Effects-Methode findet bei kausalen Analyse in empirischen Anwendungen selten Anwendung, weil die Annahme von Unkorreliertheit mit den erklärenden Regressoren oft unplausibel ist. Falls diese Annahme (wie in den DAGs Abbildung 7.1 und Abbildung 7.2) verletzt ist, kann Random Effects die ensprechenden Backdoors nicht schließen: Der Random-Effects-Schätzer ist dann verzerrt und inkonsistent, ähnlich wie der naive KQ-Schätzer in einer Pooled Regression. Im nächsten Abschnitt untersuchen wir Konsequenzen dieser Eigenschaft anhand simulierter Daten.

Zur Illustration der Verzerrung des Random-Effects-Schätzers bei Endogenität von erklärenden Variablen verwenden wir erneut den anhand eines Fixed-Effects-DGPs simulierten Datensatz paneldata.csv.

Offenbar weicht der Random-Effects-Schätzer des Effects von \(X\) auf \(Y\) deutlich vom wahren Parameter \(\beta_1 = -1\) ab. Diese Abweichung ist auf die Endogenität von \(X\) zurückzuführen.

Die nächste Grafik vergleicht die Schätzungen des Behandlungseffekts für den Datensatz paneldata.csv mit Pooling (schwarze Linie), Fixed Effects (farbige Linien) und Random Effects (gestrichelte schwarze Linie). Vorab erweitern wir paneldata um die angepassten Werte für die Fixed- und die Random-Effects-Schätzung in panel_FE und panel_RE.18

18 Für bessere Lesbarkeit erzeugen wir hier mit predict() eine Regressionsgerade, deren Achsenabschnitt dem geschätzten Erwartungswert der Random-Effects-Verteilung entspricht.

Key Facts zu Random-Effects-Regression
  • Random-Effects-Ansätze basieren auf der Annahme, dass (unbeobachtbare) Heterogenitäten zufällig sind. Wir nehmen an, dass die unbeobachteten Heterogenitäten nicht mit den erklärenden Variablen korreliert sind. Letzteres führt zu inkonsistenten Schätzern!

  • Iteratives GLS oder MLE ermöglichen eine effizientere Schätzung des Random-Effects-Modells als Pooling oder Fixed-Effects-Schätzer, da sowohl die Variation innerhalb als auch zwischen den Beoabchtungseinheiten Einheiten genutzt wird.

  • In Random-Effects-Modellen können die Effekte zeitlich konstanter Variablen geschätzt werden, da die einheiten-spezifischen Effekte als zufällig betrachtet werden.

  • Unter den skizzierten Annahmen sind Random-Effects-Schätzer asymptotisch normalverteilt. Für Inferenz-Statistiken sollten cluster-robuste Standardfehler verwendet werden, vgl. Kapitel 7.5.

  • Random-Effects-Modelle können in R mit den Paketen plm geschätzt werden.


Interaktive Illustration von Panel-Schätzern

Die nachfolgende interaktive Illustration erlaubt einen Vergleich der bisher geschätzten und geplotteten Regressionsfunktionen für paneldata.csv mit dem wahren DGP (Show truth).

Linking to librsvg 2.56.3

7.5 Cluster-robuste Standardfehler

Aufgrund der Zeit-Dimension bei Panel-Datensätzen ist es in vielen empirischen Anwendungen plausibel, dass die Fehlerterme der bisher betrachteten Modelle nicht unabhängig sind: Beobachtungen einer Einheit (auch Cluster genannt), wie z.B. Individuen, Firmen oder geografische Regionen sind oftmals über die Zeit oft korreliert. Solche Abhängigkeit zwischen dem Fehlern führen zu verzerrten Standardfehlern, wenn diese anhand von Formeln berechnet werden, die unter der Annahme von u.i.v. Fehlertermen hergeleitet wurden: Standardfehler für Schätzer, die u.i.v. Fehler annehmen, können die tatsächliche Varianz unterschätzen, was zu falsch-positiven19 Ergebnissen bei Signifikanztests für die Modell-Koeffizienten und damit zu ungültiger Inferenz hinsichtlich kausaler Effekte führen kann.

19 Ein falsch-positiver Test zeigt einen “positiven” Zustand (hier ein von null verschiedener Koeffizient) an, obwohl dieser tatsächlich nicht vorliegt.

Sogenannte cluster-robuste Standardfehler korrigieren für zeitliche Korrelation und Heteroskedastizität und ermöglichen konservative Schätzungen hinsichtlich der Variabilität von Koeffizientenschätzern. fixest::feols() berechnet standardmäßig cluster-robuste Standardfehler, wenn Einheiten- oder Perioden-Variablen innerhalb der Formel (bspw. Y ~ X | ID + time) oder separat im Argument index (etwa panel.id = ~ ID + time) angegeben werden. Für die Identifikation der Cluster wird stets die zuerst genannte Variable (hier ID) herangezogen. Details der zu verwendenen Standardfehler können über das Argument vcov festgelegt werden, siehe ?feols für weitere Hinweise hierzu.

Für den LSDV-Schätzer in Kapitel 7.3.1 erreichen wir clustering nach ID mit vcov = ~ ID.

Beachte, dass die Standradfehler der meisten Koeffizienten in panel_LSDV_clust etwas größer sind, als für das in Kapitel 7.3.1 geschätzte Modell panel_LSDV.

Für Schätzungen mitplm::plm() werden von summary() grundsätzlich Standardfehler unter Annahme homoskedastischer u.i.v. Fehler berechnet. Für cluster-robuste Standardfehler muss ein entsprechender Schätzer im Argument vcov = vcovHC() übergeben werden. Mit cluster = "group" wird Korrelation innerhalb der Beobachtungseinheiten über die Zeit berücksichtigt.20 Für die Random-Effects-Schätzung in panel_RE erreichen wir dies wiefolgt.

20 Clustering für Zeitperioden erfolgt mit group = time.

7.6 Dynamische Modelle

Viele ökonomische und soziale Prozesse sind autoregressiv: Der Zustand einer Variable in der Vergangenheit beeinflusst ihren aktuellen Zustand. Bei der Modellierung von Outcome-Variablen in Panel-Designs kann es notwendig sein, diese Abhängigkeit zu berücksichtigen, um die Identifizierbarkeit kausaler Effekte zu gewährleisten. Dynamische Panelmodelle verwenden hierzu vergangene Werte (lags) der Outcome-Variable, \(Y_{it-j}\) mit \(j>0\) als (zusätzliche) Regressoren. Ein einfaches dynamisches Panelmodell ist \[\begin{align} Y_{it} = \rho Y_{it-1} + \beta_1 B_{it} + \epsilon_{it}, \label{eq:dynpanel} \end{align}\] wobei \(Y_{it-1}\) der Wert von \(Y_{it}\) in der Periode \(t-1\) ist, \(0\neq\lvert\rho\rvert<1\), und \(\epsilon_{i,t}\) ein u.i.v. Fehlerterm ist. In diesem Modell ist \(Y_{it-1}\) kausal für \(Y_{it}\).

Die Verwendung dynamischer Modelle hat folgende Motivationen:

  • Präzisere Schätzung: Berücksichtigen von gelaggten abhängigen Variablen ermöglicht die Modellierung einer zeitabhängigen Dynamik von \(Y_{it}\). Die Autokorrelation und damit die Varianz der Fehlerterme kann reduziert werden, da ein Teil dieser zeitlichen Abhängigkeiten direkt modelliert wird. Dies kann die Präzision der Schätzung des kausalen Effekts \(\beta_1\) verbessern, vgl. Abbildung 7.4.
LDVOK2 Bt BtYt YtBt->Yt Ytm1 Yt-1Ytm1->Yt
Abbildung 7.4: Kontrolle für vergangenen Wert verbessert Präzision
  • Vermeidung von Endogenität: Nichtberücksichtigen von relevanten gelaggten abhängigen Variablen führt zu verzerrten und inkonsistenten Schätzern, vgl. Abbildung 7.5.
LDVOK1 Bt BtYt YtBt->Yt V VV->Bt Ytm1 Yt-1V->Ytm1 Ytm1->Yt
Abbildung 7.5: Kontrolle für \(y_{t-1}\) schließt Backdoor-Pfad

Die Entscheidung, ob Lags der Outcome-Variable als Regressoren aufgenommen werden, sollte sorgfältig und, falls möglich, unter Berücksichtigung von ökonomischer Theorie hinsichtlich der zeitlichen Dynamik von \(Y_{it}\) erfolgen. Beobachtete (Auto)Korrelation von \(Y_{it}\) und \(Y_{it-1}\) muss nicht ausschließlich durch einen (kausalen) autoregressiven Zusammenhang verursacht werden. Ein DGP bei dem unsere Regression nicht für \(Y_{it-1}\) kontrollieren sollte, ist in Abbildung 7.6 gezeigt.

LDVnotOK Bt BtYt YtBt->Yt V VV->Bt Ytm1 Yt-1V->Ytm1 U UU->Yt U->Ytm1
Abbildung 7.6: Kontrolle für \(y_{t-1}\) öffnet Backdoor-Pfad

Hier ist \(Y_{it-1}\) nicht kausal für \(Y_{it}\) und ein Collider. Kontrollieren für \(Y_{it-1}\) öffnet also den Backdoor-Pfad

\[\begin{align*} B_{it} \leftarrow V \rightarrow Y_{it-1} \leftarrow U \rightarrow Y_{it}. \end{align*}\]

Eine ähnliche Problematik besteht bei der Schätzung dynamischer Panel-Modelle mit mit Fixed- oder Random-Effects-Ansätzen. Wir erläutern dies näher in Kapitel 7.6.1.

7.6.1 Verzerrung in dynamischen Modellen

Ein zentrales Problem bei der Schätzung dynamischer Panelmodelle ist der sogenannte Nickell-Bias. Dieser tritt auf, wenn die Within-Transformation in Anwesenheit von gelagten abhängigen Variablen verwendet wird. Die Mittelwert-Differenzen eliminieren zwar die zeit-invarianten Effekte, führt aber zu Korrelation zwischen den gelagten abhängigen Variablen und den transformierten Fehlertermen: Der Nickell-Bias tritt bei der Within-Transformation auf, weil der Regressor (\(Y_{i,t-1} - \overline{Y}_{i,-1}\))21 mit dem transformierten Fehlerterm (\(\epsilon_{it} - \overline{\epsilon}_i\)) korreliert ist, was zu einer verzerrten Schätzung führt.

21 Hier ist \(\overline{Y}_{i,-1} = \frac{1}{T-1}\sum_{t=2}^T y_{it-1}\).

22 Dies ist problematisch für Mikro-Studien: Die Querschnittsdimension des Panels kann oft “hinreichend” groß gewählt werden. Die Zeit-Dimension ist aus natürlichen Gegebenheiten jedoch oft klein.

Nickell (1981) zeigt, dass diese Verzerrung des Within-Schätzers \(\widehat{\rho}^\textup{Within}\) nicht verschwindet, wenn die Anzahl der Beobachtungseinheiten (\(n\)) divergiert, solange die Zeitdimension (\(T\)) endlich ist.22 Der Nickell-Bias ist besonders bei kurzen Panelen (kleines \(T\)) problematisch. Es ist \[\begin{align*} \widehat{\rho}^\textup{Within} \approx \rho - \frac{1 + \rho}{T-1}, \end{align*}\] d.h. die Verzerrung beträgt ungefähr \(-\frac{1+\rho}{T-1}\).

Hinzufügen von \(Y_{it-1}\) als Regressor in Fixed- und Random-Effects-Modellen ist jenseits der verzerrten Schätzung von \(\rho\) problematisch, wenn \(Y_{it-1}\) mit \(B_{it}\) korreliert ist. Kontrollieren für \(Y_{it-1}\) öffnet dann Backdoor-Pfade, die wir mit FE- oder RE-Ansätzen schließen wollen. In sämtlichen dynamischen Varianten der Fixed- und Random-Effects-Modelle sind die in diesem Kapitel behandelten Schätzer eines kausalen Effekts \(\beta_1 \neq 0\) von \(B_{it}\) auf \(Y_{it}\) daher verzerrt.

Der Arellano-Bond-Schätzer (Arellano und Bond 1991) ist eine Methode, für diese Form von Endogenität in dynamischen Panel-Modellen korrigiert. Das Verfahren betrachtet die Regression in Differenzen zur Korrektur für Heterogenitäten zwischen den Einheiten und schätzt die Koeffizienten anhand der generalisierten Momentenmethode (GMM). Hierbei werden vergangene Werte von \(Y_{it}\) als Instrumente für endogene Differenzen von \(Y_{it}\) genutzt. Siehe Wooldridge (2010) für Beispiele.

Analog zu Anwendungen mit Querschnittsdaten können die hier betrachteten Panel-Schätzer Endogenitäten aufgrund simultaner Kausalität nicht beheben. Zur Korrektur für simultante Kausalität können Panel-Methoden in Kombination mit einer Schätzstrategie basierend auf Instrument-Variablen hilfreich sein. Wir betrachten solche Schätzer in den empirischen Beispielen in Kapitel 8.

7.7 Case Study: Einkommen und Demokratie

Eine Vielzahl polit-ökonomischer Standardwerke und Studien (bspw. Dahl 1971; Huntington 1991; Rueschemeyer, Stephens, und Stephens 1992) liefert vermeintliche Belege für einen zentralen Grundsatz der Modernisierungstheorie: Ein höheres Pro-Kopf-Einkommen erhöht die Nachfrage der Bevölkerung nach politischer Freiheit und demokratischen Insitutionen. Acemoglu u. a. (2008a) argumentieren, dass der in derartigen länderübergreifenden Analysen mit Pooling häufig als positiv geschätzte Zusammenhang zwischen Einkommen und Demokratisierung nicht kausal interpetiert werden sollte. Ein Grund hierfür ist, dass (unbeobachtbare) ausgelassene länder-spezifische Faktoren, die sowohl die ökonomische Entwicklung als auch die Stärke demokratischer Institutionen beeinflussen, wahrscheinlich sind. Um diese mögliche Ursache für Endogenität des Einkommens im Modell \[\begin{align} \text{Demokratisierung}_{it} = \beta_0 + \beta_1\,\text{PK-Einkommen}_{it-1} + \epsilon_{it} \end{align}\] zu adressieren, nutzen Acemoglu u. a. (2008a) Panel-Modelle und Schätzer, die insbesondere für länderspezifische zeit-invariante Einflüsse kontrollieren.

Das Kernergebnis von Acemoglu u. a. (2008a) ist, dass es keinen kausalen Zusammenhang zwischen dem Einkommen (Wirtschaftswachstum) und der Demokratisierung gibt. Die Autoren zeigen, dass historische und geografische Faktoren, die sowohl das Einkommen als auch die politischen Institutionen beeinflussen, den vermeintlichen Zusammenhang erklären können.

Für die nachfolgenden Code-Beispiele nutzen wir einen Auszug des Datensatzes aus dem Replikationspaket zu Acemoglu u. a. (2008a), siehe Acemoglu u. a. (2008b).

Wir lesen zunächst den Datensatz acemogluetal2008.csv ein.

Tabelle 7.1 enthält Beschreibungen der in deminc verfügbaren Variablen.

Variable Beschreibung
country Land
code Länder-Code
fhpolrigaug Freedom House Political Rights Index (FHPRI)
lrgdpch Log(Reales-Pro-Kopf-Einkommen)
polity4 Polity Composite Democracy Index
sample Zugehörigkeit zur verwendeten Stichprobe (Indikator)
year Jahr
year_numeric ID-Variable f. Jahr
Tabelle 7.1: deminc: Demokratisierung und Einkommen (Acemoglu u. a. 2008a)

Wie der output von glimpse(deminc) zeigt, enthält der Datensatz in allen Modell-Variablen NA-Einträge und ist damit nicht ‘balanced’, da die entsprechenden Beobachtungen nicht bei der Schätzung berücksichigt werden können.

Wir vernachlässigen zunächst die Panel-Struktur der Daten und regressieren FHPRI auf das Pro-Kopf-Einkommen für die in Acemoglu u. a. (2008a) verwendete Stichprobe mit Beobachtungen in 5-Jahresschritten von 1955 bis 2000 (Beobachtungen mit sample == 1).

Dieser naive Ansatz ingoriert konstante Heterogenitäten zwischen den Ländern und einen (plausiblen) zeitlich verzögerten Einfluss ökonomisch günstiger Bedingung auf die Demokratisierung. Der geschätzte Koeffizient von lrgdpch zeigt einen positiven Zusammenhang an und ist signifikant.

Die Regression von FHPRI auf das Einkommen in \(t-1\) (l(lrgdpch)) führt zu ähnlichen Schätzungen der Koeffizienten.23 Dies ist plausibel unter der Hypothese, dass es ausgelassende Faktoren gibt, welche die Demokratisierung und das Pro-Kopf-Einkommen in sämtlichen Perioden beeinflussion.

23 Die Verwendung von Lags mit l() in fml erfordert die Angabe von panel.id = ~ country + year, damit die Beobachtungen zugeordnet werden können.

Ein simpler Ansatz zur Kontrolle für fixe länderspezifische Effekte ist die KQ-Schätzung des Regressionsmodells in ersten Differenzen. Analog zu Abbildung 2 in Acemoglu u. a. (2008a) schätzen wir hierfür zunächst ein Modell der Differenzen zwischen den Perioden 1995 und 1970. Zur Schätzung und anschließenden Reproduktion der Grafik berechnen wir die Differenzen anhand eines gruppierten Datensatzes.

Die Ergebnisse in deminc_diff_7095 passen zu unserer Vermutung hinsichtlich ausgelassener länderspezifischer Heterogenitäten: Der geschätzte Koeffizient von dlrgdpch ist positiv, jedoch klein und nicht signifikant von 0 verschieden.

Für die KQ-Schätzung in ersten Differenzen bei Verwendung des gesamten Datensatzes ist das Ergebis noch deutlicher: Die Schätzungen beider Koeffizienten sind klein und insignifikant.

Tabelle 2 in Acemoglu u. a. (2008a) vergleicht verschiedene Schätzer des dynamischen Modells

\[\begin{align} \text{FHPRI}_{it} = \beta_0 + \alpha_i + \lambda_t + \beta_1 \text{FHPRI}_{it-1} + \beta_2 \text{Einkommen}_{it-1} + \varepsilon_{it}\label{eq:acemmod} \end{align}\]

mit Länder- und Zeit-Effekten \(\alpha_i + \lambda_t\). Der Regressor \text{FHPRI}_{it-1} soll die “Beständigkeit” der Demokratie zu erfassen und möglicherweise kurz- bis mittelfristige Dynamiken zu berücksichtigen (d.h. die Tendenz des Demokratie-Scores, zu einem Gleichgewichtswert zurückzukehren). Wir betrachten zunächst die Fixed-Effects-Schätzung von \(\eqref{eq:acemmod}\).

Ähnlich wie in der Differenzen-Regression deminc_diff_mod finden wir bei Kontrolle für Länder- und Zeit-Effekte keine Evidenz für einen Zusammenhang des Pro-Kopf-Einkommens (der Vorperiode) und dem Demokratie-Score. Mit fixef(deminc_FE_mod) lesen wir die gschätzten Effekte aus. Aufgrund der Vielzahl an Länder-Effekten empfiehlt sich eine grafische Zusammenfassung anhand eines Histogramms mit absoluten Häufigkeiten.

Eine Random-Effects-Schätzung mit Länder- und Zeit-Effekten liefert ebenfalls keine Evidenz für einen kausalen Effekt des ökonomischen Wohlstands auf die Demokratisierung.

Um für Endogenität der Regressoren aufgrund des dynamischen Modells zu korrigieren, verwenden Acemoglu u. a. (2008a) weiterhin den Arellano-Bond-Schätzer. Dieser wird auf die Differenz-Transformation

\[\begin{align} \Delta\text{FHPRI}_{it} = \beta_1 \Delta\text{FHPRI}_{it-1} + \beta_2 \Delta\text{Einkommen}_{it-1} + \Delta\epsilon_{it}, \quad t\geq3,\label{eq:acemabmod} \end{align}\]

von Modell \(\eqref{eq:acemmod}\) angewendet und nutzt, dass \(\text{FHPRI}_{it-j}\) und \(\text{Einkommen}_{it-j}\) für \(j\geq2\) nicht mit \(\Delta\varepsilon_{it}\) korreliert sind und damit als Instrumente in einem GMM-Ansatz verwendet werden können.24

24 Damit die Lags gültige Instrumente sind, darf \(\epsilon_{it}\) nicht seriell korreliert sein.

Der Arellano-Bond-Schätzer ist in der Funktion plm::pgmm() implementiert. Wir schätzen Modell \(\eqref{eq:acemabmod}\) mit den zweiten und dritten Lags von \(\text{FHPRI}_{it}\) und \(\text{Einkommen}_{it}\) als Instrumente. Die Spezifikation erfolgt durch den Zusatz | lag(fhpolrigaug, 2:3) + lag(lrgdpch, 2:3) im Argument formula.

Auch der Arellano-Bond-Schätzer liefert keine Evidenz für die Theorie eines positiven kausalen Effekts des Einkommens fürdie Stärke demokratischer Institutionen: Der interessierende geschätzte Koeffizient ist negativ und insignifikant.

Weiterhin bekräftigen zusätzliche Inferenzstatistiken im Output von summary(deminc_AB_mod) die Adäquanz des GMM-Verfahrens:

  • Sargan test: Die Nullhypothese des Sargan-Tests25 ist, dass die Instrumente gültig, d.h. unkorreliert mit den Fehlertermen, sind. Diese Hypothese können wir zu keinem in der Praxis relevanten Signifikanzniveau ablehnen.

  • Autocorrelation test (1): Test der Nullhypothese, dass die \(\Delta\epsilon_{it}\) keine AR(1)-Korrelationsstruktur aufweisen. Für unkorrelierte \(\epsilon_{it}\) sind die ersten Differenzen \(\Delta\epsilon_{it}\) AR(1)-korreliert. Tatsächlich können wir diese Nullhypothese ablehnen.

  • Autocorrelation test (2): Test der Nullhypothese, dass die \(\Delta\epsilon_{it}\) keine AR(2)-Korrelationsstruktur aufweisen. Dies ist relevant für die Gültigkeit des Arellano-Bond-Schätzers, da AR-Korrelation zweiter (oder höherer) Ordnung darauf hinweisen würde, dass die verwendeten Instrumente ungültig sind.

  • Wald test for coefficients: Wir lehnen die Nullhypothese, dass \(\Delta\text{FHPRI}_{it-1}\) und \(\Delta\text{Einkommen}_{it-1}\) keine Erklärtungskraft für \(\Delta\text{FHPRI}_{it}\) haben, ab. Unter der Alternativ-Hypothese ist mindestens ein Koeffizient von null verschieden. Hierunter fällt das Szenario, dass \(\Delta\text{FHPRI}_{it-1}\) zeitliche Dynamik in der Outcome-Variable erklärt, jedoch \(\Delta\text{Einkommen}_{it-1}\) irrelevant ist (kein kausaler Effekt).

  • Wald test for time dummies: Die Nullhyothese, dass die Zeit-Fixed-Effects irrelevant sind, wird zum 5%-Niveau abgelehnt.

25 Auch Sargan-Hansen-Test genannt (nach Sargan 1958; Hansen 1982).

Mit modelsummary::modelsummary() stellen wir die Koeffizientenschätzungen tabellarisch dar. Für eine bessere Lesbarkeit formatieren wir die (andernfalls aus dem jeweiligen formula/fml-Argument übernommenen) Bezeichnungen der Koeffizienten anhand eines bennanten Vektors coef_map.

7.8 Zusammenfassung

Bei entsprechender Datenverfügbarkeit sind Panel-Methoden alternative Ansätze für die Schätzung kausaler Effekte, die Probleme wie Confounding durch unbeobachtbare Heterogenitäten adressieren. Fixed-Effects-Schätzung eliminiert zeitlich-invariante unbeobachtete Heterogenitäten für eine konsistente Schätzung der Effekte zeitlich variierender Variablen. Zeit-Fixed-Effects kontrollieren für zeitabhängige Einflüsse, die alle Einheiten eines Panels in einem bestimmten Zeitpunkt betreffen. Mit Random Effects modellieren wir unbeobachtbare Heterogenitäten zwischen den Beobachtungseinheiten als zufällig. Wenn diese Heterogenitäten nicht mit den erklärenden Variablen korrelieren, können Random-Effects-Schätzer die Variation innerhalb und zwischen den Einheiten für eine unverzerrte und effizientere Schätzungen nutzen.

Dynamische Panel-Modelle kontrollieren für vergangene Werte der Outcome-Variable zur Vermeidung von Confounding aufgrund zeitlicher Abhängigkeitstrukturen. Verfahren wie der Arellano-Bond-Schätzer adressieren inhärante Endogenitätsprobleme in dynamischen Panel-Modellen. Hierbei werden vergangene Werte der Outcome-Variable als Instrumente genutzt, um eine konsistente Schätzungen zu gewährleisten.

Insbesondere wenn in empirischen Anwendungen heteroskedastische oder zeitlich korrelierte Fehler plausibel sind, sollten cluster-robuste Standardfehler für korrekte Inferenz zu kausalen Effekten mit Panel-Schätzungen verwendet werden.

Mit den Paketen fixest und plm stehen vielseitige Implementierungen zur Verfügung, um Fixed- und Random-Effects-Modelle sowie dynamische Panel-Modelle mit R zu schätzen.