Intro

In der methodischen Welt ist einges in Bewegung, das zum Teil noch wenig Eingang in die Anwendung im deutschsprachigen Raum genommen hat. Ein Ziel dieses Weblogs ist es, methodisch interessierten Anwendern einen praktischen Einstiegspunkt in die neueren oder hierzulande weniger verbreiteten Verfahren zu bieten und darüber zu informieren, was mich methodisch interessiert. Darüber hinaus wird es auch das eine oder andere Fotografische zu sehen und zu lesen geben.

Methodisches

Methodisch interessieren mich zur Zeit vor allem für drei Punkte: 1. Generalisierte Lineare (Gemischte) Modelle, 2. Bayesianische Methoden, 3. Probabilistische Graphische Modelle.

1. Generalisierte Lineare (Gemischte) Modelle (GLMMs)

GLMMs sind eine relativ weitreichende Modellklasse, die sich zur Bearbeitung einer Fülle von Forschungsfragestellungen eignet und  meines Erachtens in der Psychologie im deutschsprachigen Raum noch relativ wenig rezipiert ist. Eine Menge gängiger klassischer Verfahren lassen sich im Rahmen der GLMMs darstellen. Diese sind z.B. das Allgemeine Lineare Modell (ALM), die logistische Regression zur Analyse von dichotomen und kategorialen Daten, die Poisson-Regression zur Analyse von Häufigkeiten sowie die Mehrebenen-Extensionen dieser Verfahren. Auch gängige Item-Response-Modelle der Psychometrie, wie das dichotome Rasch-Modell oder das Partial-Credit-Modell, sind als GLMMs verstehbar.

Warum GLMMs?

In der psychologischen Methodenausbildung lernt man gewissermaßen “bottom-up”. Es werden Einzelverfahren, wie. z.B. die t-Tests und die Varianzanalysen gelernt, die zunächst scheinbar unverbunden nebeneinander stehen und erst gegen Ende der Ausbildung werden die größeren Zusammenhänge mit der Einführung des ALM im Rahmen der Multivariaten Verfahren sichtbar. Meiner Ansicht nach ist ein alternativer Ansatz, direkt mit dem ALM als Spezialfall von GLMMs einzusteigen, dieses um die Mehrebenen-Analyse zu erweitern und dann zur (gemischten) logistischen Regression und der (gemischten) Poisson-Regression zur Häufigkeitsanalyse voranzuschreiten. Der Vorteil dieser Vorgehensweise liegt vermutlich darin, dass GLMMs formal ein relativ kompaktes, koheräntes und zusammenhängendes System darstellen, das in der globalen statistischen Gemeinschaft gut rezipiert ist. Wer die multiple Regression und die Mehrebenen-Analyse versteht, sollte keine größeren Schwierigkeiten mit den Erweiterungen haben. Sind die Grundlagen verstanden, ist der Kopf frei dafür, den Hauptfokus auf die Planungsphase einer Untersuchung zu legen und zu klären, wie eine konkrete Modellspezifikation auszusehen hat, um eigene Forschungsfragestellungen zu bearbeiten. Wenig bekannt scheint es auch zu sein, dass sich GLMMs, bzw. Multilevel-Analysen auch dazu eignen, Experimentaldaten zu analysieren oder psychometrische Messmodelle zu erzeugen.

Die relative Novität dieser Verfahren bringt es mit sich, dass hier noch einiges zu tun ist, auch Lehrbücher, speziell für Psychologen oder Human- und Sozialwissenschaftler sind rar.

2. Bayesianische Methoden

Unter anderem im Rahmen der Kontroversen um den klassischen Signifikanz-Test nach Fisher habe ich begonnen mich mit Bayesianischen Methoden auseinanderzusetzen. Die Bayesianische Statistik unterscheidet sich in einigen wesentlichen Punkten vom “klassisch-frequentistischen” Ansatz. Zu nennen  wären z.B. fundamentale Unterschiede im Wahrscheinlichkeitsbegriff und die Verwendung von Prior-Verteilungen. Dazu, welcher Ansatz nun “der Richtige” ist, möchte ich mich hier nicht äußern. Das Feld ist historisch durch zahlreiche Debatten geprägt und meines Erachtens macht es erst dann Sinn sich mit dem Bayesianischen Ansatz auseinanderzusetzen, wenn die klassischen Ansätze von Fisher und Neyman-Pearson verstanden worden sind. Nichtsdestotrotz zeigen sich auf dem Lehrbuch-Markt im anglo-amerikanischen Raum einige Entwicklungen, die in Richtung Bayes weisen.

Warum Bayesianische Methoden?

Persönlich sehe ich im Bayesianischen Ansatz einige Vorteile gegenüber den klassischen Ansätzen:

  • Die Verwendung von MCMC-Methoden ermöglicht es, sog. Posterior-Verteilungen von Parametern auf der Basis von Daten, einer Modell-Likelihood und von Prior-Verteilungen zu erzeugen, was potentiell von der Abhängigkeit von tabellierten Verteilungen befreit. Die Posterior-Verteilungen lassen sich für Inferenz-Zwecke nutzen. Um ein Beispiel zu geben: Die Freiheitsgrade der t-Statistiken bei der Multilevel-Analyse sind nach Douglas Bates streng genommen unbekannt. Eine potentielle Lösung für das Problem besteht darin, die Posterior-Verteilungen der entsprechenden Parameter auf Basis der MCMC-Methode zu erzeugen und die Signifikanz auf der Basis sog. Kredibilitäts-Intervalle zu evaluieren.
  • Theoretisch lassen sich Posterior-Verteilungen von abgeleiteten Statistiken, wie z.B. von Reliabilitäts-Indices oder Effektstärke-Indices generieren. Anstatt nur einen Punktschätzer zu verwenden, fallen Kredibilitäts-Intervalle dieser Indices an, die sich zum Zweck der Inferenz nutzen lassen.
  • Das Problem von fehlenden Werten ist bei der Verwendung von MCMC-Methoden vermutlich kein Problem. Anstatt Techniken der Multiplen-Imputation zu verwenden, fallen ohne besondere Vorkehrungen modellbasiert Kredibilitäts-Intervalle für die Lage der fehlenden Werte auf Basis der vorhandenen Informationen an. Diese vorhanden Informationen sind die Daten, ein statistisches Modell und die entsprechenden Prior-Verteilungen.
  • Die Modellgüte lässt sich über sog. Posterior-Prediktive-Checks evaluieren. Hier wird die Lage von empirisch beobachteten, abgeleiteten Statistiken mit der unter einem Modell angenommenen Verteilung der Lage verglichen, um zu überprüfen, wie gut das Modell die beobachteten Daten abbildet, ähnlich, wie dies auch beim parametrischen Bootstrapping der Fall ist.

Bayesianische Methoden stellen ein relativ breites Feld der Forschung dar, das bis jetzt in der Psychologie noch wenig oder gar nicht genutzt wird.

Bei all den vermuteten Vorteilen stellt sich zu Recht die Frage, was eigentlich die Nachteile der Verwendung dieser Methoden sein könnten.

  • Die Mathematik und die Anwendung ist bisweilen relativ komplex
  • Der Bayesianische Wahrscheinlichkeitsbegriff unterliegt einer Kontroverse
  • Die Verwendung von Prior-Verteilungen unterliegt historisch ebenfalls einer Kontroverse, da hierüber Vorinformationen des Anwenders in die Analyse mit einfließen können. Irgendwo las ich: „Dies ist ein Vorteil oder Nachteil, je nachdem, wen man fragt.” In der Praxis scheint sich eingebürgert zu haben, möglichst uninformative Prior-Verteilungen zu verwenden, um Subjektivität zu minimieren. Ferner ist der Bayes Ansatz mit dem klassischen Maximum-Likelihood-Ansatz kompatibel, sofern uninformative Prior-Verteilungen verwendet werden.

Insgesamt kann gesagt werden, dass in diesem Feld eine Menge in Bewegung ist, was sich z.B. auch darin zeigt, dass Bayesianische Schätzverfahren in die bekannte Analysesoftware MPlus Eingang gefunden haben. Aus der Perspektive einer psychologischen Methodenforschung ist hier noch eine Menge zu tun.

3. Probabilistische Graphische Modelle

Durch meine Auseinandersetzung mit Bayesianischen Verfahren bin ich letztlich auf Probabilistische Graphische Modelle (PGMs) gestoßen, die sich u.a. in der machine learning community einer gewissen Beliebtheit zu erfreuen scheinen. PGMs entspringen einer Fusion von Wahrscheinlichkeitstheorie und der mathematischen Graphentheorie. Der für mich relevante Aspekt dieser Modelle liegt darin, dass sich eine Vielzahl in der Psychologie verwendeten Modelle, insbesondere Modelle mit latenten Variablen, als PGM darstellen lassen. Der graphische Ansatz erleichtert meines Erachtens das Nachdenken über Unabhängigkeitsbeziehungen zwischen Variaben und das Verständnis von komplexen Modellen. Unter dieser Persepektive sind die bekannten linearen Strukturgleichungsmodelle in der Tat auch PGMs. Zudem bedienen sich viele Programme zur Anwendung der MCMC-Methode, wie z.B. JAGs oder OpenBUGS des graphischen Ansatzes zur Modellspezifikation. In diesen Bereichen bin ich derzeit selbst bei der Exploration.

Zusammenfassend kann gesagt werden, dass es aus meiner Sicht im methodischen Bereich einiges zu tun gibt:

  1. Vermittelung von GLMMs unter dem besonderen Aspekt der Anwendung auf (psychologische) Forschungsfragestellungen
  2. Nähere Untersuchung der Eignung des Bayesianischen Ansatzes für die psychologische Forschung
  3. Exploration der Modellklasse der PGMs unter dem besonderen Aspekt der Verbindung zu schon bekannten Modellen in der Psychologie und auch als Möglichkeit der Modellgenerierung

Fotografisches

Privat interessiere ich mich für Fotografie in ihren kulturellen, historischen und praktischen Aspekten. Heutzutage ist es schwierig, berufliches und privates zu trennen. Von daher werde ich der Einfachheit halber – und damit das Ganze nicht zu methodenlastig wird – dieses Weblog auch dazu nutzen, ein paar Dinge zum Thema Fotografie aus meiner Perspektive zu schreiben. Vermutlich wird es auch das eine oder andere Bild zu sehen geben. Ein tolles Buch zum Einstieg in die Thematik „Fotografie” ist z.B. Michel Frizot (Hrsg.) (1998). Neue Geschichte der Fotografie. Köln: Köhnemann.

Leave a Reply

Your email address will not be published. Required fields are marked *