Cogitaris - Gesellschaft f\u00fcr Marktforschung
Zurück zum Blog
KI & Technologie

Shapley Value Regression in der Marktforschung

Treiberanalyse ist nicht gleich Treiberanalyse. Warum die Shapley Value Regression der klassischen Methode überlegen ist — und wie sie zu präziseren Handlungsempfehlungen führt.

September 2024 5 Min. Lesezeit
ZurückKI & Technologie

Shapley Value Regression in der Marktforschung

September 2024 5 Min.
Aydin Nasseri
Aydin NasseriGeschäftsführer, Cogitaris GmbH

Ein weit verbreitetes Instrument der Marktforschung – insbesondere bei Kundenzufriedenheits- und Mitarbeiterzufriedenheitsbefragungen – ist die Treiberanalyse. Sie beantwortet die zentrale Frage: Welche Faktoren beeinflussen die Gesamtzufriedenheit am stärksten?

Doch Treiberanalyse ist nicht gleich Treiberanalyse. Die klassische Methode hat grundlegende Nachteile, die zu verzerrten Handlungsempfehlungen führen können. Die Shapley Value Regression bietet hier eine überlegene Alternative – entwickelt aus einem Konzept der Spieltheorie, das 1951 von Lloyd Shapley begründet und 2012 mit dem Nobelpreis für Wirtschaftswissenschaften ausgezeichnet wurde. Einschlägige Forschung zur Methode findet sich u. a. im Journal of Marketing Research.

KonventionellKlassische Treiberanalyse
  • Reihenfolgeabhängige Ergebnisse
  • Unterschätzt starke Treiber
  • Überschätzt schwache Treiber
  • Verzerrung bei korrelierten Variablen
  • Einfache Berechnung
EmpfohlenShapley Value Regression
  • Vollständige Varianzdekomposition
  • Robuster bei kleinen Stichproben
  • Klare Ausdifferenzierung der Treiber
  • Kein Reihenfolge-Bias
  • Nobelpreis-ausgezeichnetes Konzept

Wann ist eine Treiberanalyse hilfreich?

Eine Treiberanalyse liefert wesentliche Erkenntnisse über die Kausalitäten zwischen verschiedenen Faktoren — beispielsweise Unternehmensleistungen wie Produktqualität oder Arbeitsmerkmale wie Arbeitsorganisation — und einer Gesamtbeurteilung. Sie ist ein zentrales Werkzeug, um Kundenzufriedenheit messbar und steuerbar zu machen. Grundsätzlich beantwortet sie folgende Fragen:

Mittels einer Treiberanalyse können fundierte Handlungsempfehlungen gegeben und Optimierungsaktivitäten gesteuert werden. Manchmal werden Relevanzen auch über eine direkte Frage erhoben — also die Befragten direkt gefragt, was ihnen am wichtigsten ist. Dies führt allerdings häufig zu wenig nützlichen Ergebnissen:

Der Shapley-Wert ist ein Konzept aus der kooperativen Spieltheorie. Er beschreibt den durchschnittlichen Beitrag eines Spielers (hier: einer Variablen) über alle möglichen Reihenfolgen, in denen Spieler einer Koalition beitreten können. Dadurch wird eine faire, vollständige Verteilung des Gesamtertrags gewährleistet.

Shapley Value Regression im Vergleich zur klassischen Treiberanalyse

Die klassische Treiberanalyse basiert in der Regel auf einer schrittweisen linearen Regression, bei der Variablen nacheinander ins Modell aufgenommen werden. Das zentrale Problem: Das Ergebnis hängt von der Reihenfolge ab, in der die Faktoren eingebracht werden. Sind Variablen miteinander korreliert – wie es in der Praxis fast immer der Fall ist – entstehen systematische Verzerrungen. Grundlegendes Wissen über Statistik hilft, diese Verzerrungseffekte einzuordnen und zu verstehen, warum robustere Methoden notwendig sind.

Die Shapley Value Regression löst dieses Problem durch einen eleganten mathematischen Ansatz: Sie berechnet den Beitrag jeder Variablen als Durchschnitt über alle möglichen Modellkombinationen. Jede Variable wird in jeder denkbaren Reihenfolge berücksichtigt — so entfällt der Reihenfolge-Bias vollständig.

Möchten Sie wissen, wie Shapley Value Regression Ihre Treiberanalyse verbessern kann? Sprechen Sie mit unseren Experten.

Kostenfreie Erstberatung

Beispiel: Mitarbeitendenbefragung

Nehmen wir als konkretes Beispiel eine Mitarbeitendenbefragung. Es wurden Mitarbeitende eines Unternehmens nach ihrer Gesamtzufriedenheit sowie nach drei spezifischen Faktoren befragt. Das gleiche Prinzip lässt sich ebenso auf Kundenbefragungen anwenden – etwa wenn der Net Promoter Score als abhängige Zielvariable dient:

Treiber-Relevanz im Vergleich

Beispiel: Mitarbeitendenbefragung — Klassische Analyse vs. Shapley Value

Führungskultur
Klassisch: 32%Shapley: 47%
Arbeitsorganisation
Klassisch: 28%Shapley: 24%
Bezahlung
Klassisch: 24%Shapley: 16%

Die Shapley Value Regression differenziert stärker — und zeigt: Führungskultur hat fast die halbe Gesamtrelevanz.

Die klassische Treiberanalyse würde in diesem Beispiel zu folgenden Handlungsempfehlungen führen: Zuerst die Führungskultur verbessern, dann die Arbeitsorganisation auf dem aktuellen Niveau halten und abschließend die Bezahlung im Blick behalten.

Die Shapley Value Regression liefert ein deutlich differenzierteres Bild: Die Führungskultur besitzt fast die Hälfte der Gesamtrelevanz – dieser Befund wird durch die klassische Methode stark unterschätzt. Die Arbeitsorganisation rückt in den Bereich der Unternehmensstärken. Und die Bezahlung, obwohl unterdurchschnittlich bewertet, ist im Vergleich zu den anderen Faktoren deutlich weniger relevant für die Gesamtzufriedenheit.

Durch die Wahl der Methodik wird das Ergebnis beeinflusst – und damit die strategischen Prioritäten eines Unternehmens. Die Shapley Value Regression ermöglicht es, Ressourcen gezielter einzusetzen.

Wie werden Shapley-Werte berechnet?

Im Rahmen einer Treiberanalyse wird der Shapley-Wert als Durchschnitt des partiellen Bestimmtheitsmaßes (R²) einer Variablen in allen möglichen Modellkombinationen berechnet. Konkret bedeutet das: Für jede mögliche Teilmenge der unabhängigen Variablen wird ein eigenes Regressionsmodell berächnet und der zusätzliche Erklärungsbeitrag der betreffenden Variable ermittelt.

Mit drei Variablen (Führungskultur, Arbeitsorganisation, Bezahlung) gibt es bereits sieben mögliche Kombinationen — von Einzelmodellen bis zum Vollmodell. Bei sechs Variablen wären es bereits 63 Kombinationen; bei zehn Variablen über 1.000. Das erklärt, warum Shapley Value Regression einen erheblichen Rechenaufwand erfordert, der mit steigender Variablenanzahl exponentiell wächst.

Alle Modellkombinationen

Shapley berechnet den durchschnittlichen Beitrag jeder Variable über alle möglichen Reihenfolgen

{F}Nur FührungskulturR² = 0.18
{A}Nur Arbeitsorg.R² = 0.10
{B}Nur BezahlungR² = 0.08
{F, A}Führung + ArbeitR² = 0.31
{F, B}Führung + BezahlungR² = 0.28
{A, B}Arbeit + BezahlungR² = 0.19
{F, A, B}Alle FaktorenR² = 0.45

Für jede Variable wird anschließend der Durchschnitt ihrer Beiträge über alle Kombinationen berechnet. Das Ergebnis ist der Shapley-Wert dieser Variable — ein Maß für ihren fairen, reihenfolge-unabhängigen Beitrag zur Varianzaufklärung des Modells.

Ergebnisse richtig interpretieren

Die Shapley-Werte werden typischerweise in einer Vierfeldermatrix dargestellt: Auf der x-Achse die berechnete Relevanz (Shapley-Wert), auf der y-Achse die gemessene Zufriedenheit mit dem jeweiligen Faktor. Diese Darstellung ähnelt strukturell der des Kano-Modells und der Penalty-Analyse, die ebenfalls Leistungsfaktoren nach Relevanz und Ausprägung einordnen. Die vier Quadranten liefern klare strategische Impulse:

Die Shapley Value Regression führt in dieser Matrix zu einer stärkeren Ausdifferenzierung: Die Faktoren liegen weiter auseinander, was die strategische Einordnung erleichtert und zu klareren, weniger mehrdeutigen Handlungsempfehlungen führt.

Lassen Sie uns Ihre Studie analysieren und zeigen, wie Shapley Value Regression Ihre Insights schärft.

Kostenfreie Erstberatung

Vorteile und Grenzen der Shapley Value Regression

Shapley Value Regression bezieht sich auf lineare Regressionen und teilt daher deren Annahmevoraussetzungen: Lineare Beziehungen, normalverteilte Residuen, keine starke Multikollinearität. Dennoch überwiegen die Vorteile gegenüber der klassischen Methode in den meisten anwendungsfällen deutlich.

Warum Shapley?

Die vier Kernvorteile der Shapley Value Regression

Vollständige DekompositionDie Varianzaufklärung wird lückenlos auf alle Variablen verteilt — kein Restterm bleibt ungeklärt.
Reihenfolge-UnabhängigkeitDas Ergebnis ist identisch, unabhängig davon, in welcher Reihenfolge Variablen ins Modell eingebracht werden.
Stärkere AusdifferenzierungTreiber werden klarer voneinander getrennt — so entstehen präzisere Handlungsempfehlungen.
Robustheit bei kleinen NGerade bei begrenzten Stichprobengrößen liefert Shapley stabilere Schätzungen als klassische Regression.

Wichtige Einschränkung: Vollständige Variablenauswahl

Ein kritischer Aspekt, der oft übersehen wird: Die Shapley Value Regression liefert nur dann zuverlässige Ergebnisse, wenn alle relevanten Treiber des untersuchten Konstrukts im Modell enthalten sind. Fehlt ein wichtiger Treiber — weil er im Fragebogen nicht abgefragt wurde —, werden die Shapley-Werte der verbleibenden Variablen systematisch verzerrt.

Wäre in unserem Beispiel die Führungskultur gar nicht erhoben worden, hätten Arbeitsorganisation und Bezahlung künstlich höhere Shapley-Werte erhalten. Eine hypothesengetriebene, umfassende Variablenauswahl bleibt daher ein unverzichtbarer Schritt bei der Studienkonzeption.

Rechenaufwand und Skalierung

Der exponentielle Rechenaufwand bei steigender Variablenanzahl ist eine praktische Einschränkung. Ab etwa 15–20 Variablen wird die exakte Berechnung rechenintensiv. In der Praxis behilft man sich mit approximativen Algorithmen, die jedoch für den Marktforschungseinsatz vollkommen ausreichend sind. In unseren REPORTI®-Dashboards wird die Shapley Value Regression automatisiert und live berechnet — ohne zusätzlichen Aufwand für den Anwender.

Fazit: Klare Handlungsempfehlungen durch bessere Methodik

Die Wahl der statistischen Methode ist keine neutrale, technische Entscheidung — sie hat direkte Auswirkungen auf die strategischen Prioritäten eines Unternehmens. Die klassische Treiberanalyse führt in den meisten Fällen zu einer Unterschätzung der stärksten Treiber und einer Überschätzung schwacher Treiber. Shapley Value Regression behebt dieses Problem durch die vollständige Dekomposition der Varianzaufklärung.

Zusammenfassend ist Shapley Value Regression der klassischen Treiberanalyse überlegen und sollte in allen möglichen Fällen dieser vorgezogen werden. In unseren Marktforschungsprojekten und Insight-Dashboards kommt die Methode regelmäßig zum Einsatz — und kann in unseren REPORTI®-Dashboards live berechnet werden. Die Ergebnisse lassen sich direkt in Closing-the-Loop-Prozesse einbetten, sodass aus Relevanzdaten unmittelbar Maßnahmen abgeleitet werden können.

Das bedeutet für Sie: Marktforschung mit Cogitaris bedeutet die Arbeit mit modernsten Methoden — für die besten und klarsten Einblicke für Ihre Fragestellungen.

„Treiberanalyse ist nicht gleich Treiberanalyse. Wer mit Shapley Value Regression arbeitet, erhält nicht nur robustere Werte — sondern auch klarere Prioritäten für strategische Investitionsentscheidungen.“

Sie möchten modernste Analysemethoden für Ihre nächste Befragung nutzen? Sprechen Sie uns an.

Kostenfreie Erstberatung