SEMINARE Downloads: Vorträge & Workshops succeet22 Infos & Vortrag: Personalmesse München Rogator-Videothek | Kostenfreie Video-Aufzeichnungen und Downloads zu unseren Web-Seminaren | Jetzt ansehen! Zum Rogator-Newsletter anmelden!
Menü
Clusteranalyse: Personen in verschiedenen Farben mit Distanzmaßen - Symbolbild

Wissen: Clusteranalyse

Das hilfreiche Einsortieren in Schubladen
Kontakt aufnehmen
Home » Fachwissen » Wissen Customer Feedback » Clusteranalyse

Mit der Clusteranalyse Datenmengen Struktur geben

 

Auf unserer Wissensseite zum Thema Clusteranalyse erfahren Sie alles über Hintergründe, Durchführung und Methoden sowie Anwendungsfälle der Clusteranalyse.

 

Der erste Schritt ist getan: Die Befragung des Kundenstamms bzw. der Mitarbeiterschaft ist durchgeführt. Große Datenmengen liegen bereit zur Analyse. Welche Auswertungsverfahren sind nun am besten geeignet, um den maximalen Nutzen zur Entwicklung neuer Marketingstrategien oder zur Steigerung der Attraktivität als Arbeitgeber zu erzielen? Soll in diesem Zusammenhang ermittelt werden, welche Personengruppen welche Vorlieben und Abneigungen haben und wie sie auf dieser Basis gezielt angesprochen werden können, ist häufig eine Clusteranalyse das Mittel der Wahl.

 

Verkürzt gesprochen lautet die grundsätzliche Fragestellung einer Clusteranalyse: Können die untersuchten Objekte auf Basis der erhobenen Daten in Clustern bzw. natürlichen Gruppen zusammengefasst werden?

Rogator bietet professionelle Unterstützung für Ihre Befragungen

Mehr erfahren
Marktsegmentierung mit Hilfe der Clusteranalyse

Definition Clusteranalyse

Mithilfe des explorativen Verfahrens der Clusteranalyse können Datensätze in Gruppen eingeteilt werden und zwar entsprechend ihrer Ähnlichkeiten.

 

Hierfür lassen sich verschiedene Kriterien oder Merkmale verwenden, auf Basis derer die Ähnlichkeit der Daten ermittelt wird.

Kontakt aufnehmen

Cluster: Viel mehr als soziodemografische Merkmale

 

Clustern bedeutet hier, bestimmte Daten bzw. Personen entsprechend ihrer Ähnlichkeit in Gruppen einzuteilen. Dadurch gewinnt ein Unternehmen einen Überblick über vormals unübersichtlich große Datensätze. Es wird keine Sortierung vorgenommen, sondern eine Segmentierung. Ersteres würde bedeuten, bereits im Vorfeld Kategorien festzulegen; beim Segmentieren bilden sich die Kategorien dagegen erst aus den individuellen Mustern des Datensatzes heraus. Die Merkmale und Eigenschaften der einzelnen Cluster werden dann erst im Nachgang entsprechend der durchgeführten Zuordnung definiert.

sortierte bunte Spielfiguren als Beispiel für das Ergebnis einer Clusteranalyse

Clusteranalyse: Merkmale & Variablen

 

Es liegt bei einer Auswertung nahe, die befragten Personen aufgrund von Angaben wie Alter, Geschlecht und Familienstand (Merkmale, die in einer Befragung meist erhoben werden) zu klassifizieren, sprich sie in passende Cluster zu gruppieren.

 

Allerdings würde diese Vorgehensweise eine Sortierung und gerade keine Segmentierung darstellen. Und noch wichtiger: Diese Variablen haben in Bezug auf differenzierte Fragestellungen mitunter nur wenig Aussagekraft.

Kontakt

Möchte beispielsweise ein Unternehmen aus dem Lebensmittelsektor seine Zielgruppenprofile schärfen, um Marketingmaßnahmen noch planvoller auszuspielen, kann es sich etwa über folgende, in der Umfrage bewertete Statements an verschiedene Personengruppen herantasten:

 

  • Ich koche meist aufwendig und experimentiere gern mit neuen Gewürzen.
  • Ich achte strikt auf den biologischen Anbau der Lebensmittel, die ich verarbeite.
  • Für mich muss das Zubereiten einer Mahlzeit möglichst schnell gehen.
  • Ich koche kaum selbst, sondern hole mir mein Essen gewöhnlich unterwegs.
  • Ich habe aufgrund von Unverträglichkeiten besondere Ansprüche an die Zusammenstellung meiner Mahlzeiten.

 

Aus den Antworten lassen sich nun etwa Cluster bilden wie „Der Hobbykoch“, „Der To-go-Esser“ und „Der Ernährungssensible“. Zweifelsohne ist auch eine Verknüpfung beispielsweise mit der Variable des Alters, des Geschlechts und der Anzahl der im Haushalt lebenden Personen interessant. Eine feingranulare Einordnung der befragten Personen hinsichtlich des konkreten Befragungsziels ist aber in aller Regel von viel höherer Relevanz.

Rogator bietet professionelle Unterstützung für Ihre Befragungen

Mehr erfahren

Wann ist ein Cluster bei der Clusteranalyse maximal aussagekräftig?

 

Zwei grundsätzliche Faktoren bestimmen die Aussagekraft eines Clusters:

 

  1. Er muss in sich möglichst homogen sein.
  2. Er muss sich möglichst deutlich von anderen Clustern abgrenzen.

 

Eine Voraussetzung, um diese Anforderungen zu erfüllen, ist eine ausreichend große Stichprobe; damit können überhaupt erst sinnvolle, realistische Kategorien gebildet werden. Hilfreich ist es auch, mögliche Extremwerte herauszufiltern – so kann ein dadurch verzerrtes Ergebnis vermieden werden. Ebenso sollten die verwendeten Variablen nicht zu stark miteinander korrelieren; dies würde im Ergebnis zu einer übermäßigen Betonung einzelner bzw. sehr ähnlicher Sachverhalte führen.

 

In Clustern lassen sich übrigens nicht nur Personenmerkmale gruppieren; untersuchte Objekte können genauso Gegenstände wie Autos, Schuhe oder Möbelstücke, Städte, Länder oder Institutionen bzw. Organisationen sein. Diese kann man zwar nicht direkt befragen, aber sie verfügen ebenfalls über diverse Eigenschaften, anhand derer sie geclustert werden können.

Linien zwischen Personen als Visualisierung von Distanzmaßen in der Clusteranalyse

Der Ablauf einer Clusteranalyse

Der erste Schritt einer Clusteranalyse besteht im Festlegen der notwendigen Parameter. Hier fällt häufig das Stichwort Proximitätsmaß: „Proximitätsmaße umfassen Distanz- und Ähnlichkeitsmaße; sie dienen dazu, die Stärke der (Un-)Ähnlichkeit zweier Objekte zu quantifizieren.“1 Hierbei können verschiedene Berechnungsmethoden angewandt werden wie etwa:

 

  • Euklidische Distanz
  • M-Koeffizient
  • Tanimoto-Index
  • Q-Korrelationskoeffizient

 

Auf die Berechnung des Proximitätsmaßes folgt die Festlegung des Cluster-Algorithmus. Welche verschiedenen Methoden sich für welchen Anwendungsfall anbieten, wird im nächsten Abschnitt erläutert.

Schließlich ist noch wichtig festzulegen, mit welcher Zielzahl an Clustern die Analyse durchgeführt werden soll.

 

Sind alle Parameter festgelegt, kann die eigentliche Clusteranalyse beginnen. Zur Anzeige der Ergebnisse bieten sich Streudiagramme, die klassische Tabellenform oder auch die Darstellung in Kreisen mit verschiedenen Größen und Farben an.

 

1 Wentura, D., Pospeschill, M. (2015). Clusteranalyse. In: Multivariate Datenanalyse. Basiswissen Psychologie. Springer, Wiesbaden, S. 165.

Rogator bietet professionelle Unterstützung für Ihre Befragungen

Mehr erfahren
Verschiedenfarbige Würfel als Symbol für die Clusteranalyse als Teildisziplin der Statistik

Die verschiedenen Methoden einer Clusteranalyse

Eine Clusteranalyse kann mithilfe von hierarchischen und nicht-hierarchischen bzw. partitionierenden Verfahren durchgeführt werden. Wer hierarchische und partitionierende Verfahren kombiniert, erhält ein umso verlässlicheres Ergebnis.

 

Hierarchische Clusteranalyse

 

Dieses Verfahren nutzt entweder divisive Algorithmen oder agglomerative Algorithmen.

 

Divisiv bedeutet: Es wird „top-down“ vorgegangen, sprich große Cluster werden sukzessive geteilt und somit zu immer kleineren Clustern verfeinert.

 

Agglomerativ meint: In einem „bottom up“-Ansatz werden kleine Cluster zu immer größeren vereint.

In der Praxis ist die agglomerative Herangehensweise gängig. Sie ermöglicht wiederum die Gruppierung von Clustern auf zwei gängige Arten: Beim Single-Linkage-Verfahren ist die geringste Distanz zwischen zwei Fällen/Personen relevant, die sich in verschiedenen Clustern befinden; beim Complete-Linkage-Verfahren werden hingegen die beiden Fälle/Personen herangezogen, die sich zwischen zwei Clustern am stärksten unterscheiden, also die größte Distanz aufweisen.

 

Partitionierende Clusteranalyse

 

Voraussetzung für die partitionierenden Clusteranalyse ist, dass die Datensätze bereits klassifiziert sind; nun werden sie für ein noch signifikanteres Ergebnis umgruppiert. Dazu dienen zwei Algorithmen:

 

Mithilfe des K-Means-Algorithmus geht man bei der Analyse iterativ vor:

 

  • Zuerst wird die Anzahl der zu bildenden Cluster festgelegt. Auf dieser Basis erfolgt eine zufällige Kategorisierung.
  • Die Mittelwerte der verschiedenen Variablen bilden je ein Clusterzentrum.
  • Nun kommt die euklidische Distanz ins Spiel: Die jeweiligen Daten, die diesen Zentren am nächsten liegen, werden dem entsprechenden Cluster zugeordnet.
  • Dieser Schritt wird so oft wiederholt, bis der Algorithmus alle Daten in Clusterzentren ideal einsortiert hat.

 

Two-Stage-Clusteranalyse

 

Die Two-Stage-Clusteranalyse – auch Two-Step-Clusteranalyse genannt – vereint die hierarchische und die partitionierende Clusteranalyse. Zuerst wird der Datensatz in Cluster eingeteilt; im zweiten Schritt werden die Cluster mittels K-Means-Methode für ein möglichst aussagekräftiges Ergebnis iterativ optimiert.

Clusteranalyse: Klassische Anwendungsfälle

 

Es klang im Vorangegangenen bereits an: Eine Clusteranalyse findet in den verschiedensten Bereichen Anwendung, wenn aus einer größeren Datenmenge verschiedene Gruppen jeweils homogener Objekte mit ausgewählten Merkmalen abgeleitet werden sollen. Im Marketingkontext dient eine Clusteranalyse etwa dazu, Zielgruppen zu definieren, um so verschiedene Kunden noch passgenauer ansprechen zu können. Clusteranalysen können im Unternehmensbereich aber zum Beispiel auch dazu dienen, die Zufriedenheit der Mitarbeitenden zu erklären bzw. die Frage zu beantworten, welche Gruppe von Angestellten welche Bedürfnisse und Wünsche hat.

 

Beispiel zum Ablauf einer Clusteranalyse

 

Um das eingangs genannte Beispiel aus der Lebensmittelbranche aufzugreifen, haben wir exemplarisch den Ablauf einer Clusteranalyse dargestellt. Das fiktive Unternehmen bietet Online-Kochkurse, Ernährungsberatung sowie einen Lieferservice für Kochboxen an:

  • 1. Zielformulierung des Unternehmens

    „Wir möchten potenzielle Kundinnen und Kunden noch besser verstehen, um unsere Marketingmaßnahmen passgenau auf ihre Bedürfnisse und ihren Alltag abzustimmen.“

  • 2. Leitfrage

    „Welche Einstellung zum Kochen und zu Ernährung hat die Zielgruppe unseres Marktsegments?“

  • 3. Ergebnisse der Befragung/ diverse ermittelte Einstellungen und Ansprüche

    Im Folgenden haben wir einige Beispiel-Ergebnisse zusammengestellt, anhand deren wir die weiteren Clusteranalyse-Prozessschritte gedanklich mit Ihnen durchspielen möchten:

Junge Frau mit Kreditkarte beim Online-Einkauf in einem Café

Beispielhafte Befragungsergebnisse

Ich koche auch unter der Woche aufwendig.
Essen muss für mich immer frisch sein.
Mahlzeiten dienen hauptsächlich dazu, mich satt zu machen.
Bei mir kommt nur Bio in den Topf.
Ich möchte genau wissen, wo mein Essen herkommt.
Milchprodukte vertrage ich nicht.
Hauptsache Fleisch!
Ich denke bei meiner Ernährung an die zukünftigen Generationen.
Die Fast-Food-Läden um die Ecke kennen mich als Stammgast.
In meiner mehrköpfigen Familie alle satt zu kriegen, ist eine Herausforderung.
Ich esse am liebsten in Gesellschaft.
Ich informiere mich regelmäßig über mögliche Produktrückrufe.
Ich weiß um die Nährwerte verschiedener Lebensmittel gut Bescheid.

  • 4. Eigentliche Analyse

    1) Hierarchische Clusteranalyse (erste Gruppenbildung)
    2) Partitionierende Clusteranalyse (feingranulare Segmentierung)

  • 5. Resultat der Clusteranalyse

    Drei Typen potenzieller Kundinnen und Kunden:

    Der Bewusste: Typ 1 legt hohen Wert auf Transparenz beim Lebensmittelkauf sowie auf ökologische Kriterien und Genuss.
    Die Familienmanagerin: Typ 2 ist für die Mahlzeiten der Familie verantwortlich und macht sich viele Gedanken um deren Gesundheit.
    Der Bequeme: Typ 3 isst gut und gerne; Convenience steht für ihn im Vordergrund.

  • 6. Nutzen

    Das Unternehmen kann auf Basis dieser Analyse nun zielgerichtete Werbekampagnen entwickeln und auf den passenden Kanälen schalten.

Fazit: Die Stärken und Schwächen einer Clusteranalyse

 

Eine Clusteranalyse lässt mithilfe verschiedener Methoden relativ homogene Teilmengen innerhalb einer Menge heterogener Objekte bzw. Daten sichtbar werden. Sie ist grundsätzlich leicht und auf viele diverse Bereiche anwendbar wie etwa in der Marktforschung, aber auch in der Mitarbeiterforschung. Mitunter ist die Interpretation der Ergebnisse nicht immer eindeutig – eine korrekte Schlussfolgerung erfordert unbedingt die Kenntnis über den im Einzelnen eingesetzten Clusteralgorithmus.

 

Große Mengen an Antworten auf offene Fragestellungen als Grundlage einer substanziellen Clusteranalyse sind eine Herausforderung. Diese ist aber zu bewältigen und zwar mit einer leistungsstarken Software. Die Textanalysesoftware RogTCS beispielsweise analysiert unstrukturierte Textdaten automatisiert, ohne dass diese vorher kategorisiert werden müssen. Die webbasierte Applikation segmentiert die Daten und visualisiert die Cluster in wenigen Schritten. Mühelos und nahezu unverzüglich stehen wertvolle Ergebnisse für die weitere strategische Ausrichtung bereit .

Rogator bietet professionelle Unterstützung für Ihre Befragungen

Mehr erfahren

 

 

Expertenwissen

Marktsegmentierung mit Hilfe der Clusteranalyse

Professionelle Unterstützung bei Ihren Befragungen und Ergebnisauswertungen

Sie möchten eine Kundenbefragung durchführen und mit Hilfe der Clusteranalyse auswerten? Oder Sie haben ein anderes Forschungsvorhaben und benötigen Unterstützung bei der Ergebnisauswertung?

 

Rogator berät sie umfassend zur Online-Befragung und Ergebnisauswertung und findet gemeinsam mit Ihnen die passende Analyse für Ihre Umfrage.

Jetzt kostenfrei informieren
Kontakt Software

Sie haben Fragen zu unserer Software? Hinterlassen Sie uns einfach eine Nachricht mit Ihrem Anliegen und wir setzen uns schnellstmöglich mit Ihnen in Verbindung.

Software

Innovative Software für Ihre Befragungen

Beratung

Ein starkes Team kümmert sich um Ihre Anliegen

Kundenfokus

Unsere Lösungen sind flexibel und kundenorientiert

Kontakt — Software
Name
Name
Vorname
Nachname
Bestätigung
Kontakt Customer Feedback

Hinterlassen Sie uns einfach eine Nachricht mit Ihrem Anliegen und wir setzen uns schnellstmöglich mit Ihnen in Verbindung.

Software

Innovative Software für Ihre Befragungen

Beratung

Ein starkes Team kümmert sich um Ihre Anliegen

Kundenfokus

Unsere Lösungen sind flexibel und kundenorientiert

Kontakt — Customer Feedback
Name
Name
Vorname
Nachname
Bestätigung
Kontakt Employee Feedback

Hinterlassen Sie uns einfach eine Nachricht mit Ihrem Anliegen und wir setzen uns schnellstmöglich mit Ihnen in Verbindung.

Software

Innovative Software für Ihre Befragungen

Beratung

Ein starkes Team kümmert sich um Ihre Anliegen

Kundenfokus

Unsere Lösungen sind flexibel und kundenorientiert

Kontakt — Employee Feedback
Name
Name
Vorname
Nachname
Bestätigung
Kontakt

Sie haben Fragen zu unseren Produkten und/oder Dienstleistungen? Hinterlassen Sie uns einfach eine Nachricht mit Ihrem Anliegen und wir setzen uns schnellstmöglich mit Ihnen in Verbindung.

Software

Innovative Software für Ihre Befragungen

Beratung

Ein starkes Team kümmert sich um Ihre Anliegen

Kundenfokus

Unsere Lösungen sind flexibel und kundenorientiert

Kontakt — Allgemein
Name
Name
Vorname
Nachname
Bestätigung
Sprechen Sie uns an!
Tel. 0911 / 8100 550