Standen Sie schon einmal vor der Herausforderung große Textmengen auszuwerten? Das kann nicht nur unheimlich viel Zeit kosten, häufig verliert man sich auch in der Menge an Themen, die bei offenen Fragen zu Tage treten können. Die Lösung dieser Herausforderung sollte jedoch nicht darin bestehen, keine offenen Fragen mehr zu stellen, da Sie damit ja auch eine große Menge wertvollen qualitativen Input erhalten, der Ihnen sonst verloren ginge. Vielmehr sollte nach einem Weg gesucht werden, wie sich diese Texte effizient und effektiv verarbeiten lassen. So können Sie beispielsweise Kundensegmentierungen oder die Klassifikation von Merkmalen wie dem Wohnort vornehmen.  

Um diese Herausforderung zu meistern, arbeiten wir bei Rogator mit einer eigens entwickelten Textanalysesoftware – die mittlerweile überhaupt nicht mehr wegzudenken ist, weil sie große und unstrukturierte Textmengen im Rahmen umfangreicher Befragungsprojekte schnell und zuverlässig analysiert.  

Viele unserer Kundinnen und Kunden fragen uns, wie das eigentlich funktioniert und wie eine Software generell Texte verstehen kann. Daher erläutern wir in diesem Beitrag, wie unsere Textanalysesoftware qualitative Befragungsdaten linguistisch verarbeitet.

 

Inhaltsverzeichnis

  1. Was ist Sprache?
  2. Analyse linguistischer Schritte mittels Software
  3. Fazit

 

Sprache verstehen

Sprache ist das, womit wir täglich kommunizieren. Dies kann mündlich geschehen, beispielsweise im Gespräch, aber auch schriftlich, zum Beispiel in einer E-Mail. Mit diesem Thema in all seinen Ausprägungen befasst sich die Sprachwissenschaft, auch Linguistik genannt.  

Wenn es in diesem Artikel um linguistische Schritte geht, ist damit der Prozess gemeint, Texte in ihre Bestandteile zu zerlegen und dadurch zu analysieren. Wir Menschen eignen uns diese Fähigkeit in unserer Kindheit intuitiv an; die Überführung dieser Kompetenz in entsprechende Computerprogramme gibt es hingegen erst seit einigen Jahren.    

 

Linguistische Schritte

Wenn eine Software Texte eingespielt bekommt, werden bei der linguistischen Vorverarbeitung automatisch folgende Schritte durchgeführt:  

  1. Tokenisierung: Dies ist die regelbasierte Erkennung von Wort– und Satzgrenzen. Auch Abkürzungen werden mithilfe einer Wortliste identifiziert.
  2. Lemmatisierung: In diesem Schritt werden Wörter auf ihre Grundform zurückgeführt, zum Beispiel Häuser zu Haus.
  3. POS-Tagging: Hierbei werden Wortarten bestimmt und Funktionswörter, die keine inhaltliche Relevanz für die Analyse haben, entfernt.
  4. Sentiment Analysis: Im letzten Schritt wird die Polarität einer Äußerung, also ob sie positiv oder negativ gemeint ist, festgestellt, indem die einzelnen Wörter auf eine positive oder negative Konnotation hin untersucht werden.

Auf Grundlage dieser Analyse erfolgt anschließend eine Einordnung in Themen-Cluster, die Ihnen als Semantic Map oder Tabelle präsentiert werden. Diese Zuordnung können Sie selbstverständlich noch manuell nachbearbeiten, wenn Sie beispielsweise Themen-Cluster zusammenfassen oder noch einmal aufsplitten und im Detail betrachten möchten.

 

Fazit

Die Analyse großer Textmengen kann herausfordernd sein, besonders bei offenen Fragen. Unsere Textanalysesoftware ermöglicht eine schnelle und zuverlässige Auswertung unstrukturierter Daten. Durch linguistische Schritte wie Tokenisierung und Sentiment-Analyse werden die Daten strukturiert und in relevante Themen-Cluster unterteilt, sodass Unternehmen wertvolle Einblicke gewinnen und fundierte Entscheidungen treffen können.

 

 

 

Folgende Blogbeiträge könnten für Sie auch interessant sein:

 

 

   

Verfasst von Hanna Hartberger

Hanna Hartberger ist eine vielseitige Allrounderin, die sich in fast allen Bereichen rund um Customer Feedback, Employee Feedback und Software auskennt. Durch ihre jahrelange Erfahrung im Texte schreiben ist es ihr ein besonderes Anliegen, auch komplexe Fachthemen leicht verständlich und interessant zu vermitteln.

Folgen Sie Hanna Hartberger auf LinkedIn.