Offene Codierung - smartinterview zur Extraktion von verbatim

Verfasst von

Matthieu SAUSSAYE

Veröffentlicht

Inhalt

Offene Codierung

Der Pulse-Klassifikator von SmartInterview ist ein KI-gestütztes Werkzeug, das die Kodierung von offenen Umfrageantworten automatisiert. Er passt sich an Excel-Dateien (.xlsx, .xls), SPSS-Format (.sav) und In-Platform SmartInterview-Umfragen an und ermöglicht es Ihnen, Tausende von wörtlichen Antworten in Minuten statt Stunden zu klassifizieren.

Es bewahrt Ihre Originaldaten unverändert und fügt strukturierte Klassifikationsspalten (Codes und Sentiment) hinzu, wodurch es sofort mit Ihren bestehenden Analyse-Workflows kompatibel ist.

Wichtige Funktionen umfassen:

  • Automatische Codegenerierung aus den Antworten der Befragten

  • Import vordefinierter Kodelisten aus Ihrem Excel-Themenblatt

  • Sentiment-Analyse (Positiv / Negativ / Neutral) pro Code

  • Mehrspaltige Klassifikation für Dateien mit mehreren offenen Fragen

  • Echtzeit-Überwachung des Fortschritts damit Sie an anderen Aufgaben arbeiten können, während die Klassifikation läuft

  • Geschätzte Codeanzahlen bevor die volle Klassifikation gestartet wird

1. Erste Schritte

Unterstützte Eingabeformate

Format

Beschreibung

.xlsx

Microsoft Excel 2007+ (primäres Format)

.xls

Altes Excel 97-2003

.sav

SPSS-Datendateien

In-Platform-Umfrage

Aktive SmartInterview-Umfragen (automatisch importiert)

Um zu beginnen, navigieren Sie zur Pulse-Klassifikator Seite von Ihrem Dashboard aus. Sie können entweder eine Datei hochladen (per Drag-and-Drop oder Klicken zum Durchsuchen) oder eine aktive Umfrage auswählen aus Ihrem Konto.

Beim Importieren von einer aktiven SmartInterview-Umfrage passt sich die Konfiguration automatisch an die Datenstruktur der Plattform an:

2. Konfiguration

Sobald Ihre Datei hochgeladen wurde, öffnet sich ein Konfigurationsdialog:

"Konfiguration de la classification" — Konfigurieren Sie die Klassifikationsparameter, bevor Sie den Vorgang starten.

Blattauswahl

Verwenden Sie das "Feuille avec les données" Dropdown, um das Blatt mit Ihren Teilnehmerdaten auszuwählen. SmartInterview zeigt eine Excel-Vorschau (5 Zeilen), damit Sie sicherstellen können, dass Sie das richtige Blatt ausgewählt haben.

Wenn Ihre Datei keine Kopfzeile hat, klicken Sie auf "+ Pas d'en-tete", um dem System mitzuteilen, dass die erste Zeile Daten und keine Spaltennamen sind.

Spaltenzuordnung

Unter "Selection des colonnes" müssen zwei erforderliche Spalten zugeordnet werden:

  • Respondent-ID-Spalte (blaue Kennzeichnung) — Die eindeutige Kennung für jeden Teilnehmer (z. B. Respondent_IDuser_idRespondent_Serial)

  • Antworten-Spalte (lila Kennzeichnung) — Die Spalte, die offene Antworten zur Klassifizierung enthält (z. B. Q1Q2question_id)

SmartInterview erkennt automatisch häufige Spaltennamen, Sie können die Auswahl jedoch jederzeit mit den Dropdowns überschreiben.

Themenblatt

Unter "Feuille avec les topics", auswählen Sie das Blatt mit Ihrer vordefinierten Kodeliste. Wenn Ihre Excel-Datei ein Blatt namens Topics mit zwei Spalten (Valeur und Libelle) enthält, wird es automatisch erkannt.

Klicken Sie auf "Charger les colonnes", um die Themen aus dem ausgewählten Blatt zu laden und anzuzeigen. Das System zeigt, wie viele Themen erkannt wurden (z. B. "45 Themen erkannt im Blatt Topics").

Falls kein Themenblatt existiert, wählen Sie "Aucune (detection automatique)" und SmartInterview generiert automatisch Codes für Sie (siehe Code-Generierung).

3. Code-Generierung

SmartInterview bietet zwei Ansätze zur Definition Ihrer Kodeliste:

A. Vorhandene Codes importieren

Wenn Ihre Excel-Datei bereits ein Topics-Blatt mit einer vordefinierten Kodeliste enthält, liest SmartInterview diese direkt. Das erwartete Format ist:

Valeur

Libelle

1

Qualite du produit / Produktqualitat / Product quality

2

Service client / Kundendienst / Customer service

3

Rapport qualite-prix / Preis-Leistung / Value for money

4

Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use

5

Livraison / Lieferung / Delivery

...

...

SmartInterview unterstützt mehrsprachige Themenlabels, die durch / getrennt sind (z. B. Qualite du produit / Produktqualitat / Product quality), was eine sprachübergreifende Zuordnung erlaubt. Eine Antwort eines Befragten wie "Die Qualitat ist hervorragend" in Deutsch wird korrekt einem Thema zugeordnet, das ursprünglich auf Französisch als "Qualite du produit" bezeichnet wurde.

B. Codes automatisch generieren

Wenn keine Kodeliste verfügbar ist, klicken Sie auf "Generer le plan de code". Die KI analysiert Ihre Antworten und leitet die repräsentativsten Themen ab. Sie können diese dann überprüfen und bearbeiten, bevor Sie die Klassifikation starten.

Sobald erstellt, gelangen Sie in den Themen-Editor, in dem Sie:

  • Themen umbenennen können, indem Sie auf ihr Label klicken

  • Themen neu ordnen können, durch Ziehen (Griff links)

  • Themen löschen können, durch das Papierkorb-Symbol

  • Neue Themen hinzufügen mit der "+ Ajouter un topic" Taste

  • Die gesamte Kodeliste regenerieren können, falls erforderlich

4. Codezählung & Schätzung

Bevor die volle Klassifikation durchgeführt wird, gibt SmartInterview ungefähre Codezählungen, also eine Schätzung, wie viele Befragte jedem Thema zugeordnet werden.

Diese Schätzungen erscheinen als farbige Abzeichen neben jedem Thema:

  • Grüne Zahlen kennzeichnen Themen mit bedeutendem Antwortvolumen

  • Rote/niedrige Zahlen heben Themen hervor, die möglicherweise unterrepräsentiert sind

Eine Mitteilung erinnert Sie: "Ungefähre Schätzungen: klassifizieren, um genaue Werte zu erhalten."

Diese Vorschau hilft Ihnen dabei, Ihre Kodeliste vor dem endgültigen Festlegen zu verfeinern—unterrepräsentierte Themen zusammenzuführen, breite Themen zu teilen oder irrelevante Codes zu entfernen.

5. Code-Löschung & Bearbeitung

Der Themen-Editor gibt Ihnen vollständige Kontrolle über Ihre Kodeliste:

  • Ein Thema löschen: Klicken Sie auf das Papierkorb-Symbol neben einem Thema. Die Nummerierung passt sich automatisch an.

  • Ein Thema umbenennen: Klicken Sie auf den Text des Labels und bearbeiten Sie es direkt.

  • Themen neu ordnen: Ziehen Sie den Griff, um die Rangfolge zu ändern.

  • Thema hinzufügen: Verwenden Sie den "+ Ajouter un topic" Button unten in der Liste.

Alle Änderungen werden sofort im Editor wiedergegeben. Die endgültige Kodeliste wird während der Klassifikation verwendet und im Ausgabedokument exportiert.

6. Mehrere offene Fragen

Wenn Ihre Datei mehrere offene Spalten enthält (z. B. Q1_1Q2_1Q3_1), können Sie alle in einem einzigen Vorgang klassifizieren.

So funktioniert es

  1. Konfigurieren Sie die erste Spalte wie oben beschrieben

  1. Klicken Sie auf "Colonne suivante", um eine weitere Spalte hinzuzufügen

  2. Spaltenregisterkarten erscheinen oben im Dialog (z. B. Q1_1Q2_1)

  3. Konfigurieren Sie jede Spalte unabhängig: Wählen Sie die Antwortspalte, das Themenblatt und die Einstellungen

  4. Klicken Sie auf "Lancer X classifications", um alle Spalten auf einmal zu starten

Jede Spalte kann ihr eigenes Themenblatt und Einstellungen haben. Ein grünes Häkchen erscheint auf abgeschlossenen Spalten-Registerkarten.

SmartInterview verarbeitet jede Spalte als separaten Klassifikationsauftrag und lässt sie parallel laufen. Sie können den Fortschritt jeder einzelnen verfolgen.

7. Toleranzniveau

Der "Seuil de tolerance" Schieberegler (Bereich: 1 bis 5) kontrolliert, wie aggressiv die KI Codes Antworten zuordnet.

Stufe

Verhalten

1

Konservativ: Weniger Codes pro Antwort zugeordnet. Nur hochsichere Treffer.

3

Ausgewogen (Standard): Guter Kompromiss zwischen Präzision und Vollständigkeit.

5

Locker: Mehr Codes pro Antwort zugeordnet. Erfassen schwächerer Assoziationen.

Die Erhöhung der Toleranz erhöht die Zahl der pro Antwort zugewiesenen Codes. Eine höhere Toleranz ist nützlich, wenn Teilnehmer lange, mehrthemenantworten geben und Sie jedes Detail erfassen möchten. Eine niedrigere Toleranz ist besser für kurze Antworten oder wenn Präzision wichtiger als Abdeckung ist.

8. Sentiment-Analyse

SmartInterview führt automatisch Sentiment-Analyse neben der Themenklassifizierung durch. Für jeden einem Datensatz zugewiesenen Code bestimmt die KI, ob der Ton des Befragten:

  • Positiv

  • Negativ

  • Neutral

Sentiment-Ergebnisse werden als eigene Spalten in der Ausgabedatei hinzugefügt (siehe Excel-Ausgabestruktur), was es erleichtert, Themen nach Sentiment in Ihrem Analysetool zu kreuztabulieren.

Spezielle Fälle wie "Don't know" oder "Other" werden immer als Neutral klassifiziert.

9. Klassifikationen ausführen & Wartezeit

Sobald Sie auf "Confirmer et lancer la classification" (oder "Confirmer et classifier" aus dem Themeneditor) klicken, wird die Klassifikation im Hintergrund verarbeitet.

Hintergrundverarbeitung

Klassifikationen werden in Ihrer Sitzung ausgeführt— Sie können zu anderen Seiten navigieren, an anderen Umfragen arbeiten oder zusätzliche Klassifikationen konfigurieren, während der Prozess läuft. Eine schwebende Anzeige am unteren Bildschirmrand erinnert Sie daran:

Klicken Sie auf die Anzeige, um die Klassifikationsschublade zu öffnen, die den Echtzeit-Fortschritt für alle aktiven Aufträge zeigt:

Für jeden Auftrag können Sie sehen:

  • Dateiname und Spalte , die klassifiziert wird (z. B. Survey_Raw.xlsxColumn: Q1_1)

  • Fortschrittsanzeige mit Prozentsatz (0% bis 100%)

  • Geschätzte verbleibende Zeit (z. B. ~2m30s)

  • Abbrechen-Schaltfläche (rotes X), um eine laufende Klassifikation zu stoppen

Für Mehrfachspaltenklassifikationen zeigt ein Übersichtsheader den Gesamtfortschritt des Batches: "Multi-classification (0/2 erledigt)".

Typische Verarbeitungszeiten

Die Verarbeitungszeit hängt von der Anzahl der Befragten und dem Toleranzniveau ab. Als allgemeine Richtlinie:

Befragte

Ungefähre Zeit

100

~2 Minuten

500

~3 Minuten

1,000+

~5 Minuten

Sie müssen nicht die Seite offen halten. Die Klassifikation läuft serverseitig und die Ergebnisse stehen zur Verfügung, wenn Sie zurückkommen.

10. Top-Themen

Sobald die Klassifikation abgeschlossen ist, enthält die Ausgabedatei ein "Top Topics" Blatt, das die Themen nach Häufigkeit über alle Befragten hinweg einordnet.

Rang

Libelle

Anzahl

1

Service client / Kundendienst / Customer service

312

2

Qualite du produit / Produktqualitat / Product quality

287

3

Rapport qualite-prix / Preis-Leistung / Value for money

145

4

Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use

98

5

Livraison / Lieferung / Delivery

73

6

Ne sait pas

42

7

Autre

18

Dies gibt Ihnen einen sofortigen Überblick über die häufigst erwähnten Themen, sortiert nach Anzahl. Verwenden Sie dieses Blatt, um schnell dominante Themen zu identifizieren, neue Probleme zu entdecken, und Ihre Analyse zu priorisieren, ohne hunderte von Antworten manuell durchlesen zu müssen.

11. Sonderfälle

SmartInterview bewältigt verschiedene Sonderfälle automatisch:

Mehrsprachige Antworten

Themenlabels können mehrere Sprachvarianten enthalten, die durch / getrennt sind. Zum Beispiel:

Qualite du produit / Produktqualitat / Product quality / Qualita del prodotto

Die KI führt sprachübergreifendes semantisches Matching durch. Eine Antwort wie "Die Lieferung war sehr schnell" in Deutsch wird korrekt einem Thema zugeordnet, das als "Livraison / Lieferung / Delivery" bezeichnet ist. Ebenso wird eine italienische Antwort wie "Ottimo servizio clienti" dem Thema "Service client / Kundendienst / Customer service" zugeordnet.

Dies ist besonders nützlich in mehrsprachigen Märkten (z. B. Schweiz mit FR/DE/IT/EN), wo Teilnehmer in ihrer bevorzugten Sprache antworten, aber Themen zu einer einzigen Kodeliste zusammengeführt werden müssen.

12. Excel-Ausgabestruktur

Die klassifizierte Datei bewahrt Ihre Originaldaten und fügt neue Spalten hinzu:

Hauptdatenseite (z. B. FilesQO)

Respondent_ID

Q1_1a

Q1_1aCOMM1

Q1_1aCOMM1_SENTIMENT

Q1_1aCOMM2

Q1_1aCOMM2_SENTIMENT

1001

J'adore la qualite du produit, le service est toujours rapide et efficace

1

Positiv

2

Positiv

1002

Le prix est trop eleve par rapport a ce qu'on recoit, franchement decevant

3

Negativ



1003

Tres facile a utiliser, l'interface est claire et intuitive

4

Positiv



1004

Je ne sais pas

6

Neutral



1005

Die Lieferung war sehr schnell, aber die Verpackung war beschadigt

5

Positiv

1

Negativ

1006

Ottimo servizio clienti, sempre disponibili e cortesi

2

Positiv



1007

Nothing special to say, it does the job

7

Neutral



  • Q1_1a ist die ursprüngliche wörtliche Spalte (offene Antworten)

  • Q1_1aCOMM1Q1_1aCOMM2 enthalten die Themen-Kodenzahlen (Entsprechend dem Valeur im Themenblatt). Der Spaltenname leitet sich von der Antwortspalte ab: Q1_1a + COMM + Rang.

  • Q1_1aCOMM1_SENTIMENTQ1_1aCOMM2_SENTIMENT enthalten das Sentiment-Label für jede Code-Zuweisung

  • Mehrere COMM/SENTIMENT-Spaltenpaare werden erstellt, wenn eine Antwort mehreren Themen entspricht

Themenblatt

Valeur

Libelle

1

Qualite du produit / Produktqualitat / Product quality

2

Service client / Kundendienst / Customer service

3

Rapport qualite-prix / Preis-Leistung / Value for money

4

Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use

5

Livraison / Lieferung / Delivery

6

Ne sait pas

7

Autre

Top-Themenblatt

Rang

Libelle

Anzahl

1

Service client / Kundendienst / Customer service

312

2

Qualite du produit / Produktqualitat / Product quality

287

3

Rapport qualite-prix / Preis-Leistung / Value for money

145

4

Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use

98

5

Livraison / Lieferung / Delivery

73

13. Qualitätssicherung

SmartInterview umfasst mehrere Schutzmaßnahmen zur Sicherstellung der Klassifikationsqualität:

  • Vorschau vor dem Start: Die Excel-Vorschau und Themenabschätzung ermöglichen es Ihnen, Ihre Konfiguration vor dem Start zu überprüfen.

  • Jederzeit abbrechen: Laufende Klassifikationen können über die Fortschrittsanzeige abgebrochen werden. Das System stoppt kontrolliert und setzt reservierte Ressourcen frei.

  • Neu klassifizieren: Wenn die Ergebnisse unbefriedigend sind, passen Sie Ihre Kodeliste oder Toleranz an und führen Sie die Klassifikation mit derselben Datei erneut durch.

  • Matching: Die KI verwendet semantische Ähnlichkeit, nicht nur Keyword-Matching. Synonyme, Abkürzungen und mehrsprachige Varianten werden automatisch erkannt.

  • Mehrere parallele Aufforderungen: Die Toleranzeinstellung führt mehrere KI-Durchgänge pro Antwort durch und fasst die Ergebnisse zusammen, um die Varianz zu reduzieren und die Abdeckung zu verbessern.

14. Berichteter ROI

Der Pulse-Klassifikator verringert dramatisch die benötigte Zeit für die Kodierung offener Antworten:

Kennzahl

Manuelle Kodierung

SmartInterview

100 Antworten

1 - 2 Stunden

~2 Minuten

500 Antworten

4 - 8 Stunden

~3 Minuten

1,000 Antworten

1 - 2 Tage

~5 Minuten

Kodelistenerstellung

1 - 3 Stunden

Automatisch

Sentiment-Markierung

Separater Durchgang

Eingeschlossen

Multi-Fragen-Dateien

Sequenziell

Parallel

Über die Zeitersparnis hinaus bietet die automatisierte Klassifikation Konsistenz—jede Antwort wird nach denselben Kriterien bewertet, wodurch die Variabilität zwischen Codierern eliminiert wird, die die manuelle Kodierung beeinflusst.

Nächste Schritte

Sie sind jetzt bereit, offene Antworten mit SmartInterview zu klassifizieren.

  1. Datei hochladen oder eine aktive Umfrage auswählen

  2. Ihre Spalten und Themen konfigurieren

  3. Geschätzte Codeanzahlen überprüfen

  4. Klassifikation starten und im Hintergrund laufen lassen

  5. Ihr klassifiziertes Excel-Dokument herunterladen

Wenn Sie Hilfe benötigen oder fortgeschrittene Fragen haben, kontaktieren Sie uns unter info@smartinterview.ai.