Offene Codierung - smartinterview zur Extraktion von verbatim

Verfasst von

Matthieu SAUSSAYE

Veröffentlicht

18.02.2026

Inhalt

Offene Codierung

Der Pulse-Klassifikator von SmartInterview ist ein KI-gestütztes Werkzeug, das die Kodierung von offenen Umfrageantworten automatisiert. Er passt sich an Excel-Dateien (.xlsx, .xls), SPSS-Format (.sav) und In-Platform SmartInterview-Umfragen an und ermöglicht es Ihnen, Tausende von wörtlichen Antworten in Minuten statt Stunden zu klassifizieren.

Es bewahrt Ihre Originaldaten unverändert und fügt strukturierte Klassifikationsspalten (Codes und Sentiment) hinzu, wodurch es sofort mit Ihren bestehenden Analyse-Workflows kompatibel ist.

Wichtige Funktionen umfassen:

Automatische Codegenerierung aus den Antworten der Befragten
Import vordefinierter Kodelisten aus Ihrem Excel-Themenblatt
Sentiment-Analyse (Positiv / Negativ / Neutral) pro Code
Mehrspaltige Klassifikation für Dateien mit mehreren offenen Fragen
Echtzeit-Überwachung des Fortschritts damit Sie an anderen Aufgaben arbeiten können, während die Klassifikation läuft
Geschätzte Codeanzahlen bevor die volle Klassifikation gestartet wird

1. Erste Schritte

Unterstützte Eingabeformate

Format	Beschreibung
.xlsx	Microsoft Excel 2007+ (primäres Format)
.xls	Altes Excel 97-2003
.sav	SPSS-Datendateien
In-Platform-Umfrage	Aktive SmartInterview-Umfragen (automatisch importiert)

Um zu beginnen, navigieren Sie zur Pulse-Klassifikator Seite von Ihrem Dashboard aus. Sie können entweder eine Datei hochladen (per Drag-and-Drop oder Klicken zum Durchsuchen) oder eine aktive Umfrage auswählen aus Ihrem Konto.

Beim Importieren von einer aktiven SmartInterview-Umfrage passt sich die Konfiguration automatisch an die Datenstruktur der Plattform an:

2. Konfiguration

Sobald Ihre Datei hochgeladen wurde, öffnet sich ein Konfigurationsdialog:

"Konfiguration de la classification" — Konfigurieren Sie die Klassifikationsparameter, bevor Sie den Vorgang starten.

Blattauswahl

Verwenden Sie das "Feuille avec les données" Dropdown, um das Blatt mit Ihren Teilnehmerdaten auszuwählen. SmartInterview zeigt eine Excel-Vorschau (5 Zeilen), damit Sie sicherstellen können, dass Sie das richtige Blatt ausgewählt haben.

Wenn Ihre Datei keine Kopfzeile hat, klicken Sie auf "+ Pas d'en-tete", um dem System mitzuteilen, dass die erste Zeile Daten und keine Spaltennamen sind.

Spaltenzuordnung

Unter "Selection des colonnes" müssen zwei erforderliche Spalten zugeordnet werden:

Respondent-ID-Spalte (blaue Kennzeichnung) — Die eindeutige Kennung für jeden Teilnehmer (z. B. Respondent_ID, user_id, Respondent_Serial)
Antworten-Spalte (lila Kennzeichnung) — Die Spalte, die offene Antworten zur Klassifizierung enthält (z. B. Q1, Q2, question_id)

SmartInterview erkennt automatisch häufige Spaltennamen, Sie können die Auswahl jedoch jederzeit mit den Dropdowns überschreiben.

Themenblatt

Unter "Feuille avec les topics", auswählen Sie das Blatt mit Ihrer vordefinierten Kodeliste. Wenn Ihre Excel-Datei ein Blatt namens Topics mit zwei Spalten (Valeur und Libelle) enthält, wird es automatisch erkannt.

Klicken Sie auf "Charger les colonnes", um die Themen aus dem ausgewählten Blatt zu laden und anzuzeigen. Das System zeigt, wie viele Themen erkannt wurden (z. B. "45 Themen erkannt im Blatt Topics").

Falls kein Themenblatt existiert, wählen Sie "Aucune (detection automatique)" und SmartInterview generiert automatisch Codes für Sie (siehe Code-Generierung).

3. Code-Generierung

SmartInterview bietet zwei Ansätze zur Definition Ihrer Kodeliste:

A. Vorhandene Codes importieren

Wenn Ihre Excel-Datei bereits ein Topics-Blatt mit einer vordefinierten Kodeliste enthält, liest SmartInterview diese direkt. Das erwartete Format ist:

Valeur	Libelle
1	Qualite du produit / Produktqualitat / Product quality
2	Service client / Kundendienst / Customer service
3	Rapport qualite-prix / Preis-Leistung / Value for money
4	Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use
5	Livraison / Lieferung / Delivery
...	...

SmartInterview unterstützt mehrsprachige Themenlabels, die durch / getrennt sind (z. B. Qualite du produit / Produktqualitat / Product quality), was eine sprachübergreifende Zuordnung erlaubt. Eine Antwort eines Befragten wie "Die Qualitat ist hervorragend" in Deutsch wird korrekt einem Thema zugeordnet, das ursprünglich auf Französisch als "Qualite du produit" bezeichnet wurde.

B. Codes automatisch generieren

Wenn keine Kodeliste verfügbar ist, klicken Sie auf "Generer le plan de code". Die KI analysiert Ihre Antworten und leitet die repräsentativsten Themen ab. Sie können diese dann überprüfen und bearbeiten, bevor Sie die Klassifikation starten.

Sobald erstellt, gelangen Sie in den Themen-Editor, in dem Sie:

Themen umbenennen können, indem Sie auf ihr Label klicken
Themen neu ordnen können, durch Ziehen (Griff links)
Themen löschen können, durch das Papierkorb-Symbol
Neue Themen hinzufügen mit der "+ Ajouter un topic" Taste
Die gesamte Kodeliste regenerieren können, falls erforderlich

4. Codezählung & Schätzung

Bevor die volle Klassifikation durchgeführt wird, gibt SmartInterview ungefähre Codezählungen, also eine Schätzung, wie viele Befragte jedem Thema zugeordnet werden.

Diese Schätzungen erscheinen als farbige Abzeichen neben jedem Thema:

Grüne Zahlen kennzeichnen Themen mit bedeutendem Antwortvolumen
Rote/niedrige Zahlen heben Themen hervor, die möglicherweise unterrepräsentiert sind

Eine Mitteilung erinnert Sie: "Ungefähre Schätzungen: klassifizieren, um genaue Werte zu erhalten."

Diese Vorschau hilft Ihnen dabei, Ihre Kodeliste vor dem endgültigen Festlegen zu verfeinern—unterrepräsentierte Themen zusammenzuführen, breite Themen zu teilen oder irrelevante Codes zu entfernen.

5. Code-Löschung & Bearbeitung

Der Themen-Editor gibt Ihnen vollständige Kontrolle über Ihre Kodeliste:

Ein Thema löschen: Klicken Sie auf das Papierkorb-Symbol neben einem Thema. Die Nummerierung passt sich automatisch an.
Ein Thema umbenennen: Klicken Sie auf den Text des Labels und bearbeiten Sie es direkt.
Themen neu ordnen: Ziehen Sie den Griff, um die Rangfolge zu ändern.
Thema hinzufügen: Verwenden Sie den "+ Ajouter un topic" Button unten in der Liste.

Alle Änderungen werden sofort im Editor wiedergegeben. Die endgültige Kodeliste wird während der Klassifikation verwendet und im Ausgabedokument exportiert.

6. Mehrere offene Fragen

Wenn Ihre Datei mehrere offene Spalten enthält (z. B. Q1_1, Q2_1, Q3_1), können Sie alle in einem einzigen Vorgang klassifizieren.

So funktioniert es

Konfigurieren Sie die erste Spalte wie oben beschrieben

Klicken Sie auf "Colonne suivante", um eine weitere Spalte hinzuzufügen
Spaltenregisterkarten erscheinen oben im Dialog (z. B. Q1_1, Q2_1)
Konfigurieren Sie jede Spalte unabhängig: Wählen Sie die Antwortspalte, das Themenblatt und die Einstellungen
Klicken Sie auf "Lancer X classifications", um alle Spalten auf einmal zu starten

Jede Spalte kann ihr eigenes Themenblatt und Einstellungen haben. Ein grünes Häkchen erscheint auf abgeschlossenen Spalten-Registerkarten.

SmartInterview verarbeitet jede Spalte als separaten Klassifikationsauftrag und lässt sie parallel laufen. Sie können den Fortschritt jeder einzelnen verfolgen.

7. Toleranzniveau

Der "Seuil de tolerance" Schieberegler (Bereich: 1 bis 5) kontrolliert, wie aggressiv die KI Codes Antworten zuordnet.

Stufe	Verhalten
1	Konservativ: Weniger Codes pro Antwort zugeordnet. Nur hochsichere Treffer.
3	Ausgewogen (Standard): Guter Kompromiss zwischen Präzision und Vollständigkeit.
5	Locker: Mehr Codes pro Antwort zugeordnet. Erfassen schwächerer Assoziationen.

Die Erhöhung der Toleranz erhöht die Zahl der pro Antwort zugewiesenen Codes. Eine höhere Toleranz ist nützlich, wenn Teilnehmer lange, mehrthemenantworten geben und Sie jedes Detail erfassen möchten. Eine niedrigere Toleranz ist besser für kurze Antworten oder wenn Präzision wichtiger als Abdeckung ist.

8. Sentiment-Analyse

SmartInterview führt automatisch Sentiment-Analyse neben der Themenklassifizierung durch. Für jeden einem Datensatz zugewiesenen Code bestimmt die KI, ob der Ton des Befragten:

Positiv
Negativ
Neutral

Sentiment-Ergebnisse werden als eigene Spalten in der Ausgabedatei hinzugefügt (siehe Excel-Ausgabestruktur), was es erleichtert, Themen nach Sentiment in Ihrem Analysetool zu kreuztabulieren.

Spezielle Fälle wie "Don't know" oder "Other" werden immer als Neutral klassifiziert.

9. Klassifikationen ausführen & Wartezeit

Sobald Sie auf "Confirmer et lancer la classification" (oder "Confirmer et classifier" aus dem Themeneditor) klicken, wird die Klassifikation im Hintergrund verarbeitet.

Hintergrundverarbeitung

Klassifikationen werden in Ihrer Sitzung ausgeführt— Sie können zu anderen Seiten navigieren, an anderen Umfragen arbeiten oder zusätzliche Klassifikationen konfigurieren, während der Prozess läuft. Eine schwebende Anzeige am unteren Bildschirmrand erinnert Sie daran:

Klicken Sie auf die Anzeige, um die Klassifikationsschublade zu öffnen, die den Echtzeit-Fortschritt für alle aktiven Aufträge zeigt:

Für jeden Auftrag können Sie sehen:

Dateiname und Spalte , die klassifiziert wird (z. B. Survey_Raw.xlsx, Column: Q1_1)
Fortschrittsanzeige mit Prozentsatz (0% bis 100%)
Geschätzte verbleibende Zeit (z. B. ~2m30s)
Abbrechen-Schaltfläche (rotes X), um eine laufende Klassifikation zu stoppen

Für Mehrfachspaltenklassifikationen zeigt ein Übersichtsheader den Gesamtfortschritt des Batches: "Multi-classification (0/2 erledigt)".

Typische Verarbeitungszeiten

Die Verarbeitungszeit hängt von der Anzahl der Befragten und dem Toleranzniveau ab. Als allgemeine Richtlinie:

Befragte	Ungefähre Zeit
100	~2 Minuten
500	~3 Minuten
1,000+	~5 Minuten

Sie müssen nicht die Seite offen halten. Die Klassifikation läuft serverseitig und die Ergebnisse stehen zur Verfügung, wenn Sie zurückkommen.

10. Top-Themen

Sobald die Klassifikation abgeschlossen ist, enthält die Ausgabedatei ein "Top Topics" Blatt, das die Themen nach Häufigkeit über alle Befragten hinweg einordnet.

Rang	Libelle	Anzahl
1	Service client / Kundendienst / Customer service	312
2	Qualite du produit / Produktqualitat / Product quality	287
3	Rapport qualite-prix / Preis-Leistung / Value for money	145
4	Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use	98
5	Livraison / Lieferung / Delivery	73
6	Ne sait pas	42
7	Autre	18

Dies gibt Ihnen einen sofortigen Überblick über die häufigst erwähnten Themen, sortiert nach Anzahl. Verwenden Sie dieses Blatt, um schnell dominante Themen zu identifizieren, neue Probleme zu entdecken, und Ihre Analyse zu priorisieren, ohne hunderte von Antworten manuell durchlesen zu müssen.

11. Sonderfälle

SmartInterview bewältigt verschiedene Sonderfälle automatisch:

Mehrsprachige Antworten

Themenlabels können mehrere Sprachvarianten enthalten, die durch / getrennt sind. Zum Beispiel:

Qualite du produit / Produktqualitat / Product quality / Qualita del prodotto

Die KI führt sprachübergreifendes semantisches Matching durch. Eine Antwort wie "Die Lieferung war sehr schnell" in Deutsch wird korrekt einem Thema zugeordnet, das als "Livraison / Lieferung / Delivery" bezeichnet ist. Ebenso wird eine italienische Antwort wie "Ottimo servizio clienti" dem Thema "Service client / Kundendienst / Customer service" zugeordnet.

Dies ist besonders nützlich in mehrsprachigen Märkten (z. B. Schweiz mit FR/DE/IT/EN), wo Teilnehmer in ihrer bevorzugten Sprache antworten, aber Themen zu einer einzigen Kodeliste zusammengeführt werden müssen.

12. Excel-Ausgabestruktur

Die klassifizierte Datei bewahrt Ihre Originaldaten und fügt neue Spalten hinzu:

Hauptdatenseite (z. B. `FilesQO`)

Respondent_ID	Q1_1a	Q1_1aCOMM1	Q1_1aCOMM1_SENTIMENT	Q1_1aCOMM2	Q1_1aCOMM2_SENTIMENT
1001	J'adore la qualite du produit, le service est toujours rapide et efficace	1	Positiv	2	Positiv
1002	Le prix est trop eleve par rapport a ce qu'on recoit, franchement decevant	3	Negativ
1003	Tres facile a utiliser, l'interface est claire et intuitive	4	Positiv
1004	Je ne sais pas	6	Neutral
1005	Die Lieferung war sehr schnell, aber die Verpackung war beschadigt	5	Positiv	1	Negativ
1006	Ottimo servizio clienti, sempre disponibili e cortesi	2	Positiv
1007	Nothing special to say, it does the job	7	Neutral

Q1_1a ist die ursprüngliche wörtliche Spalte (offene Antworten)
Q1_1aCOMM1, Q1_1aCOMM2 enthalten die Themen-Kodenzahlen (Entsprechend dem Valeur im Themenblatt). Der Spaltenname leitet sich von der Antwortspalte ab: Q1_1a + COMM + Rang.
Q1_1aCOMM1_SENTIMENT, Q1_1aCOMM2_SENTIMENT enthalten das Sentiment-Label für jede Code-Zuweisung
Mehrere COMM/SENTIMENT-Spaltenpaare werden erstellt, wenn eine Antwort mehreren Themen entspricht

Themenblatt

Valeur	Libelle
1	Qualite du produit / Produktqualitat / Product quality
2	Service client / Kundendienst / Customer service
3	Rapport qualite-prix / Preis-Leistung / Value for money
4	Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use
5	Livraison / Lieferung / Delivery
6	Ne sait pas
7	Autre

Top-Themenblatt

Rang	Libelle	Anzahl
1	Service client / Kundendienst / Customer service	312
2	Qualite du produit / Produktqualitat / Product quality	287
3	Rapport qualite-prix / Preis-Leistung / Value for money	145
4	Facilite d'utilisation / Benutzerfreundlichkeit / Ease of use	98
5	Livraison / Lieferung / Delivery	73

13. Qualitätssicherung

SmartInterview umfasst mehrere Schutzmaßnahmen zur Sicherstellung der Klassifikationsqualität:

Vorschau vor dem Start: Die Excel-Vorschau und Themenabschätzung ermöglichen es Ihnen, Ihre Konfiguration vor dem Start zu überprüfen.
Jederzeit abbrechen: Laufende Klassifikationen können über die Fortschrittsanzeige abgebrochen werden. Das System stoppt kontrolliert und setzt reservierte Ressourcen frei.
Neu klassifizieren: Wenn die Ergebnisse unbefriedigend sind, passen Sie Ihre Kodeliste oder Toleranz an und führen Sie die Klassifikation mit derselben Datei erneut durch.
Matching: Die KI verwendet semantische Ähnlichkeit, nicht nur Keyword-Matching. Synonyme, Abkürzungen und mehrsprachige Varianten werden automatisch erkannt.
Mehrere parallele Aufforderungen: Die Toleranzeinstellung führt mehrere KI-Durchgänge pro Antwort durch und fasst die Ergebnisse zusammen, um die Varianz zu reduzieren und die Abdeckung zu verbessern.

14. Berichteter ROI

Der Pulse-Klassifikator verringert dramatisch die benötigte Zeit für die Kodierung offener Antworten:

Kennzahl	Manuelle Kodierung	SmartInterview
100 Antworten	1 - 2 Stunden	~2 Minuten
500 Antworten	4 - 8 Stunden	~3 Minuten
1,000 Antworten	1 - 2 Tage	~5 Minuten
Kodelistenerstellung	1 - 3 Stunden	Automatisch
Sentiment-Markierung	Separater Durchgang	Eingeschlossen
Multi-Fragen-Dateien	Sequenziell	Parallel

Über die Zeitersparnis hinaus bietet die automatisierte Klassifikation Konsistenz—jede Antwort wird nach denselben Kriterien bewertet, wodurch die Variabilität zwischen Codierern eliminiert wird, die die manuelle Kodierung beeinflusst.

Nächste Schritte

Sie sind jetzt bereit, offene Antworten mit SmartInterview zu klassifizieren.

Datei hochladen oder eine aktive Umfrage auswählen
Ihre Spalten und Themen konfigurieren
Geschätzte Codeanzahlen überprüfen
Klassifikation starten und im Hintergrund laufen lassen
Ihr klassifiziertes Excel-Dokument herunterladen

Wenn Sie Hilfe benötigen oder fortgeschrittene Fragen haben, kontaktieren Sie uns unter info@smartinterview.ai.

Startseite

Fallstudien

Blog

Contact Us

Offene Codierung - smartinterview zur Extraktion von verbatim

Offene Codierung