Die fünf Transkriptionsarten in der qualitativen Forschung sind das vollständige Verbatim, das bereinigte Verbatim (intelligentes Verbatim), die bearbeitete Transkription, die phonetische Transkription und die Jefferson-Transkription. Die richtige Wahl hängt davon ab, wie Sie an die Analyse herangehen. Das bereinigte Verbatim eignet sich gut für die thematische Analyse und die Grounded Theory, während die Diskursanalyse und die Konversationsanalyse das vollständige Verbatim oder die Jefferson-Konventionen erfordern.

Ich erläutere alle Arten im Detail und helfe Ihnen, die richtige für Ihr Forschungsprojekt auszuwählen.

Warum die Transkriptionsart wichtiger ist als die Transkriptionsgeschwindigkeit

Ich habe einmal eine thematische Analyse mit 30 Stunden an Fokusgruppenaufnahmen durchgeführt, die im vollständigen Verbatim transkribiert waren. Jedes Füllwort und jeder Fehlstart wurde erfasst. Obwohl die Transkripte gründlich waren, ließen sie sich kaum codieren. Ich musste Stunden damit verbringen, mich durch Stotterer und halb beendete Sätze zu arbeiten, anstatt Muster zu erkennen.

Da das vollständige Verbatim alles erfasst, eignet es sich hervorragend für die Gesprächsanalyse. Für die thematische Codierung müssen Sie jedoch zusätzliche Details vermeiden, die Ihre Analyse verlangsamen. Ich habe es auf die harte Tour gelernt.

Deshalb kann ich heute mit Überzeugung sagen, dass die Transkriptionsart einen größeren Einfluss auf Ihre Analyse hat als die Bearbeitungszeit. Ein in 48 Stunden geliefertes Transkript im sauberen Verbatim dient einer Theoriestudie weitaus besser als ein über Nacht geliefertes Transkript im vollständigen Verbatim. Die von Ihnen gewählte Art bestimmt, was in Ihrer Studie als Daten gilt, und diese Entscheidung prägt, wie Sie codieren und wie Gutachter Ihre Arbeit bewerten.

📚 Lesen Sie auch:

Die Methodik der qualitativen Forschung und die Rolle der Transkription

Die fünf Transkriptionsarten in der qualitativen Forschung

Diese fünf Arten reichen vom Erfassen jedes Lauts bis zum Herausdestillieren der reinen Kernbedeutung. Der Erfolg Ihrer qualitativen Datentranskription hängt davon ab, die Art an Ihre Analysemethode anzupassen.

1. Vollständiges Verbatim (Full Verbatim)

Wie bereits erwähnt, erfasst das vollständige Verbatim jeden Laut der Aufnahme: Füllwörter, Fehlstarts, Stotterer, nonverbale Signale wie Lachen und Seufzen, gemessene Pausen und überlappende Sprache. Nichts wird bereinigt.

Dieser Detailgrad ist für Methoden erforderlich, bei denen das Wie einer Aussage genauso viel Gewicht hat wie das Was. Sowohl die Gesprächsanalyse als auch die diskursive Psychologie behandeln Sprechmuster und Sprechweise als primäre Daten. Auch die Diskursanalyse erfordert es oft, ebenso wie psychologische Studien, die das Sprechverhalten untersuchen.

Der Kompromiss ist die Zeit. für eine einzige Stunde Audio sind 4 bis 8 Stunden menschlicher Arbeit zum Transkribieren nötig im vollständigen Verbatim. Die Transkripte können dicht sein, und wenn Ihre Methode diese Granularität nicht erfordert, verlangsamt sie Ihre Codierung.

2. Sauberes Verbatim (intelligentes Verbatim)

Das saubere Verbatim entfernt Füllwörter und Fehlstarts, bewahrt jedoch alle bedeutungstragenden gesprochenen Inhalte. Es bietet Ihnen das Beste aus beiden Welten und ist damit die Standardoption für die meiste qualitative Forschung.

Sowohl die thematische Analyse als auch die Grounded Theory profitieren von sauberen, gut lesbaren Transkripten, die den Fokus wieder auf die Bedeutung legen. Auch phänomenologische Studien eignen sich gut dafür, insbesondere wenn sich die Forschung eher auf die Sprache der gelebten Erfahrung als auf die Sprechmechanik konzentriert. Wenn Sie an einer Dissertation arbeiten, erwartet Ihr Prüfungsausschuss mit hoher Wahrscheinlichkeit das saubere Verbatim.

Doch es ist nicht ohne Grenzen. Mit einer Transkription im sauberen Verbatim verlieren Sie Daten zu Sprechmustern. Wenn Zögern oder Sprechweisen für Ihren Bezugsrahmen wichtig sind, bewahrt das saubere Verbatim sie nicht. Wenn Sie bereits darüber nachdenken, wie Sie Ihre Codierung organisieren, Themen und Tags während der Transkription zu verwenden kann Ihnen später Zeit sparen.

3. Bearbeitete Transkription

Die bearbeitete Transkription korrigiert die Grammatik und strukturiert Sätze für eine bessere Lesbarkeit um. Das Ergebnis liest sich eher wie ein ausgefeilter Aufsatz als wie gesprochene Sprache.

Sie ist in der Politikforschung und in angewandten qualitativen Studien verbreitet, in denen Transkripte für fachfremde Leser wie Stakeholder zugänglich sein müssen. Sie eignet sich auch für berichtsfertige Zusammenfassungen und für Interviewinhalte, die für die Öffentlichkeit bestimmt sind.

Allerdings verändert die Bearbeitung die ursprüngliche Stimme der sprechenden Person, was zu einem Verzerrungseffekt durch die forschende Person führen kann. Wenn der genaue Wortlaut in Ihrer Analyse wichtiger ist, ist eine bearbeitete Transkription nicht die richtige Wahl.

4. Phonetische Transkription

Die phonetische Transkription erfasst, wie Wörter klingen, statt wie sie geschrieben werden, und verwendet dazu die Symbole des IPA (Internationales Phonetisches Alphabet). Sie erfasst Aussprache und Dialekt auf eine Weise, die die standardmäßige orthografische Transkription nicht leisten kann.

Die phonetische Transkription ist ein spezialisiertes Werkzeug für die linguistische Forschung. Sowohl soziolinguistische Studien als auch die phonologische Analyse sind darauf angewiesen, und sie wird auch in der Sprachtherapieforschung eingesetzt.

Die Einstiegshürde ist jedoch hoch. Sie benötigen eine IPA-Schulung, um diese Transkripte zu erstellen und zu lesen, und die Methode wird außerhalb der Linguistik selten verwendet. Die meisten qualitativ Forschenden benötigen sie nicht, es sei denn, ihre Studie befasst sich gezielt damit, wie Wörter ausgesprochen werden.

5. Jefferson-Transkription

Die Jefferson-Transkription ist ein Notationssystem, das auf der Transkription im vollständigen Verbatim aufbaut. Von Gail Jefferson für die Gesprächsanalyse (Conversation Analysis, CA) entwickelt, verwendet sie standardisierte Symbole, um interaktionelle Details zu codieren, die reiner Text nicht erfassen kann.

Hier sind einige der zentralen Konventionen:

Symbol Bedeutung
[ ] Überlappende Sprache
(0.5) Pausendauer in Sekunden
↑ ↓ Tonhöhenwechsel (aufwärts oder abwärts)
Unterstreichung Betonung durch die sprechende Person
= Anschluss (keine Pause zwischen den Sprecherwechseln)

Für die vollständige Sammlung der Konventionen ist Hepburn and Bolden (2017) das Standardwerk.

Die Jefferson-Transkription eignet sich am besten für die CA und für Interaktionsstudien. Auch die angewandte CA in der Gesundheits- und Bildungsforschung ist darauf angewiesen, insbesondere wenn Sprecherwechsel und Mikro-Timing für die Analyse zentral sind.

Die Lernkurve ist steil, und die Methode erfordert hochwertiges Audiomaterial als Grundlage. KI-Transkriptionstools erzeugen keine Jefferson-Notation, daher wird die Arbeit fast immer von Hand erledigt.

So wählen Sie die richtige Transkriptionsart für Ihre Studie: auf einen Blick

Diese Tabelle ordnet gängige qualitative Methoden der Art zu, die ihnen am besten dient:

Methode Empfohlene Art Begründung
Thematische Analyse Sauberes Verbatim Fokus auf Bedeutung statt Sprechweise, gut lesbar für die Codierung
Grounded Theory Sauberes Verbatim Die Codierung im ständigen Vergleich funktioniert ohne Füllwort-Rauschen schneller
Phänomenologie Sauberes oder vollständiges Verbatim Hängt davon ab, ob die Sprachmuster der gelebten Erfahrung zentral sind
Diskursanalyse Vollständiges Verbatim Sprechweise und Zögermuster werden direkt codiert
Gesprächsanalyse Jefferson Sprecherwechsel, Überlappung und Mikro-Timing sind die Daten
Narrative Analyse Vollständiges oder sauberes Verbatim Die Erzählstruktur hat Vorrang; Füllwörter in der Regel nicht
Soziolinguistische Studie Phonetisch oder Jefferson Aussprache, Akzent und Dialekt sind der Forschungsfokus

Wenn Sie nicht sicher sind, wo Ihre Studie einzuordnen ist, helfen Ihnen drei Fragen bei der Entscheidung:

  1. Hat das Wie einer Aussage genauso viel Gewicht wie das Was?
  2. Müssen fachfremde Personen (Stakeholder, Gutachter, Geldgeber) die Transkripte lesen?
  3. Wie sehen Ihr Budget und Ihr Zeitrahmen für die Transkription aus?

KI-Transkription in der qualitativen Forschung: die richtige Wahl?

Die manuelle Transkription ist einer der größten Zeitfresser in der qualitativen Forschung. Wenn Ihre Studie eine Transkription im sauberen Verbatim erfordert, müssen Sie sie nicht mehr von Hand erledigen. KI-Transkriptionstools liefern inzwischen ein Ergebnis im sauberen Verbatim mit einer Genauigkeit von über 95 % bei klaren Aufnahmen mit nur einer sprechenden Person. Das ist genau genug, um es als Arbeitsentwurf zu verwenden.

Die Genauigkeit sinkt nur, wenn die Bedingungen schwieriger werden. Faktoren wie überlappende Sprechende, starke Akzente und Hintergrundgeräusche treiben die Fehlerrate in die Höhe, und fachspezifischer Jargon kann ASR-Modelle verwirren, die nicht auf das Vokabular Ihrer Disziplin trainiert wurden. Einige Tools begegnen dem mit individuellen Glossaren und Styleguides.

Doch der wissenschaftliche Konsens hat einen ausgewogenen Ansatz übernommen. Die KI-Transkription mit anschließender menschlicher Prüfung ist für begutachtete qualitative Forschung inzwischen weithin akzeptiert. Die Ausnahme bilden die Gesprächsanalyse und die detaillierte Diskursanalyse, bei denen die Jefferson-Notation erforderlich ist, die kein KI-Tool erzeugen kann.

HappyScribe unterstützt Forschende mit präziser Transkription

HappyScribe ist auf die Arbeitsabläufe qualitativ Forschender ausgelegt. Sie laden die Aufnahme hoch, konfigurieren Ihren Ausgabestil und erhalten in wenigen Minuten ein Arbeitstranskript zurück, mit KI-Transkription in über 150 Sprachen und Dialekten.

Wenn Ihre Aufnahmen regionale Akzente und überlappende Sprache enthalten, können Sie Ihre Datei oder Ihr KI-Transkript an professionelle Linguisten senden, die innerhalb von 24 Stunden zu 99 % genaue Transkripte liefern. Für Forschungsteams, die mit mehrsprachigen Datensätzen arbeiten, hält diese Kombination aus KI-Geschwindigkeit und menschlicher Genauigkeit das Projekt in Bewegung, ohne die Transkriptqualität zu beeinträchtigen.

HappyScribe interaktiver Editor für Forschende

Im interaktiven Editor findet die Prüfung statt. Sie können das Audio parallel zum Transkript abspielen, zu jedem beliebigen Zeitstempel springen und Fehler direkt im Text korrigieren. Die Sprecherkennzeichnung erfolgt automatisch, sodass Sie nicht manuell P1 und P2 über 40 Seiten Fokusgruppendaten hinweg markieren müssen.

HappyScribe AI Chat für Forschende

Sobald Sie alle Transkriptdaten haben, können Sie den AI Chat nutzen, um wichtige Erkenntnisse, Ansätze und Beobachtungen zu finden, die Ihnen vielleicht entgangen sind. Der AI Chat durchsucht Ihre Dateien und Transkripte und unterstützt Sie bei Zusammenfassungen, Zitaten und sogar E-Mail-Entwürfen. Er fungiert wie ein Forschungsassistent, sodass Sie den Analyseprozess beschleunigen können.

Bewährte Praktiken für die Transkription in der qualitativen Forschung

Wenn Sie herausfinden möchten, wie Sie qualitative Interviews transkribieren, gelten diese fünf Praktiken unabhängig von der gewählten Art:

  1. Legen Sie Ihre Transkriptionsart vor der Datenerhebung fest. Dokumentieren Sie die Entscheidung in Ihrem Methodenteil und, falls zutreffend, in Ihrem IRB-Protokoll. Ein Wechsel der Transkriptionsart mitten in der Studie schafft Inkonsistenzen, die sich in der Begutachtung schwer rechtfertigen lassen.
  2. Erstellen Sie ein Transkriptionsprotokoll. Legen Sie fest, wie Sie mit unklarem Audio, überlappenden Sprechenden, fremdsprachigen Wörtern und sensiblen Inhalten umgehen. Teilen Sie dieses Protokoll mit allen anderen, die für das Projekt transkribieren, damit jedes Transkript denselben Konventionen folgt.
  3. Verwenden Sie einheitliche Sprecherkennzeichnungen und Zeitstempel. Ob Sie manuell oder mit KI-Transkriptionstools transkribieren: Kennzeichnen Sie Sprechende einheitlich ("Interviewer", "P1", "P2"). Fügen Sie Zeitstempel in regelmäßigen Abständen oder an wichtigen Stellen ein. Eine einheitliche Kennzeichnung spart Stunden, wenn Sie während der Codierung nach bestimmten Passagen suchen.
  4. Prüfen Sie immer gegen das Quell-Audio. Selbst bei professionellen menschlichen Transkriptionsdiensten sollten Sie mindestens 10 bis 15 % des Transkripts stichprobenartig mit der Aufnahme abgleichen. Fehler verstärken sich während der Analyse, wenn sie nicht früh erkannt werden.
  5. Anonymisieren Sie während der Transkription, nicht danach. Ersetzen Sie Namen, Orte und andere identifizierende Angaben bereits beim Transkribieren. Wenn Sie später einen einfachen Suchen-und-Ersetzen-Filter anwenden, entgehen Ihnen einige Kontexte.

Starten Sie mit dem richtigen Transkript

Die Transkriptionsart ist eine methodische Entscheidung, nicht nur eine Frage der Formatierung. Passen Sie sie an Ihre Analysemethode an, bevor Sie mit der Aufnahme beginnen, und dokumentieren Sie die Entscheidung in Ihrem Protokoll. Mit der richtigen Art tritt die Transkription in Ihrem Forschungsablauf völlig in den Hintergrund.

Für die Transkription im sauberen Verbatim HappyScribe übernimmt den gesamten Arbeitsablauf vom KI-Entwurf bis zum menschlich geprüften Transkript.

Häufige Fragen zu Transkriptionsarten in der qualitativen Forschung

Welche Arten qualitativer Forschungsmethoden gibt es?

Die wichtigsten qualitativen Forschungsmethoden sind Interviews, Fokusgruppen, Ethnografie, Fallstudien und Beobachtungsstudien. Ihre Forschungsziele bestimmen, welche Methode Sie wählen müssen. Interviews funktionieren am besten, wenn Sie ein nuanciertes Verständnis individueller Erfahrungen benötigen, während Fokusgruppen gemeinsame Perspektiven und Gruppendynamiken zutage fördern.

Die meisten dieser Methoden erzeugen Forschungsdaten in Form von Audioaufnahmen oder Videodateien, nicht strukturierte quantitative Daten, die Sie in eine Tabelle einfügen können. Der Transkriptionsprozess wandelt diese Rohdaten in geschriebenen Text um, den Sie codieren und für die qualitative Analyse in Datensegmente gliedern können. Folglich prägt die Qualität Ihrer transkribierten Daten unmittelbar die wichtigen Erkenntnisse, die Sie aus Ihren Forschungsergebnissen ziehen können.

Welche fünf Transkriptionsarten gibt es in der qualitativen Forschung?

Die fünf Arten sind das vollständige Verbatim, das saubere Verbatim (auch intelligente Transkription genannt), die bearbeitete Transkription, die phonetische Transkription und die Jefferson-Transkription. Das vollständige Verbatim erfasst jeden Laut, einschließlich Füllwörtern und Pausen, während das saubere Verbatim diese Füllwörter entfernt, aber alle bedeutungstragenden Inhalte behält. Die bearbeitete Transkription strukturiert die Sprache für die Lesbarkeit um, und die phonetische Transkription verwendet IPA-Symbole, um die Aussprache festzuhalten. Die Jefferson-Transkription ergänzt das vollständige Verbatim um eine Notation für Überlappung, Tonhöhe und Timing.

Das saubere Verbatim ist die Standardoption für die meiste qualitative Forschung. Das vollständige Verbatim und die Jefferson-Notation sind der Gesprächsanalyse und der Diskursanalyse vorbehalten, bei denen Sprechmuster Teil der Forschungsdaten sind.

Wie wählt man die richtige Transkriptionsart für die Forschung?

Beginnen Sie mit Ihrer Analysemethode. Wenn Sie eine thematische Analyse oder eine Grounded Theory durchführen, liefert Ihnen das saubere Verbatim Forschungstranskripte, aus denen sich wertvolle Erkenntnisse leicht gewinnen lassen, ohne sich durch Füllwörter kämpfen zu müssen. Wenn Ihre Studie Sprechmuster oder Sprecherwechsel untersucht, sind das vollständige Verbatim oder die Jefferson-Transkription die bessere Wahl.

Zwei praktische Faktoren grenzen die Wahl weiter ein: ob Ihre Forschungsziele Daten zu Sprechmustern erfordern und ob fachfremde Personen die Transkripte lesen werden. Wenn Sie mit Videodateien oder Videodaten arbeiten, prüfen Sie, ob Ihr Transkriptionstool das Format verarbeitet. Für Projekte mit sensiblen Daten wählen Sie eine Plattform mit starken Datenschutzkontrollen. HappyScribe ist DSGVO-konform und SOC 2 Type 2 zertifiziert, was die meisten IRB-Anforderungen abdeckt.

Ist ein Verbatim-Transkript am besten für die qualitative Forschung?

Nicht immer. Das vollständige Verbatim erfasst jede Äußerung, was es für die Gesprächsanalyse und die Diskursanalyse unverzichtbar macht. Für die thematische Analyse und die Grounded Theory ist jedoch das saubere Verbatim die bessere Wahl. Es entfernt Füllwörter und Fehlstarts, sodass sich Ihre transkribierten Daten leichter codieren und gliedern lassen.

Das vollständige Verbatim kann die qualitative Datenanalyse sogar verlangsamen, wenn Ihr Bezugsrahmen keine Daten zu Sprechmustern verwendet. Die zusätzlichen Details erzeugen Rauschen in Ihren Datensegmenten, wenn Sie eine kollaborative Analyse durchführen oder Transkripte mit einem Forschungsteam teilen. Wählen Sie das vollständige Verbatim nur dann, wenn das Wie einer Aussage genauso wichtig ist wie das Was.

Welche Transkriptionssoftware eignet sich am besten für die qualitative Forschung?

HappyScribe eignet sich hervorragend für die qualitative Forschung, weil es beide Seiten des Arbeitsablaufs abdeckt: die automatische Transkription für Geschwindigkeit und einen professionellen Transkriptionsdienst für Aufnahmen, die menschliche Genauigkeit erfordern. Es verarbeitet Audio- und Video-Uploads, wendet Sprechererkennung und Zeitstempel automatisch an und exportiert in Formate, die Ihr qualitatives Analysetool lesen kann.

Die Audioqualität ist die wichtigste Variable bei der Wahl einer Transkriptionssoftware. Bei klaren Aufnahmen mit nur einer sprechenden Person liefert die automatische Spracherkennung allein gute Ergebnisse. Bei Aufnahmen mit schlechter Audioqualität oder überlappenden Sprechenden bedeutet der Zugang zu professionellen Linguisten neben der KI-Option, dass Sie mitten im Projekt nicht die Plattform wechseln müssen.

Die automatische Transkriptionssoftware muss Sprecherkennzeichnungen unterstützen, Ihnen den Abgleich des Transkripts mit dem Quell-Audio ermöglichen und Videodaten direkt verarbeiten, anstatt von Ihnen zu verlangen, zuvor das Audio zu extrahieren.

Kann ich KI-Tools für die Transkription in der qualitativen Forschung verwenden?

Ja. KI-Tools nutzen die automatische Spracherkennung, um eine Audioaufnahme innerhalb von Minuten in geschriebenen Text umzuwandeln. Bei klaren Aufnahmen mit nur einer sprechenden Person und guter Audioqualität liegt die Genauigkeit bei über 95 %.

Das Ergebnis funktioniert am besten als erster Entwurf. Sie gleichen das Transkript mit dem Quell-Audio ab, korrigieren Fehler, und die Transkriptionsaufgabe ist in einem Bruchteil der Zeit erledigt, die sie von Hand benötigen würde. Dieser hybride Ansatz ist in der begutachteten Forschung inzwischen weithin akzeptiert.

Doch es gibt Grenzen. Schlechte Audioqualität und überlappende Sprechende verringern die Genauigkeit, und für die Gesprächsanalyse, bei der die Jefferson-Notation erforderlich ist, sind menschliche Transkribierende weiterhin notwendig. HappyScribe kombiniert die automatische Transkription mit erfahrenen menschlichen Transkribierenden für Aufnahmen, die eine höhere Genauigkeit erfordern, und ermöglicht Forschenden so, im selben Projekt sowohl klare Interviews als auch anspruchsvolles Audio zu bearbeiten.

Biplab Mazumder
Geschrieben von

Biplab Mazumder

Biplab is a content marketer and writer who helps high-growth brands scale content visibility across AI search channels. His works have been published in HubSpot, Freshworks, Atlassian, SurferSEO, etc. When he's not planning content strategy, he's testing AI content workflows and use cases.