Warum eine professionelle Transkription die bessere Wahl ist

»Du transkri … bitte was?«, ist für mich keine unübliche Frage und trotz promptem Erklärungsversuch sind sogar die meisten Latein-versierten Gesprächspartner immer noch verwirrt. Womöglich noch verwirrter.

Die Kurzfassung »Ich tippe gern!«, stimmt zwar, ist aber relativ einschränkend.
Gutes Hörverständnis, Geduld, hohes Konzentrationsvermögen und eine passable Rechtschreibung sind mindestens genauso wichtig.
Und: Meines Erachtens ist „Abtippen“ auch keine würdige Berufsbeschreibung.

Warum dir eine professionelle Transkription Zeit und Nerven erspart

Dieser kurze Artikel soll dazu dienen, dir einen Überblick über die Transkriptionswelt und insbesondere über die drei gängigsten Transkriptionssysteme zu geben.
Insbesondere wirst du am Ende verstanden haben, welches System bzw. welche Regeln für deinen spezifischen Fall am besten geeignet sind.

Online-Marketer, Marktforschungsinstitute, Journalisten sowie Unternehmen und Studenten greifen nämlich sehr gern auf diese sehr zeitintensive Dienstleistung zurück, um sich selbst die wertvolle Zeit einzusparen.
Aufgrund der grundlegend unterschiedlichen Bedürfnisse biete ich selbst gezielt alle drei Transkriptionsstile an.

Kurz vorweggenommen:
Zwischenstufen oder Grauzonen gibt es überall und die Bezeichnungen sowie die genauen Regeln unterscheiden sich selbstverständlich unter den vielen Anbietern.
Und nein:
Transkribieren ist nicht nur einfach zuhören und abtippen, was man hört.

Erste Möglichkeit: Maschinell erstellte Transkription

Mein persönlicher Lieblingstil.
Dank einer sehr erfolgreichen Zusammenarbeit mit einem im Bereich der KI-Entwicklung tätigen Start-up darf ich nun gemütlich Espresso trinken, während die Arbeit erledigt wird. Und für größere Volumina auch viel schneller, als sich ein Mensch je erträumen könnte, und noch dazu preisgünstiger.

Mache ich mir dabei Sorgen, dass mir Maschinen irgendwann die Arbeit wegnehmen könnten?
Nun, solange sie mir nur die Arbeit und nicht das Entgelt wegnehmen, lässt es sich gut ertragen.
Spaß beiseite, das Ganze kommt mit einem Haken:

Ein maschinell erstelltes Transkript erreicht im besten Fall eine Genauigkeit von 90 %, wenn folgende Voraussetzungen erfüllt sind:

  • keine/wenige Hintergrundgeräusche (bzw. nachträgliche Geräuschminimierung )
  • die Beteiligten/Gesprächspartner sprechen deutlich und haben keinen starken Akzent
  • die Beteiligten/Gesprächspartner meiden es, sich ins Wort zu reden – (die KI schafft es noch nicht, unterschiedliche Stimmen/Tonlagen auseinanderzuhalten)
  • die Aufnahmen können nur einsprachig bearbeitet werden

Was jedoch in den meisten Fällen nicht zutrifft.

Diese Methode ist jedoch extrem hilfreich, um schnell aus großen Mengen den Inhalt bzw. die Stellen herauszufiltern, die danach noch genauer transkribiert werden müssen.
Oder man sie auch ausschließlich nutzt, wenn man mit nur knappem Budget unterwegs ist.
Die Interpunktionsregel beherrscht die KI übrigens auch noch nicht. Momentan versucht sie sich mit dem Punkt und Fragezeichen anhand der Stimmmodulation – mit nur mäßigem Erfolg.

Zweite Möglichkeit: Geglättete Transkription

Eine einfachere Transkriptionsvariante, die der gesprochenen Sprache sehr ähnelt, jedoch ebenfalls einen Glättungsversuch bietet.

Unter Glättung versteht man eine Form der Textverfassung mit Fokus auf verbesserte Lesbarkeit.

  • Stottern, Wiederholungen und Füllwörter, (übrigens eine berüchtigte Strategie des Gehirns, um etwa Zeit beim Satzaufbau zu gewinnen), werden dabei weggelassen.
  • Grammatikfehler (wie z. B. falsche Endungen) und Versprecher werden ausgebessert.
  • Dialekte werden, soweit möglich, eingedeutsch.
  • „Wortverschleifungen“ werden ebenfalls an die konventionelle schriftliche Form angepasst. Sätze werden dabei jedoch nicht umgeschrieben und Satzabbrüche werden nur als solche gekennzeichnet bzw., (sollten sie kaum an Informationen beitragen), vollständig weggelassen.

Damit erreicht man 98 % Genauigkeit und mehr –
die Aufnahmequalität ist auch für von Menschen erstellte Transkripte ausschlaggebend.

Das ist die am häufigsten gewählte Form der Transkription, da die Inhalte und die Lesbarkeit im Vordergrund stehen.

Gleichzeitig ist es jedoch auch wichtig zu wissen, dass eine geglättete Transkription kein Lektoratservice ist und die Qualität der Niederschrift am Ende sehr stark von den Sprechern abhängig ist.

Dieser Transkriptions-Stil wird auch oft für Abschlussarbeiten gewählt, natürlich unter Berücksichtigung der universitätsspezifischen Richtlinien (wie Schriftgröße, Zeilenabstand, Zeilennummerierung, Sprecheridentifizierung, Zeitmarken etc. …)

Dritte Möglichkeit: Wortwörtliche Transkription bzw. Verbatim

Der mit Abstand aufwendigste Transkriptionstil –
(mit dem berüchtigten GAT, GesprächsAnalytischesTranskriptionssystem, befasse ich mich persönlich nicht, da es wie jegliche transzendenten Gleichungen im Mathe-Grundkurs meine Kräfte übersteigt.)

Hier spielt nicht nur der Inhalt bzw. das Gesagte eine Rolle, sondern eben auch wie es gesagt bzw. gemeint wurde.
Es wird also buchstäblich transkribiert.
Jop, ganz genau …

Hierbei richte ich mich meist standardmäßig nach den vereinfachten „Dresing & Pehl“-Regeln, (auf Anfrage auch nach erweiterten oder gar anderen Richtlinien), da diese Regeln hohe Bekanntheit im deutschsprachigen Raum errungen haben und viele Transkriptionsagenturen – (unter anderem auch die, in deren Auftrag ich regelmäßige Qualitätskontrollen leiste) – und auch Universitäten wortwörtliche Transkriptionen nach diesen Richtlinien verlangen.

Dialekte, Wortverkürzungen oder Verschleifungen werden hier genau so geschrieben, wie sie gesprochen werden –
(um etwas genauer zu sein: wie sie gehört werden).

  • Wort- und Satzabbrüche werden als solche mit einem Schrägstrich gekennzeichnet.
  • Ein Ins-Wort-Reden mit einem doppelten Schrägstrisch.
  • Füllwörter und Verständnissignale sind nicht mehr Fehl am Platz, sondern sogar mal herzlich willkommen und werden normiert – immer in der gleichen Form, egal ob der Sprecher sie in die Länge zieht oder mal ein »ehm« statt »ähm« verewigt.
  • Sprechpausen werden auch markiert – mit einem Hinweis auf deren Länge. (Bsp.: (.) = 1 Sekunde, (…..) = 5 Sekunden)

Die leider etwas unbequeme Realität über Transkriptoren

Nun, wenn du über diesen Artikel gestolpert bist, um herauszufinden, ob du deine Interviews selbst transkribieren möchtest und du mittlerweile verzweifelt bist, da es sich dabei um eine wortwörtliche Transkription handelt …
… tja, Pech gehabt …

Nein, so schlimm ist es nicht, vor allem, wenn man sich professionelle Hilfe leisten kann und möchte –
was bei einer wortwörtlichen Transkription absolut der Fall sein sollte.

Das hängt unter anderem mit der durchaus menschlich ausgeprägten Neigung zusammen, beim Zuhören mitzudenken und vorherzusehen, wohin der Satz führen wird.
Dabei lässt jedoch die Aufmerksamkeit nach, was zu Unstimmigkeiten und fehlenden Worten oder gar Satzteilen führt.
Grammatikalische Fehler oder falsch ausgesprochene Worte sollten außerdem in einer strikten Verbatim-Transkription nicht ausgebessert werden. (Eine besonders große Freunde, wenn ausländische Experten oder Fachkräfte interviewt werden … 😉

Wie du nun selbst Hand anlegen kannst …

Du siehst, dass unser Berufsstand nicht ganz ungerechtfertigt ist. 😉

Wenn du aber nach meinen kurzen Erklärungen immer noch total begeistert bist und auch noch mehr dazulernen möchtest, empfehle ich dir das „Praxisbuch Transkription“ von Dresing und Pehl (pst, kein Affiliate-Link, lässt sich online gratis herunterladen).

Dieser Praxisratgeber gibt dir u. a. wertvolle Tipps zum Führen von qualitativen Interviews und beinhaltet Inhaltsanalysen, qualitative Auswertungen sowie eine Abschätzung der dafür notwendigen Zeit.

Wie bereits erwähnt, ist eine Transkription sehr zeitintensiv und auch ohne angemessene Ausstattung (wie Transkriptionspedal bzw. Tastaturkürzel, spezielle Transkriptionsprogramme, ein geeignetes ergonomisches Set-up – ja, auch das ist extrem wichtig, um gesundheitliche Probleme zu vermeiden), flinke Finger und Erfahrung leider fast nicht effizient umzusetzen.
Um bspw. den Zeitaufwand grob zu quantifizieren, würde ich mit der 8–10-fachen Audiolänge des Interviews rechnen.
Sprich, für eine Stunde an Aufnahmen musst du ca. mit 8–10 Stunden für die Niederschrift einplanen.

Fazit

In den nächsten Wochen werde ich mich in weiteren Artikeln damit auseinandersetzen, dir noch mehr hilfreiche und praxisorientierte Tipps zu geben, wie du selbst Transkriptionen umsetzen bzw. bereits von Anfang an „transkriptionsfreundlichere“ Interviews führen kannst.

Um dies nicht zu verpassen, melde dich am besten gleich zu unsere Sprachnews an!

Abschließend noch ein letzter, wichtiger Gedanke, denn das kostete mir den ersten unzufriedenen Kunden nach knappen 4 Jahren Zusammenarbeit:

»Communication is key. Umso mehr bei einer im sprachlichen Bereich tätigen Agentur … ça va sans dire.«

Falls du dich jedoch gleich von Anfang an für die professionelle Variante deiner Transkription entscheiden willst, was ich dir im Blick auf deine wertvolle und wahrscheinlich auch eher knappe Zeit ans Herz legen würde:
Erzähl uns von deinem Projekt und wir helfen dir bei der Umsetzung!

Hat dir der Artikel gefallen?



In unseren Inspiration-News gibt es noch mehr davon!

Du erhältst zudem Tipps zu Themen,
die dein Sprachgefühl verbessern und dich auf den neuesten Stand bringen!

Zusätzlich erfährst du als Erster
von der Veröffentlichung neuer Beiträge
UND
erhältst exklusiven Zugang zu Sonderaktionen.

+++

Mit deiner Anmeldung
erhältst du zum perfekten Start
unser ultimatives
CHEATSHEET
zur Textverbesserung in Eigenregie!

Logo ProLektorat

Warte noch kurz ...


... du bist
leidenschaftlicher Texter?

Und du willst mit weiteren
Tipps, Tricks und Hacks
zu Sprache und Workflows als Freelancer
deine Texte auf das nächste Level bringen?

Dann hol dir am besten gleich unser
CHEATSHEET,
wie du in nur 5 Schritten
das Beste aus deinen Texten herausholen kannst!