Wie du Untertitel ganz einfach selbst erstellen kannst

Warum überhaupt Untertitel erstellen?

Lass mich dafür etwas ausholen …

Wie wir heutzutage Content konsumieren

  • Universitäten und Weiterbildungsinstitute müssen „Corona-bedingt“ neue Wege finden und den Studenten auch Onlinekurse zur Verfügung stellen. Öffentliche Institutionen sind dabei verpflichtet, ihre Online-Inhalte barrierefrei zu gestalten. Sprich, Untertitel bereitzustellen – (Stichwort „Web-Accessibility-Richtlinie“).
  • Online-Akademien und das Konzept flexiblen Lernens wachsen rasant. „Wenn man will, wo man will und wie oft man will, kann man sich Neues beibringen“. Lerninhalte in kleiner und leichter Dosierung.
  • Video ist eines der beliebtesten Content-Marketing-Medien. 80 % der Menschen (Quelle: Digiday) schauen sich diese jedoch Videos stumm an, weil sie z. B. gerade unterwegs, in der U-Bahn oder am Arbeitsplatz sind. Noch dazu werden Videos auf Facebook, Instagram oder Twitter im Autoplay-Modus automatisch stummgeschaltet.
  • Podcasts werden auch immer beliebter. Das haben wir hier bereits angesprochen.
  • Durch die Verbreitung von Streaming‑Diensten ist die Zahl der Zuschauer, die sich einen Film oder eine Serie mit Untertiteln ansehen, enorm gestiegen.

Fazit: Der Bedarf an Untertiteln steigt in unserer digitalisierten Welt ständig. Gleichzeitig sinkt jedoch die Qualität der produzierten Untertitel, da sich sehr viele auf eine automatische (maschinelle) Erstellung komplett verlassen.

Aus all diesen Gründen werden aber hochwertige Untertitel und Transkripte immer wichtiger! Wie du solche erkennen bzw. selbst erstellen kannst, erkläre ich dir hier kurz und bündig.

Was sind Untertitel überhaupt und welche Arten gibt es?

Grobe Definition: Untertitel sind kleine Teile eines Transkripts, die in sinnvolle Einheiten geteilt und in gekürzter Form synchron mit dem Audio auf einem Bildschirm eingeblendet werden.
Schon einmal vorab: Untertitel ist nicht gleich Untertitel. Wir können 3 Arten unterscheiden:

  1. Übersetzte Untertitel. Für die Filmindustrie auch OmU (Original mit Untertitel). Vielleicht ist dir diese Bezeichnung aus dem Kino bekannt. Bei dieser Art von Untertitelung rate ich dir dringend, einen Profi zu beauftragen. Das ist eine echte Kunst und auch ein eigener Beruf, nämlich der Audiovisuelle Übersetzer. Um dir den Umfang des Fachgebiets etwas deutlicher zu machen: Es gibt sogar Masterarbeiten, die sich mit nur einem Teilgebiet davon befassen, z. B. „Humor in der Untertitelung“.
  2. Untertitelung für Gehörlose und Hörgeschädigte. Oft wird auch im deutschsprachigen Raum der englische Begriff SDH verwendet, „Subtitles for the deaf and hard of hearing“. Das ist aber keine einheitliche Gruppe, denn sie schließt
    • gehörlos Geborene,
    • Frühertaubte,
    • Spätertaubte und
    • Schwerhörige

    ein.

    Für eine solche Art der Untertitelung benötigt man ebenso spezifisches Know-how. Die offiziellen Richtlinien für DACH-Länder kannst du hier finden, (Stand leider nur 2013).

  3. Gleichsprachige Untertitel fördern die aktive Einbindung mehrerer Kanäle im Lernprozess, sind also besonders für E-Learning geeignet. Sie sind auch sehr hilfreich, wenn technische Begriffe vorkommen oder der Speaker einen Akzent hat. Für Sprachkurse oder Sprachunterricht sind sie sogar unverzichtbar.

Mein eigener Kontakt mit Untertiteln:

Ich selbst kaufe mir immer wieder einen Onlinekurs. Und ich liebe es, wenn die Kurse untertitelt sind. Gleichzeitig ist jedoch kaum etwas schlimmer als schlechte Untertitel.
Wenn bei einem Kurs z. B. mit dem Thema Landingpage-Design mehrmals „learning page“ statt „landing page“ steht (true story!), kann man davon ausgehen, dass die Erstellung der Untertitel an Arbeiter aus ökonomisch benachteiligten Ländern ausgelagert wurde. Die aber gar nicht dafür spezialisiert sind und von daher leider nur niedrige Qualität abliefern. Das mag vielleicht zunächst dem Geldbeutel guttun, ist aber langfristig und nachhaltig fürs Image und den Auftritt absolut nicht zu empfehlen. Also lass das lieber sein.

Welche Untertitelformate gibt es?

Hier findest du eine Übersicht unterschiedlicher Dateinamenserweiterungen für Untertitel-Dateien:

  • .SRT (Sub Rip Text)
  • .VTT (WebVTT – Web Video Text Track)
  • .SSA (Sub Station Alpha)
  • .ASS (haha, „a pain in the ASS”? Nein, Advanced SubStation Alpha 😉
  • .EBU-STL und .EBU-TT (Akronym von European Broadcast Union, wird in Europa im Rundfunkbereich eingesetzt)

Für deine Bedürfnisse wird es wahrscheinlich reichen, wenn du dir das gängigste Web-Format merkst: SRT – es ist nämlich auch mit YouTube, Facebook und Vimeo kompatibel.

Wie eine .SRT-Datei praktisch aussieht:

1
00:00:03,150 --> 00:00:06,109
Hallo, sehr erfreut!
Ich bin ein Untertitel.

Diese kryptischen Zeichenfolgen kannst du so verstehen:
Die erste Zeile ist eine Laufnummer.
Die zweite Zeile gibt die Schaltezeit vor.
Die dritte und vierte Zeile ist der Text, also der Inhalt.

Wie du eine Untertitel-Datei bearbeiten kannst

Fertig erstellte Untertitel editieren:

.SRT-Dateien kannst du mit einem Texteditor öffnen und direkt darin bearbeiten, sollte z. B. ein Tippfehler unterlaufen sein. Das empfehle ich aber lediglich für eine schnelle Textbearbeitung.
Um das Timing (die Schaltezeit) anzupassen, ist die Verwendung eines Untertitel-Editors (z. B. Subtitle Editor oder Aegisub) viel effektiver. (Beide sind Open-Source und kostenlos und auch wesentlich besser als z. B. der YouTube-Editor).

Fertig erstellte Untertitel formatieren:

Inoffiziell verfügt das .SRT-Format über eine sehr einfache Textformatierung durch HTML-Tags. Wenn dich das freut, da du HTML beherrschst, findest du hier mehr dazu.
Davon rate ich allerdings ab, weil die HTML-Tags nicht von jedem Mediaplayer erkannt werden.

Das .WebVTT- bzw. das ASS-Format sind hingegen besser geeignet, da diese auch Schriftgröße, Schriftart, Farbe, Ausrichtung etc. mit abspeichern können. Hier ist aber wichtig, dass du im Voraus prüfst, ob dein Endmedium dieses Format auch tatsächlich unterstützt.

Oder du verwendest für die Formatierung eine professionelle Videoschnittsoftware (z. B. Adobe Premiere, die übrigens auch .SRT unterstützt und importieren kann) und brennst anschließend die Untertitel ein. Das bedeutet, dass die Untertitel Bestandteil des Videos werden und nicht mehr beliebig ein- oder ausgeschaltet werden können. Auf Englisch heißt das „hard encoding“ oder „open captions“. (Du kennst vielleicht im Gegensatz dazu das „CC“-Symbol auf YouTube – was sogenannte „closed captions“ sind – also geschlossene Untertitel, die man beliebig ein- und ausschalten kann.)

Welche Regeln und Vorgaben du beachten solltest:
Best Practices für eine professionelle (einsprachige) Untertitelung

Es gibt im deutschsprachigen Raum keine offiziellen Richtlinien für eine einsprachige Untertitelung. Wenn du welche findest, gib mir gerne Bescheid. 😉
Hier findest du also einen Vorschlag von mir persönlich, der sich stark nach den Empfehlungen des AVÜ (Verband der Audiovisuellen Übersetzer:innen) richtet:

  • „Die Lesbarkeit sollte im Zweifelsfall immer die oberste Priorität haben. Denn die beste Story oder der coolste Witz nutzen gar nichts, wenn man sie nicht lesen kann.“ (Zurückspulen könnte man, ja, aber wer tut das schon?)
  • Lesegeschwindigkeit: Die empfohlene Zeichenzahl pro Sekunde (CPS, „Characters per Second“) liegt zwischen 10–20 CPS. Es ist allerdings sehr schwer, einen exakten Wert festzulegen, denn die Lesegeschwindigkeit ist von Alter, Bildgeschehen, Satzbau, Wortwahl und Schnitt abhängig.
  • Die Mindestdauer eines Untertitels sollte 1 Sekunde betragen. Für schnell lesbare Worte, wie z. B. „Ja“ dürfen Ausnahmen gemacht werden.
  • Die empfohlene Höchstdauer eines Untertitels beträgt 6 Sekunden.
  • Untertitel sollten möglichst nicht über einen Videoschnitt hinausgehen.
  • Textaufteilung: Der Text sollte auf maximal 2 Zeilen unterteilt werden. Dabei sollte jede Zeile aus maximal 40–43 Zeichen bestehen, (angenommen Full-HD, inkl. Interpunktion und Leerzeichen). Das sind die sogenannten CPL, die „Characters per Line“.

ACHTUNG: Solltest du dein Video über mehrere Kanäle bzw. Medien übertragen wollen, (was beim Content Marketing gang und gäbe ist), musst du unbedingt die unterschiedlichen Auflösungen berücksichtigen:
Eine Zeile und 50–60 CPL mit automatischem Zeilenumbruch sollten eine passable Lösung dafür sein – aber die Einschätzung eines Profis ist in dem Falle das Beste.

Nach so viel Theorie nun die ersten Schritte …

Warum dabei mit künstlicher Intelligenz (KI) arbeiten?

  1. Erstens: Das Ganze wird für dich abgetippt. Wenn du z. B. das 10-Finger-System nicht draufhast, ist das sicher die beste Lösung für dich.
  2. Zweitens: Gesprochene Sprache ist linear – Schreiben und Lektorieren nicht. Ein vorgefasster Text ist also extrem hilfreich, um sich einen schnellen Überblick zu verschaffen und entsprechend Anpassungen vorzunehmen.
  3. Drittens: wenn man nicht die höchsten Ansprüche hat, kann man nach der Bearbeitung den Text direkt als .SRT, .VTT, .docx, .txt oder .json exportieren.

Es ist für dich also theoretisch möglich, in kürzester Zeit ein nahezu perfektes Transkript (auch im Untertitel-Format verfügbar) und mit einer ersten groben Sync zu erhalten.
Das ist sensationell – aber es sind auch keine hochqualitativen Untertitel, die den obigen Best Practices entsprechen. (Beim Export kann man derzeit nur CPL, CSP und Zeilenanzahl einstellen.)

Wann liefert automatische Spracherkennung nun ein gutes Transkript?

Voraussetzungen:

  • gute Aufnahmequalität
  • keine Hintergrundgeräusche (ja, „inspirational music“ zählt auch dazu)
  • keine starken Akzente
  • möglichst wenig (am besten gar kein) Ins-Wort-Reden

Anbieter

  • Amberscript (20 €/Audiostunde, Abo: 5 Std/Monat 75 €, 30 Minuten gratis)
  • happyscribe ( 11–12 €/Audiostunde, 10 Min. gratis)
  • Trint (montliche Flatrate, ab 44 €/Monat)
  • Sonix (10 US$/Audiostunde)

Bei den Anbietern gilt es nicht nur die Kosten zu berücksichtigen, sondern auch das dem Algorithmus zugrunde liegende sprachliche Modell und die von der Firma ausgewertete Datenmenge, was im Endeffekt die Genauigkeit der Transkription ausmacht. Ebenso miteinbeziehen sollte man, wie gut die intelligente Texttrennung gelingt. (Spoiler: Sie gelingt leider (noch) nicht so gut.)
Amberscript und Happy Scribe sehe ich momentan als die Besten an. (Beide arbeiten übrigens DSGVO- bzw. GDPR-konform.)

Jetzt bist du dran!

Das war’s nämlich auch schon. Jetzt solltest du alle Infos haben, um gleich loslegen zu können!

Noch nicht ganz klar, was jetzt dein nächster Step sein soll?
Finde es mit unserem Entscheidungsbaum heraus!
Entscheidungsbaum Transkript

Und wenn dir auf dem Weg, Untertitel für deine Videos zu erstellen, die Arbeit doch zu viel werden sollte, kontaktiere einfach uns und erzähle uns mehr von deinem Projekt!

Hat dir der Artikel gefallen?



In unseren SPRACHNEWS
gibt es noch mehr Inspirationen
für Texter & Sprachliebhaber!


Du erhältst Tipps zu Themen,
die dein Sprachgefühl verbessern
und dich mit Wörtern für mehr Spektakel im Text versorgen!

Zusätzlich erfährst du
von der Veröffentlichung neuer Beiträge
UND
erhältst exklusiven Zugang zu Sonderaktionen.

+++

Mit deiner Anmeldung
erhältst du zum perfekten Start
unser ultimatives
CHEATSHEET mit unseren TOP-5-Tools
zur Textverbesserung in Eigenregie!

Logo ProLektorat

Warte noch kurz ...


... du bist Texter:in?

Finde mit unseren
„WORDS WEEKLY”
immer die passenden Worte
und lass dich von unseren Sprachschätzen
inspirieren!

Kostenlos dazu gibt’s auch noch ein
Cheatsheet,
wie du in nur 5 Schritten
das Beste aus deinen Texten
herausholen kannst!