1.2.9 Audio-only (Live): Wenn das Mikro angeht, müssen auch die Worte fließen (AAA)

Was ist das Ziel dieses Kriteriums?

Live ist live – und das macht alles komplizierter. Während du bei einem aufgezeichneten Podcast noch gemütlich ein Transkript erstellen kannst, wird es bei einem Live-Webinar, einer spontanen Pressekonferenz oder einem Radio-Webcast richtig kniffelig.

Menschen, die nichts oder nur schlecht hören können, stehen bei Live-Audio-Inhalten vor einer besonderen Herausforderung: Es gibt keine zweite Chance, keine Wiederholung, keine Pause-Taste. Was einmal gesagt wurde und nicht mitgeschrieben wurde, ist für sie verloren.

Das Ziel von Erfolgskriterium 1.2.9 der WCAG ist daher, dass auch Live-Audio-Inhalte in Echtzeit für alle zugänglich gemacht werden – durch sofortige Textalternativen, die parallel zum gesprochenen Wort entstehen.

Was fordert das Erfolgskriterium genau?

Bei diesem Level AAA-Kriterium geht es um die Königsdisziplin: Live-Audio-Inhalte müssen mit äquivalenten Textalternativen begleitet werden, die zur gleichen Zeit verfügbar sind wie der Ton selbst.

 

Konkret bedeutet das:

  • Live-Untertitelung: Ein professioneller Service erstellt in Echtzeit Untertitel zu dem, was gerade gesprochen wird
  • Live-Stenographie: Geschulte Stenographen tippen mit, was gesagt wird – oft mit nur wenigen Sekunden Verzögerung
  • Vorbereitete Transkripte: Falls einem Live-Event ein festes Skript zugrunde liegt, kann das Transkript parallel zur Verfügung gestellt werden
  • Eingeblendete Textalternativen: Der Text wird direkt im Stream oder auf der Webseite eingeblendet

 

Wichtige Ausnahmen und Klarstellungen:

  • Dieses Kriterium gilt NICHT für private 1-zu-1-Gespräche oder Videokonferenzen zwischen Einzelpersonen
  • Die Verantwortung liegt beim Veranstalter oder „Host“, nicht bei der verwendeten Software
  • Ungelernte Operatoren oder Transkripte, die stark vom tatsächlich Gesagten abweichen, erfüllen das Kriterium nicht

Warum ist das wichtig für Barrierefreiheit?

Stell dir vor, der CEO deines Unternehmens gibt eine spontane Pressekonferenz zu einem Krisenfall – aber du bist gehörlos und kannst nur dabei zusehen, wie alle anderen nicken und reagieren, während du nicht weißt, was eigentlich gesagt wird.

 

Live-Textalternativen schaffen echte Teilhabe in Echtzeit:

  • Gehörlose und schwerhörige Menschen können Live-Events, Webinare und Konferenzen vollständig mitverfolgen
  • Menschen in lauten Umgebungen können auch ohne Kopfhörer dabei bleiben
  • Menschen mit Aufmerksamkeits- oder Verarbeitungsstörungen profitieren von der Möglichkeit, Inhalte gleichzeitig zu hören und zu lesen
  • Nicht-Muttersprachler verstehen komplexe Live-Inhalte besser, wenn sie Text und Audio kombinieren können
  • Menschen in ruhigen Umgebungen (Bibliothek, schlafende Familie) können trotzdem teilnehmen

 

Das Besondere: Im Gegensatz zu nachträglich erstellten Untertiteln ermöglichen Live-Textalternativen echte soziale Teilhabe – du bist wirklich „dabei“, nicht nur Konsument einer Aufzeichnung.

 

So setzt du das Kriterium erfolgreich um

Live-Untertitelung ist definitiv anspruchsvoller als statische Textalternativen – aber mit der richtigen Planung und den passenden Services absolut machbar. Hier deine Optionen:

 

Professionelle Live-Untertitelung:

  • Beauftrage einen spezialisierten Live-Captioning-Service (z.B. VITAC, 3Play Media, oder lokale Anbieter)
  • Die Operatoren sind geschult und können mit speziellen Tastaturen sehr schnell tippen
  • Sie erfassen nicht nur Sprache, sondern auch wichtige Geräusche: [Applaus], [Lachen], [Musik]
  • Verzögerung beträgt meist nur 2-4 Sekunden

 

Stenographie-Services:

  • Professionelle Stenographen arbeiten vor Ort oder remote
  • Können bis zu 200 Wörter pro Minute erfassen
  • Ideal für offizielle Termine, Konferenzen oder wichtige Ansprachen
  • Output lässt sich direkt in deine Webseite oder deinen Stream einbinden

 

Technische Umsetzung:

  • Nutze Streaming-Technologien, die Text unterstützen (z.B. WebRTC mit Textkanälen)
  • Binde Live-Captions als Overlay in deinen Video-Player ein
  • Stelle sicher, dass der Text gut lesbar ist: ausreichend Kontrast, angemessene Schriftgröße
  • Biete eine separate Textansicht an, falls jemand nur den Text verfolgen möchte

 

Bei geplanten Events:

  • Wenn du ein festes Skript hast, stelle es parallel zur Verfügung – aber kennzeichne Abweichungen
  • Kombiniere vorbereitete Texte mit Live-Ergänzungen für spontane Teile
  • Teste die Technik vorher: Läuft alles synchron? Ist der Text gut lesbar?

 

KI-gestützte Live-Untertitelung – die Zukunft ist jetzt:

  • Apple Intelligence Live Translation: Apples neue KI übersetzt bei der WWDC 2025 vorgestellte Live-Telefonate und FaceTime-Anrufe in Echtzeit – komplett auf dem Gerät für maximalen Datenschutz
  • Google Live Transcribe: Wandelt gesprochene Worte sofort in Text um, funktioniert auch offline
  • Microsoft Live Captions: In Teams und anderen Microsoft-Apps bereits integriert
  • Otter.ai Live: KI-basierte Transkription mit Sprechererkennung und automatischer Zusammenfassung
  • Rev Live Captions: Hybridlösung aus KI und menschlicher Nachbearbeitung

Die Revolution der gerätebasierten KI: Mit Apples neuen Live-Übersetzungs- und Untertitel-Features für FaceTime und Telefonate zeigt sich, wohin die Reise geht: KI-Power direkt auf dem Gerät macht Live-Barrierefreiheit für alle zugänglich – ohne Cloud, ohne Verzögerung, ohne Datenschutzbedenken.

 

Kostengünstige Alternativen:

  • Für interne Events: Nutze die neuen KI-Features moderner Smartphones und Laptops
  • Teams/Zoom: Aktiviere die eingebauten Live-Captions (oft schon kostenlos verfügbar)
  • Bei kleineren Events: Kombiniere vorbereitete Materialien mit KI-gestützter Live-Ergänzung per Chat

Warum dieses Erfolgskriterium für Unternehmen relevant ist

Level AAA mag nach Luxus klingen – aber gerade bei Live-Events kann echte Barrierefreiheit den Unterschied zwischen Inklusion und Ausschluss bedeuten. Und das zahlt sich aus:

 

1. Zielgruppe erweitern

Ein exklusives Webinar ohne Live-Untertitel schließt gehörlose Kunden, Mitarbeiter und Partner komplett aus. Mit Live-Textalternativen machst du Events für alle zugänglich – auch für Menschen in ungünstigen Hörsituationen oder mit temporären Einschränkungen.

 

2. Technologieführerschaft und Innovation zeigen

Live-Untertitelung mit KI signalisiert: „Wir sind technisch auf der Höhe der Zeit.“ Apple hat bei der WWDC 2025 gezeigt, wie Live-Übersetzung und Live-Untertitel für FaceTime-Anrufe funktionieren – und demonstriert damit, dass Barrierefreiheit und Innovation Hand in Hand gehen. Unternehmen, die solche Technologien einsetzen, positionieren sich als zukunftsorientiert und sozial verantwortlich.

 

3. Skalierbarkeit und Effizienz steigern

KI-basierte Live-Übersetzung läuft vollständig auf dem Gerät und macht Unterhaltungen zugänglich, ohne Cloud-Dienste zu benötigen. Das bedeutet: niedrigere laufende Kosten, bessere Performance und mehr Datenschutz. Was früher teure Spezial-Services erforderte, wird durch moderne KI demokratisiert.

Und nicht zuletzt: Live-Textalternativen schaffen wertvolle Inhalte für die Nachnutzung. Aus deinem Live-Event wird automatisch ein durchsuchbares Transkript für Blog-Artikel, Dokumentationen oder SEO-optimierte Zusammenfassungen.

Das Erfolgskriterium im Wortlaut der W3

Success Criterion 1.2.9 Audio-only (Live)
(Level AAA)

An alternative for time-based media that presents equivalent information for live audio-only content is provided.

Link zum konkreten Erfolgskriterium

.h3, h3 { font-size:24px; }