Blog

Audiodeskriptionen mit synthetischen Stimmen

Audiodeskriptionen mit synthetischen Stimmen – eine moderne Alternative

In Deutschland leben etwa 1,2 Millionen Menschen, die über ein eingeschränktes Seh- oder
Hörvermögen verfügen. Um auch diesen Menschen die Teilhabe am gesellschaftlichen
Leben zu ermöglichen, stellt unter anderem der barrierefreie Zugang zu Filmen eine
besondere Herausforderung dar. Dieses Ziel lässt sich mithilfe von Audiodeskriptionen
sowie der moderneren Methode der synthetischen Audiodeskription umsetzen.

Dabei handelt es sich bei Audiodeskriptionen konkret um die sprachliche Beschreibung der im Film zu sehenden Bilder. Hierfür werden von einer oder einem Sprecherin die wichtigsten Informationen zur Handlung, zu verschiedenen Personen sowie zu den Schauplätzen, die im Film bildhaft zu sehen sind, sprachlich beschrieben. Auch Texteinblendungen werden im Zuge dessen vorgelesen. Diese Beschreibungen werden dann zwischen den stattfindenden Dialogen in den Film eingearbeitet. So soll ein Film mithilfe von visuellen Beschreibungen auch ohne Bild und lediglich durch reines Zuhören verständlich gemacht werden.

Was ist die Besonderheit von synthetischen Audiodeskriptionen?

Bei synthetischen Audiodeskriptionen werden die Beschreibungen von Textern in Textform bereitgestellt und dann mithilfe einer speziellen Software in einen gesprochenen Text umgewandelt. So werden bei synthetischen Audiodeskriptionen die Passagen die ansonsten Sprecherinnen übernehmen, durch synthetische Stimmen ersetzt.

Synthetische Stimmen sind heute so weit fortgeschritten, dass diese nur noch schwer von echten Stimmen zu unterscheiden sind. Synthetische Audiodeskriptionen bieten den Vorteil, dass sie im Vergleich zu herkömmlichen Audiodeskriptionen deutlich schneller erstellt werden können und somit nicht nur Zeit, sondern auch Geld sparen. Denn hierbei übernimmt Software die Arbeit, die sonst kosten- und zeitaufwendig in Tonstudios erstellt werden. So eignet sich der Einsatz von synthetischen Audiodeskriptionen vor allem bei Videoclips oder Kurzfilmen, die eine Länge von 1 bis 45 Minuten besitzen. Darüber hinaus ist diese Methode auch für Dokumentationen besonders geeignet, bei denen für verschiedene Fremdsprachenpassagen unterschiedliche Sprecherstimmen eingesetzt werden sollen. Denn synthetische Stimmen werden nicht nach Anzahl der unterschiedlichen Stimmen, sondern nach Sendelänge kalkuliert. Dabei ist es egal ob in 5 Minuten ein Sprecher*in oder fünf „zu Wort“ kommen.

Nur wenige Dienstleister bieten synthetische Audiodeskriptionen an

Auf dem Markt gibt es bislang nur sehr wenig Anbieter, die Audiodeskriptionen mit synthetischen Stimmen anbieten – einer davon ist No Limits Media…GmbH. Hier erhalten Sie synthetische Audiodeskriptionen, die höchsten Qualitätsstandards entsprechen. Denn
um ein Video, einen Film oder eine Dokumentation auch für blinde Menschen verständlich zu machen, ist eine enge Zusammenarbeit mit der Zielgruppe unverzichtbar. Daher arbeiten bei No Limits Media sowohl sehende als auch blinde Autoren gemeinsam an der Erstellung
der synthetischen Audiodeskription, um so am Ende eine Bildbeschreibung garantieren zu können, die auch auf die Bedürfnisse der blinden Zuschauer abgestimmt ist.

Barrierefreiheit durch Audiodeskription mit synthetischen Stimmen

Einer der wenigen Dienstleister am Markt, die Audiodeskription mit synthetischen Stimmen anbieten

Barrierefreiheit durch Audiodeskription mit synthetischen Stimmen

Echte Stimmen sind aktuell durch nichts zu ersetzen. Allerdings ist der Einsatz synthetischer Stimmen sinnvoll, wenn es um Videoclips oder Kurzfilme bis 10 oder 15 Minuten geht. Vor allem bei Dokumentationen, wenn für unterschiedliche Fremdsprachenpassagen auch unterschiedliche Stimmen eingesetzt werden müssen. Hier bieten synthetische Stimmen einen enormen Anteil. Synthetische Stimmen, werden nach Minuten – nicht nach Anzahl der Stimmen kalkuliert. Synthetische Stimmen sind heute kaum noch von echten Stimmen zu unterscheiden. Ein weiter wichtiger Punkt ist, dass Audiodeskriptionen mit synthetischen Stimmen sehr schnell erstellt werden können. Studiobuchungen und die Buchungen von Sprecher*innen, Tonregie etc. fallen weg. Vollkommen weg fällt auch das „Total Buy-Out“, dass gerade bei kommerziellen Clips die Kosten in die Höhe treibt.

Vorteile der synthetischen Deskription

In ihrem Kern entspricht die Deskription mit synthetischen Stimmen der Deskription durch echte Sprecher*innen: In speziell dafür vorgesehener Software werden die Texte von unseren erfahrenen Autoren erstellt, die das Geschehen mit entsprechenden Beschreibungen begleiten. Dies können sowohl Hinweise zur Stimmung, zur Umgebung und zum Aussehen bestimmter Objekte und Figuren sein als auch zusätzliche Informationen, die in der Präsentation nur visuell vermittelt werden. Die Texte werden direkt im Programm gespottet und dann als wav-Datei ausgegeben. Entweder als reine Dialogspur oder mit automatischer 2.0 Mischung. Synthetische Stimmen haben zahlreiche Vorteile. Ihr Einsatz ist günstig, vielseitig und stets von gleichbleibender Qualität. Das wird besonders dann interessant, wenn z.B. ein Clip für eine Gebrauchsanweisung erstellt wird und evtl. nach zwei Jahren sich eine Kleinigkeit ändert. In einem solchen Fall muss dann nur eine kurze Stelle ausgebessert werden. Bei echten Sprecher*innen, verändert sich die Stimme. Das kann bei synthetischen Stimmen nicht passieren.

Auch wenn kein Sprachsynthetisierer an die Qualität von professionellen Sprecher*innen heranreicht, ist die gleichmäßige Sprechweise und stets gleiche Aussprache von Begriffen eine Erleichterung für das Verständnis, besonders bei bestehenden, gleichzeitigen Sehbehinderungen. Eine Vielzahl verschiedener Stimmen, sowohl männliche als auch weibliche in vielen Tonlagen und Sprachen, stehen zur Verfügung und können passend für die Präsentation und das erwartete Publikum ausgewählt werden. Ein zusätzlicher Vorteil ist, dass der Entwurf des Deskriptionsskriptes und die Überprüfung der begleitenden Wirkung Hand in Hand gehen. Probleme, etwa durch zu lange Textbausteine oder unpassende Zeitfenster, werden sofort bemerkt und können korrigiert werden. Das spart Zeit, Geld und gibt Planungssicherheit, denn das Ergebnis der Deskription ist sofort sichtbar. Auch auf Kundenwünsche und Kritik bei der Abnahme der Deskription kann schnell und ohne Entstehen zusätzlicher Kosten durch erneute Studiozeit eingegangen werden.

Insgesamt ist die synthetische Deskription ein wertvolles Werkzeug, das die Teilhabe sehbehinderter Menschen auch bei kleineren Produktionen und Veranstaltungen, bei der immer schnelleren Taktung moderner Produktionen und bei einem engen Budget verbessert.