pajda.io & YouTube: Audiodeskriptionserstellung mit Voice Over und Untertitel-Erstellung leicht gemacht. 2. Digital Imagination Challenge

Mann schaut durch schwarze Cam. Logo des Digital Imagination Challenge

 

 

 

 

 

 

Im Zuge der aktuell laufenden Ausschreibung für den 2. Digital Imagination Challenge – bis zum 19. Juli kann man sich übrigens noch bewerben mit Vorschlägen für innovativen technischen Lösungen für eine inklusive Gesellschaft! – sind wir auf den Gewinner des 1. Wettbewerbs aufmerksam geworden: pajda.io

Im Nimm!-Projekt legen wir Wert darauf, dass die audiovisuellen Ergebnisse von Jugendprojekten nicht nur inklusiv entstanden sind, sondern auch von allen wahrgenommen werden können. Daher haben die Videos, die wir auf unserer Jugendplattform deine.inklusive-medienarbeit.de veröffentlichen, Untertitel und Audiodeskription. Das ist eine zweite Tonspur, die dann einsetzt, wenn gerade nichts gesagt wird im Film und welche die visuellen Informationen für blinde Menschen beschreibt.

Das bedeutet natürlich einen ergänzenden Aufwand, der geleistet werden muss. Während die Erstellung von Untertiteln im Prinzip reine „Fleißarbeit“ ist – vergleichbar mit dem Abtippen eines Protokolls – muss für eine Audiodeskription mehr Arbeit geleistet werden: Zunächst müssen die relevanten visuellen Informationen definiert werden, diese sprachlich so umgesetzt werden, dass sie in die – oft knappen – Redepausen passen, und dann vertont werden. Daher sind Tools, die den Aufwand für die Erstellung von Untertiteln und Audiodeskriptionen verringern und die möglichst einfach und intuitiv erlernbar sind, immer willkommen!

Für Untertitel gibt es zum Beispiel folgenden YouTube-Trick: Zu untertitelnden Film auf YouTube hochladen (wenn der Film nicht sichtbar sein soll/darf, muss man seinen Haken bei „privat“ setzen). Googles automatische Spracherkennung erkennt – je nach Tonqualität des Films – mehr oder weniger konfuse Untertitel. Was aber hilfreich ist und die Untertitel-Erstellung beschleunigt: Die Untertitel sitzen bereits an der richtigen Stelle! D. h. es muss nicht mehr händisch der sogenannte Timecode angegeben werden. Das sind die Zeitangaben, die anzeigen, von wann bis wann ein Untertitel auf dem Bildschirm stehen soll. Wenn man dann fertig ist, kann man diese Untertitel z. B. als SRT-Datei herunterladen. Das Video bei YouTube kann man dann, wenn man will oder muss, wieder löschen. Das Video lässt sich jetzt in einem beliebigen Player anzeigen oder bei Bedarf die vorhandenen Untertitel als SRT-Datei zu- oder abgeschaltet werden. D. h. man nutzt den YouTube-Editor und Googles Sprachengine als Werkzeug, um am Ende eine separate Untertitel-SRT-Datei in den Händen zu halten.

pajda.io nutzt ebenfalls bereits vorhandene Inklusions-Tools, nämlich den in allen iOS-Geräten vorinstallierten Screenreader VoiceOver. Mit der künstlichen Computerstimme können sich Blinde alle Informationen – auch die Navigations-Informationen wie Beschriftung von Menüs und Buttons – vorlesen lassen und so Mac, iPad und iPhone bedienen. Die Stimme ist aus dem Grund künstlich, da man synthetische Stimmen in beliebiger Geschwindigkeit abspielen lassen kann: Blinde Menschen haben die Geschwindigkeit ihrer Screenreader oft extrem hoch eingestellt, um effizienter zu kommunizieren und zu arbeiten.

Bei der Erstellung von Audiodeskriptionen muss man diese mit pajda.io nicht mehr vertonen, sondern kann den erstellten Audiodeskriptionstext von der VoiceOver-Stimme automatisch vorlesen lassen. Da, wie oben beschrieben, die Geschwindigkeit der VoiceOver-Stimme individuell angepasst werden kann und auch wird, ergibt sich beim Vorlesen der Audiodeskription mit VoiceOver das Problem mit dem Timing: Durch die unterschiedliche Vorlesegeschwindigkeit ist eben nicht mehr gesichert, dass der Audiodeskriptionstext an der „richtigen“ Stelle – nämlich genau in den Sprechpausen –  sitzt. Das Tool umgeht dieses Problem dadurch, dass der Film solange an der Stelle stoppt, bis die Audiodeskription zu Ende gesprochen ist. Ein interessantes Feature insbesondere für Filme, in denen die Sprechpausen extrem kurz sind.

André Naujoks, Nimm!-Technik-Experte, bezweifelt zwar, dass dieses Tool einen „echten“ Film spannend macht, bei dem es auf Atmosphäre und eben auch die Sprecherstimme der Audiodeskription ankommt. Er kann sich den Einsatz bei Dokumentationen und allen Filmen, bei denen es auf reine Informationsvermittlung ankommt, aber gut vorstellen.

Auf der Webseite gibt es einen Testzugang.

Wir sind gespannt, auf die Ideen und Preisträger des 2. Digital Imagination Challenge!

Kommentare sind geschlossen.