Künstliche Intelligenz kann bereits seit einer Weile Bilder beschreiben. Auf Grundlage von ChatGPT ist diese Funktion z. B. in den Apps Be My Eyes und Seeing AI eingebaut. Beide Apps bieten darüber hinaus noch weitere Hilfefunktionen für blinde Menschen.
Seeing AI bietet neben Text-, Barcode-, Geldschein-, Personen-, Farb- und Lichterkennung mittlerweile auch eine Videobeschreibung für MP4-Dateien. Die Videobeschreibung funktioniert dabei anders, als die bekannte Audiodeskription: Bei einer Audiodeskription wird in den Sprechpausen in einer zweiten Tonspur beschrieben, was im Film zu sehen ist. D. h. die Länge der Audiodeskription hängt davon ab, wie lang die Pausen zwischen Dialogen im Film ist. Bei der Videobeschreibung von Seeing AI dagegen werden Filmszenen einer bestimmten Länge beschrieben und der Film an dieser Stelle unterbrochen. Die Videobeschreibung findet man nicht direkt in der App, sondern man teilt die Videodatei mit der App.
So geht’s:
- Video öffnen (z. B. bei iOS in der Fotos-App) – Teilen-Button tippen – im sich öffnenden Menü „Mit Seeing AI erkennen“ auswählen

- Das Video wird jetzt verarbeitet, der Bildschirm teilt mit, dass die Verarbeitung je nach Länge mehrere Minuten dauern kann.
- Im Anschluss startet automatisch die Videobeschreibung, dabei wechselt das originale Video mit der Videobeschreibung Szene für Szene ab. Im Gegensatz zu den sehr opulenten, ausführlichen Bildbeschreibungen, die Seeing AI bei Fotos anbietet, sind die Szenenbeschreibung auf das Wesentliche beschränkt.


- Seeing AI weist darauf hin, dass aktuell nur MP4-Dateien verarbeitet werden. Die Beschreibung ist auf 10 Videos am Tag begrenzt, wobei keine Aussage zur maximalen Videolänge getroffen werden. Leider ist es nicht möglich, die Videobeschreibung zu speichern.

Fazit: Aufgrund der ständigen Videounterbrechungen sowie der monotonen, automatischen Stimme entsteht nicht unbedingt so etwas wie Filmgenuss. Während bei einer echten Audiodeskription angestrebt wird, dass die Audiodeskription und der Film sich zu einer Art Gesamtkunstwerk verbinden, bietet die Videobeschreibung von Seeing AI nicht mehr – aber auch nicht weniger! – als eine reine funktionale Beschreibung der Szenen. Dies funktionierte in unserem Beispielvideo, in dem die iOS-Bedienungshilfen erklärt werden, sehr gut!