Schnellster Transkribierer für Audio- und Videodateien

Das menschliche Gehirn ist der schnellste Transcriber  

Trotz vieler Ansätze, um eine Transkription von gesprochener Sprache, Audio- und Videoaufnahmen möglichst schnell durchführen zu können, erweist sich die Transkription als immer noch sehr langsamer Vorgang. Bisher konnte dieser Vorgang kaum durch bestehende Software- und Techniklösungen beschleunigt werden. Das menschliche Gehirn spielt hier die zentrale Rolle, ohne dieses ist dieser Vorgang kaum möglich.
Was verhindert einen vollautomatischen Transkriptionsprozess? In diesem Artikel werden Sie einige Antworten auf diese Fragestellung finden.
Der Vorgang der Transkription (in Echtzeit oder von vorher aufgenommenen Material) besteht aus zwei Schritten:
1. Spracherkennung durch den Zuhörer;
2. Transformation der erkannten Sprache in abgetippten Text, d.h. das „Eintippen“ auf der Tastatur.
An diesem ersten Schritt nimmt das menschliche Gehirn (quasi als „elektronisches Organ“) teil, es arbeitet schnell genug, speziell in Bezug auf die Spracherkennung. Das menschliche Gehirn schlägt in Bezug auf Geschwindigkeit und Genauigkeit jeden modernen Computer.
Allerdings wird das menschliche Gehirn beim zweiten Schritt nicht „benötigt“, da in diesem Schritt nur die menschlichen Hände (quasi das „mechanische Organ“) eingesetzt werden. Die Hände stellen das Vehikel dar, welches den erkannten Text vom Gehirn in den Computer „befördert“.
Da es keinen anderen direkten Weg gibt, um erkannten Text „direkt aus dem Gehirn auszulesen“, muss der Text immer noch manuell abgetippt werden.
Im Vergleich zur automatischen Spracherkennung liegt der Hauptgrund in der langsamen Tippgeschwindigkeit, warum die Transkription so langsam ist.
Könnte man die Tastatur vom Transkriptionsprozess abkoppeln - z. B. durch eine „direkte“ Verbindung vom Gehirn zum Computer -, hätten wir die wohl schnellste und genaueste Transkriptionsmaschine, die es auf der ganzen Welt gäbe: Das Gehirn erkennt den Text und der Text wird sofort an den Computer weitergegeben (Abb. 1).

Abb.1. Theoretische Transkriptionsmaschine

 

Eine Transkriptionssoftware transkribiert viel schneller als ein menschlicher Transkribierer

Leider entspringt Abbildung 1 nur unserer Fantasie. Daher ist es notwendig, eine realistischere Methode zu finden, um den Transkriptionsprozes zu beschleunigen.
Das Gehirn durch ein Computer-Transkribier-Programm zu ersetzen, das die menschliche Sprache automatisch erkennt und es in Text umwandelt, stellt die beste Methode dar, um den Transkriptionsprozess zu beschleunigen (Abb. 2).
Auf der Basis von modernen mathematischen Modellen wie z. B. künstlichen Neuronalnetzen, der Nutzung von Parallelcomputern, Machine Learning etc. ist es möglich, Computersysteme für eine automatische Spracherkennung zu konstruieren. Diese Systeme erlauben die Erkennung menschlicher Sprache mit höchster Genauigkeit und konvertieren diese in Text.
Aber solche Systeme können das menschliche Gehirn nicht vollständig ersetzen. Daher muss nach einer automatisch durchgeführten Transkription der erkannte Text nachbearbeitet und auf mögliche Fehler untersucht werden.
Wenn es also notwendig ist, den fertigen Text nach der automatischen Transkription auf jeden Fall nachzueditieren, welchen Vorteil bietet dann ein automatischer Transcriber? Die Antworten auf die Fragen finden Sie im nächsten Teil dieses Artikels.

Voicedocs Software bietet den wohl schnellsten Transcriber auf dem Markt an

Die allermeisten Probleme der manuellen Texttranskription (Abtippen) werden durch den Transcriber gelöst, welcher von Voicedocs Software entwickelt worden ist.
Der Vergleich eines „manuell“ abgetippten zu einem automatisch transkribierten Textes durch Voicedocs Transcriber zeigt die unbestreitbaren Vorteile des letzteren.

Abb. 2 Voicedocs Transcriber
Warum? Weil der wohl „kontraproduktivste“ Teil der manuellen Transkription – das Zuhören und Abtippen - bei der automatischen Transkription nicht miteinbezogen werden muss. Der automatische Transcriber benötigt daher erheblich weniger Zeit. Für eine Stunde Audiotranskription muss man 7-8 Stunden manueller Arbeit einrechnen. Aber im Falle einer automatischen Audio-Transkription für eine Stunde Audiomaterial dauert dies maximal eine Stunde. Einer der wichtigsten Vorteile der automatischen Transkription ist die Tatsache, dass kein Mensch dafür benötigt wird (zusätzlich schützen Sie Ihre Nerven). Also ist der Effekt offensichtlich.
Den transkribierten Text nachzubearbeiten, stellt Sie vor keinerlei Probleme. Zu diesem Zweck ist ein spezieller Editor entwickelt worden. Sie können sich Satz für Satz jedes Audiofragment vorspielen lassen, indem sie einfach auf den transkribierten Text klicken. Der Editor bietet viele andere nützliche Optionen, wie z. B. die Abspiel-Geschwindigkeit ändern, Zeitstempel für die Erstellung von Untertiteln einfügen etc. Am Ende können Sie den transkribierten Text in unterschiedlichen Formaten (doc, srt, ...) herunterladen.
Ein weiterer wichtiger Faktor ist zudem die automatische Interpunktionsfunktion (Satzzeichen und Großbuchstaben), die vom Editor automatisch ausgeführt wird.
Ganz besonders hervorzuheben ist, dass - selbst bei schlechter Transkriptionsqualität – es der von Voicedocs Software entwickelte Editor Ihnen erlaubt, schnell Fehler zu korrigieren. In jedem Fall ist die Zeit, die für eine automatische Transkription benötigt wird, um ein Vielfaches geringer als beim „manuellen Abtippen“.
Derzeit ist der Transcriber von Voicedocs die schnellste Transkribier-Software auf dem Markt. Die neuesten wissenschaftlichen Errungenschaften im Bereich des maschinellen Lernens wurden in den Entwicklungsprozess integriert. Als Ergebnis liefert der Transcriber von Voicedocs hervorragende Praxisergebnisse.