Was ist Transkription?

Der Artikel enthält detaillierte Informationen über die Definition der Transkription, manuelle und automatische Methoden der Transkription, Tipps zur Verbesserung der Genauigkeit mit automatisierter Transkriptionssoftware und Tools, die bei der Beschleunigung des Überprüfungs- und Bearbeitungsprozesses helfen.

 

  1. Was ist Transkription?
  2. Manuelle Transkription
  3. Was ist eine Transkriptionssoftware?
  4. Was ist automatische Transkription
  5. Vorteile der automatischen Transkriptionssoftware
  6. Menschliche vs. automatische Transkriptionsdienste: Welchen sollte man verwenden?
  7. Wie erreicht man eine gute Genauigkeit bei der automatischen Transkription?
  8. Werkzeuge zur Beschleunigung des Überprüfungs-/Bearbeitungsprozesses

 

 

Was ist Transkription?

 

Das Wort Transkription wird in verschiedenen Bereichen verwendet, aber in der Linguistik beschreibt es einen Prozess der Umwandlung (Transkription) von Sprache in Text. Die Transkription von Audio resultiert in einer Transkriptions - Datei, die den Text enthält.  Diese Arbeit wird oft benötigt, um Interviews, Seminare, Meetings, Konferenzen, Diskussionsrunden zu transkribieren, Videos mit Untertiteln zu versehen usw. Die Umwandlung von Sprache in Text ist ein komplexer Prozess und erfordert von den Personen Schnelligkeit, Grammatikkenntnisse, Geduld und auch schnelle Tippfähigkeiten. Die Transkription wird von Forschern, Journalisten, Wissenschaftlern und Studenten verwendet und manuell oder mit automatischer Transkriptionssoftware durchgeführt.

Die Transkription wird von einer Vielzahl von Branchen und Experten für berufliche und akademische Zwecke genutzt. Grundsätzlich benötigt jeder, der gesprochene Informationen in eine schriftliche Form umwandeln muss, eine Transkription. Einige von ihnen sind

  • Forscher, Studenten, die ihre Abschlussarbeit schreiben, und Marketingfachleute müssen große Mengen an Audio- oder Videointerviews analysieren. Gesprochene Daten müssen für die Analyse transkribiert werden, um verschiedene Statistiken und Erkenntnisse aus den Daten zu erhalten
  • Journalisten führen wahrscheinlich mehr Interviews als jeder andere. Sie veröffentlichen das Interview meist in Textform, daher ist es unerlässlich, die Audiodateien zu transkribieren
  • Fachleute aus dem Gesundheitswesen und der Personalabteilung sowie Regierungsorganisationen müssen Besprechungen für die Berichterstattung transkribieren.
  • Medienproduktionsfirmen, die Videos, Podcasts, Filme und Fernsehsendungen erstellen, verwenden Transkripte, um Untertitel oder geschlossene Untertitel zu erstellen.

 

 

Manuelle Transkription

 

Sie können die Datei selbst transkribieren, indem Sie Software und Tools verwenden, die den Transkriptionsprozess erleichtern. In diesem Fall wird es lange genug dauern (für jede Stunde der Aufnahme sind mindestens 4 Stunden Arbeit für den professionellen Transkribierer erforderlich, und ein Anfänger braucht viel mehr). Diese Methode bietet in vielen Fällen nicht die notwendige Geschwindigkeit.
Alternativ können Sie einen erfahrenen Transkriptionisten beauftragen, der zwar weniger Zeit als Sie für die Transkription aufwendet, aber dennoch sind für eine Stunde Aufnahme mehrere Stunden Arbeit erforderlich. Außerdem wird es viel Geld kosten und eine eilige Transkription ist teurer.

 

 

Was ist eine Transkriptionssoftware?

 

Transkriptionssoftware ist ein Computerprogramm, mit dem man mp3 in Text umwandeln kann. Dem Benutzer stehen Werkzeuge zum Transkribieren online Verfügung, um das Audiofragment abzuspielen/zu pausieren und den gesprochenen Text einzugeben und den Vorgang dann für alle Audiodaten zu wiederholen. Die Hauptkomponenten der Transkriptionssoftware ist ein Audioplayer mit Abspielen, Pause, Rückspulen, Ändern der Abspielgeschwindigkeit und anderen Funktionen sowie ein Texteditor. Die Software kann zusammen mit spezieller Hardware wie Fußpedalen zum Abspielen/Pausieren und Kopfhörern verwendet werden. Das Transkriptionsprogramm wird für die Transkription online aller Arten von Sprachaufnahmen wie Besprechungen, Interviews, Vorträgen, aber auch für das Hinzufügen von Untertiteln zu Videos verwendet. Im letzteren Fall werden in der Transkription App auch Zeitinformationen für jedes Stück Text hinzugefügt.

 

 

Was ist automatische Transkription?

 

Die automatische Transkriptionssoftware enthält eine Spracherkennungs-Technologie (Sprache-zu-Text), die die Sprache automatisch mit angemessener Genauigkeit in kurzer Zeit transkribiert und einen Texteditor mit integriertem Audioplayer zur leichteren Überprüfung und Bearbeitung des Transkripts bereitstellt. Sie reduziert den Zeit- und Arbeitsaufwand für die Transkription von Sprache in Text auf folgende Weise drastisch:

  • Das Audio wird automatisch mit einer Genauigkeit von 85-90% (bei guter Audioqualität) in sehr kurzer Zeit transkribiert, so dass die einzige Überprüfung und Fehlerkorrektur für den Benutzer bleibt.
  • Ein spezieller Texteditor spielt das Audiofragment für jeden ausgewählten Teil des resultierenden Textes ab und erleichtert so den Überprüfungs- und Korrekturprozess
  • Zeitstempel werden automatisch für jedes Wort bestimmt, so dass Untertitel automatisch extrahiert werden können. Sie können damit Untertitel in Videos einfügen.
  • Bei der Audiowiedergabe wird jedes abgespielte Wort in der Transkription zur leichteren Überprüfung hervorgehoben

 

 

Vorteile der automatischen Transkriptionssoftware

 

Seit ihrer Einführung hat die automatische Transkriptionssoftware viele wichtige Funktionen mitgebracht, von denen die Benutzer profitieren.

Details

Sie haben vielleicht ein Notizbuch dabei, aber es ist fast unmöglich, alle wichtigen Informationen aufzuschreiben. Vielleicht müssen Sie sich an ein bestimmtes Buch oder einen Autor erinnern, den der Lehrer empfohlen hat, oder an eine Information, die Sie in der Besprechung verpasst haben, weil Sie durch etwas abgelenkt waren. Wenn Sie auf Ihr Notizbuch schauen, ist es nicht da. Es gibt nichts, worüber Sie sich Sorgen machen müssten. Die automatische Transkriptionssoftware wandelt die Audiodaten von Anfang bis Ende in Text um, d.h. sie enthält alle Details. Sie können jedes Wort/Thema finden, das Sie wollen. Es kann auch Personen mit einer kurzen Aufmerksamkeitsspanne helfen, die sich nicht länger als eine bestimmte Zeit auf Aufgaben konzentrieren können, ohne abgelenkt zu werden.

Stichwortsuche

Da Sie die vollständige Transkription des Audios haben, können Sie mit der Stichwortsuche (Strg+F) einfach durch den Text navigieren. Mit Hilfe dieser Funktion können Sie nachholen, was Sie während der Aufnahme verpasst haben könnten. Außerdem können Sie durch Klicken auf einen beliebigen Satz, der mit dem Thema zusammenhängt, an das Sie sich nur schwer erinnern können, den zu diesem Satz gehörenden Audioteil abspielen.

 
Spart Ihre Zeit und Geld

Natürlich können Sie versuchen, die Aufnahme selbst zu transkribieren oder einen menschlichen Transkribenten zu beauftragen, aber das kostet Sie zu viel Zeit und Geld. Mit Hilfe der Software können Sie eine einstündige Datei in weniger als einer Stunde und für ein Vielfaches weniger Geld transkribieren.

Identifiziert verschiedene Sprecher

Die Software arbeitet mit der Speaker Diarization-Technologie. Sie kann die Anzahl der Personen im Raum identifizieren. Daher werden Sie keine Schwierigkeiten haben, die Zitate den jeweiligen Besitzern zuzuordnen. Sie müssen nur darauf achten, dass die Aufnahmequalität gut ist.

Hilft bei einer Zusammenfassung des Ereignisses

Das Transkript ist eine dokumentierte Darstellung der Veranstaltung und enthält alle Details, die auf der Veranstaltung besprochen wurden, so dass man sich einen Überblick über die Veranstaltung verschaffen kann, ohne viel Zeit mit dem Abhören zu verbringen.

Hilft Ihnen, schnell zu veröffentlichen

Forscher, Journalisten und andere Nutzer von Interview-Transkriptionsdiensten müssen ihre Originalarbeit so schnell wie möglich veröffentlichen, bevor es andere tun. Eine qualitative Studie erfordert zum Beispiel die Transkription vieler Stunden von Audio-/Video-Interviews und Beobachtungen. Diese manuell zu transkribieren oder einen professionellen Transkriptionisten zu engagieren, könnte hier zu langsam und teuer sein, die automatische Transkription beschleunigt diesen Prozess um ein Vielfaches.

Transkribiert große Archive von Audio/Video

Nachrichten, TV und Radio benötigen Stichwortsuche in tausenden Stunden von Audio-/Videoaufnahmen. Callcenter benötigen Transkriptionen großer Audioarchive von Anrufen zur Qualitätsbewertung und für Statistiken. Automatische Transkription macht riesige Datenarchive zugänglich, die manuell unmöglich zu transkribieren sind.

Macht Audio/Video für Behinderte zugänglich

Da die Spracherkennungstechnologie Zeitstempel für jedes Wort im automatisch generierten Transkript liefert, können Videountertitel leicht extrahiert werden. Obwohl automatisch generierte Untertitel nicht immer perfekt sind, sind sie für Menschen mit Hörbehinderungen immer noch besser als nichts. Deshalb ist die automatische Untertitelung bei einigen Video-Hosting-Diensten wie YouTube für einige Sprachen bereits im Einsatz.

Schützt sensible Informationen

Einige Firmenbesprechungen, psychologische Beratungsgespräche oder Forschungsinterviews im Gesundheitswesen können sensible Informationen enthalten, die nicht an menschliche Transkriptoren weitergegeben werden dürfen. Trotz der Tatsache, dass menschliche Transkriptionisten NDA und andere Verträge unterschreiben, um keine persönlichen oder vertraulichen Informationen preiszugeben, fühlen sich viele Patienten immer noch unwohl, wenn ihre Sprachaufnahmen von einer dritten Person abgehört werden. Automatische Transkriptionssoftware stellt sicher, dass außer dem Benutzer keine weitere Person in den Transkriptionsprozess involviert ist, und die Daten sind passwortgeschützt. Außerdem sind GDPR-konforme Anbieter von automatischen Transkriptionsdiensten gesetzlich verpflichtet, alle Daten von den Servern zu löschen und keine Protokolle zu hinterlassen, wenn der Benutzer mit der Transkription fertig ist und die Daten löscht (entweder über die Weboberfläche oder indem er das Support-Team um Löschung bittet).

 

Menschliche vs. automatische Transkriptionsdienste: Welchen sollte man verwenden?

 

Bei der großen Nachfrage, einer großen Menge an Informationen und zu erstellenden Inhalten nimmt die manuelle Transkription zu viel Zeit und Mühe in Anspruch. Obwohl automatische Transkriptionssoftwareprogramme an Popularität gewinnen, wird die manuelle Transkription in vielen Bereichen immer noch stark genutzt.

Bei der manuellen Transkription werden für die Erstellung eines Transkripts nicht Technologien, sondern die Dienste von Einzelpersonen genutzt. Dies geschieht durch Anhören der Audiodatei und Schreiben oder Abtippen des Textes. Im Vergleich dazu verwendet die automatische Transkription die Technologie der automatischen Spracherkennung (ASR), die den Ton automatisch in Text umwandelt. Schauen wir uns verschiedene Faktoren an und sehen wir, wie sie in jeder Hinsicht funktionieren.

Geschwindigkeit und Produktivität 

Wenn es um Geschwindigkeit geht, steht automatische Software zweifellos an erster Stelle. Automatische Transkriptionsdienste liefern Transkriptionen für dieselbe Audiodatei in wenigen Minuten, im Vergleich zu menschlichen Transkriptoren, die unter Umständen mehrere Tage benötigen. Pro Stunde dauert der Transkriptionsprozess mit automatischer Software etwa 10 Minuten, während die Transkription derselben Datei durch einen Menschen bis zu drei Tage dauern kann.

Genauigkeit 

Menschen sind bei der Transkription genauer (obwohl sich das in Zukunft ändern kann). Auch wenn die Technologie weiter fortgeschritten ist als je zuvor, kann ASR immer noch einige Fehler während des Prozesses machen. Die Hauptgründe dafür sind einige starke Akzente oder Dialekte, ein lauter Hintergrund oder zu viele Personen, die gleichzeitig sprechen.  Ein weiterer möglicher Nachteil der automatischen Transkriptionssoftware ist, dass sie auch Füllwörter oder wiederholte Wörter anzeigen kann, die nicht wichtig sind. Der menschliche Transkriptionist schneidet diese Füllwörter während des Transkriptionsprozesses heraus.  

Kosten

Dies ist einer der Hauptgründe, warum sich die Menschen für die automatischen Transkriptionsdienste entscheiden. Um die automatischen Dienste zu nutzen, zahlen Sie im Vergleich zum menschlichen Dienst ein Vielfaches weniger Geld. Das ist ein großer Geldbetrag, vor allem, wenn es sich um eine große Audiodatei handelt. Erwähnenswert ist auch, dass einige automatische Dienste Ihnen einen kostenlosen Tarif anbieten können. Sie können die Software mit diesem Plan testen oder sie sogar regelmäßig mit einigen zeitlichen Begrenzungen benutzen. Auf der anderen Seite ist es auch sehr schwierig, Transkribierer zu finden, die wissen, wie man Audio professionell transkribiert. Es gibt einen wachsenden Mangel an menschlichen Transkribierern auf dem Markt, und da immer weniger Personen für diesen Dienst zur Verfügung stehen, können die Kosten ebenfalls hoch sein.

Informationssicherheit 

Einer der Vorteile, die der automatische Transkriptionsdienst bietet, ist die Sicherheit der Informationen auf der Audiodatei. Wenn Sie über sensible Informationen verfügen, die Sie nicht an einen Dritten - einen menschlichen Transkribierer - weitergeben möchten, können Sie eine automatische Software.

Zusammenfassend lässt sich sagen, dass die Entscheidung für einen der beiden Dienste von den damit verbundenen Funktionen abhängt. Wenn Genauigkeit Ihre oberste Priorität ist und Sie sich keine großen Sorgen über Zeit und Kosten machen, sollten Sie sich für den menschlichen Service entscheiden. Dies gilt auch für schlechte oder verrauschte Audioaufnahmen, bei denen die automatische Transkription so viele Fehler aufweisen wird, dass die Bearbeitung schwieriger sein wird als die manuelle Transkription von Grund auf. Wenn Ihre Audioqualität gut genug ist und Sie sich einen viel kosten- und zeiteffektiveren Service wünschen, ist die automatische Transkription der richtige Weg für Sie.

 

 

Wie erreicht man eine gute Genauigkeit bei der automatischen Transkription?

 

Obwohl eine automatische Transkriptionssoftware das Transkribieren von Audiodateien erleichtert, sind einige Schritte erforderlich, um eine genaue Abschrift zu erhalten. Die Person, die das Interview, die Fokusgruppendiskussion, das Meeting usw. aufnimmt, sollte bei der Aufnahme Folgendes sicherstellen:

  • Stellen Sie sicher, dass das Aufnahmegerät intakt ist und mit vollem Potenzial funktioniert. Es sollte keine Probleme bei der Aufnahme der Stimmen haben, daher ist es wichtig, dass die Mikrofone in gutem Zustand und sauber sind. Machen Sie eine Testaufnahme und hören Sie zu, um sicherzustellen, dass die Aufnahmequalität hoch ist. Das Aufnahmegerät sollte außerdem über genügend Akku und Speicher für die Aufnahme des Interviews verfügen.
  • Das Mikrofon sollte sich in der Nähe der Sprecher befinden, maximal ein oder zwei Meter. Wenn Sie also ein Student sind, der in der letzten Reihe in der Vorlesung sitzt und die Stimme aufnimmt, sollten Sie keine hohe Genauigkeit von einer automatischen Transkriptionssoftware erwarten. Sie können das Aufnahmegerät in der Hand in der Nähe des Sprechers halten oder auf den Tisch vor ihm/ihr legen. Wenn es mehrere Redner gibt, ist es am besten, sie um einen Tisch oder in einer Runde sitzen zu lassen, um sicherzustellen, dass jeder in der Nähe des Mikrofons ist. In großen Meetings oder Konferenzen sollten die Redner zum Mikrofon kommen und sprechen, anstatt von ihrem Platz aus zu sprechen oder Fragen zu stellen. Es ist am besten, für jeden Sprecher in der Besprechung ein separates Mikrofon zu haben, wie in Konferenzräumen, und die Stimme in separaten Audiokanälen aufzunehmen.
  • Stellen Sie sicher, dass immer nur ein Sprecher gleichzeitig spricht. Die automatische Transkriptionsgenauigkeit sinkt drastisch, wenn zwei oder viele Personen gleichzeitig sprechen, da dies derzeit eine der schwierigsten Forschungsherausforderungen in der Spracherkennung ist.
  • Der Pegel der Hintergrundgeräusche und des Echos ist wesentlich für die Qualität der Aufnahme und damit der Niederschrift. Versuchen Sie, die Aufnahme an einem ruhigen Ort mit so wenig Hintergrundgeräuschen wie möglich durchzuführen. Man sollte es vermeiden, Interviews an überfüllten Orten, mit Hintergrundmusik oder in großen Räumen mit Echo durchzuführen.

Unabhängig davon, ob der Transkriptionsprozess manuell oder automatisch durchgeführt wird, bietet das Befolgen dieser Schritte die Chance auf eine gute Aufnahmequalität, die der Hauptfaktor für eine gute Qualität des Transkripts ist. Selbst die Beauftragung eines menschlichen Transkriptionsdienstes wird Sie mehr kosten, wenn die Audioqualität schlecht ist.

 

Werkzeuge zur Beschleunigung des Überprüfungs-/Bearbeitungsprozesses

 

Der erste Schritt bei der Transkription Ihrer Datei mit der automatischen Transkriptionssoftware ist das Hochladen Ihrer Audio- oder Videodatei und deren automatische Transkription mit der Sprache-zu-Text-Technologie. Normalerweise dauert dies weniger als die Dauer der Audiodatei. Anschließend wird der Transkriptionsentwurf in einem speziellen Texteditor mit integriertem Audioplayer geöffnet. Der Audioplayer kennt das Timing eines jeden Wortes im Text. Im Voicedocs Transcription Editor können Sie die Transkription auf zwei Arten überprüfen und bearbeiten:

Zunächst können Sie die Funktion "Alles abspielen" des Audioplayers verwenden. Bei der Audiowiedergabe wird jedes abgespielte Wort im Text hervorgehoben, so dass Sie leicht erkennen können, ob ein Wort falsch erkannt wurde. Die Wiedergabe wird pausiert, wenn Sie auf das Wort klicken und es bearbeiten, dann können Sie die Wiedergabe von diesem Teil bis zum Ende fortsetzen.

Zweitens können Sie mit den Pfeiltasten auf der Tastatur durch den Text navigieren. Jedes Textfragment um den Cursor wird automatisch abgespielt, damit Sie sehen können, ob es Fehler gibt. Der Ton des Fragments wird automatisch abgespielt, wenn Sie zu einem neuen Fragment wechseln. Die Fragmentlänge kann über die Symbolleiste geändert werden. Das aktuelle Fragment kann durch Drücken von Strg+Leertaste erneut abgespielt werden.

Sie können die Audiowiedergabegeschwindigkeit in der Symbolleiste ändern, um die Überprüfung bei beiden Methoden zu beschleunigen. Eine der besten Praktiken ist es, alle Audiodaten nach Abschluss aller Bearbeitungen noch einmal von Anfang bis Ende abzuspielen, um eine abschließende Überprüfung durchzuführen.
Nach dem Bearbeiten und Überprüfen können Sie auf die Schaltfläche "Exportieren" drücken und den Text in verschiedenen Formaten wie DOC, TXT, SRT oder JSON auf Ihr Gerät herunterladen. Sie können beim Herunterladen des Transkripts auch Zeitstempel für jeden Satz einfügen.

Das Untertitel-Editor-Tool mit weiteren Funktionen zum Hinzufügen von Untertiteln zu Videos wird in einem separaten Artikel behandelt.