Spracherkennungssysteme – Fluch oder Segen?

29.01.2018, 14:55:00 (Kommentare: 0)

Schreibkraft versus Diktiersoftware – eine sehr persönliche Entscheidung

Der eine oder andere mag die Ansicht vertreten, dass das Schreiben von Diktaten durch eine Schreibkraft nicht mehr zeitgemäß sei. Dies kann einerseits richtig sein, andererseits auch wieder nicht. Wie so oft im Leben, kommt es ganz darauf an. Mit Dragon^® Naturally Speaking, Voice Pro^® aus dem Hause Linguatec oder etwa der kostenlosen Spracherkennung für Windows^® und MacSpeech Dictate^® hat die Industrie leistungsfähige Software zur Verfügung gestellt, die – bei richtiger Anwendung – die Erstellung von Texten erheblich erleichtert und hilft, die Anzahl der Rechtschreibfehler zu reduzieren.

Von diesen Programmen können grundsätzlich all jene profitieren, die von Berufs wegen zahlreiche Texte innerhalb kürzester Zeit verfassen müssen, wie beispielsweise Texter, Redakteure, Autoren, Blogger, Rechtsanwälte, Notare, Ärzte. Auch diejenigen, die zwingend diktieren müssen, weil sie ein Handicap haben, gehören nicht selten zu den begeisterten Nutzern der modernen Spracherkennungstechnik. Doch sollte vor dem Kauf eines Spracherkennungsprogramms auch darüber nachgedacht werden, ob man persönlich zur Gruppe jener Anwender zählt, die mit dieser Software hervorragend zurechtkommt.

Wird der Erwerb eines Programms zur Spracherkennung in Betracht gezogen, sollte bedacht werden, dass ein hohes Maß an Konzentration und Disziplin dazu gehört, jedes Satzzeichen – und dazu zählen auch Gedankenstriche und Anführungszeichen (Gänsefüßchen) – mitzudiktieren. Um diese Exaktheit beim Diktieren erzielen zu können, muss der fertige Satz praktisch vor dem Auge des Diktierenden stehen. So präzise diktieren können wohl nur die Wenigsten. Auch Textgestaltungen wie Fett- und Kursivdruck, Unterstreichungen, das Tief- und Hochstellen einzelner Zeichen und vieles mehr müssen bei der Erstellung von Texten mit bewältigt werden. Dragon^® Naturally Speaking beispielsweise ist hierfür mit einer Reihe von Sprachbefehlen ausgestattet. So lässt sich zum Beispiel der Cursor mit „drei Wörter nach links“ verschieben. Anschließend kann der Text mit Befehlen wie „streich das“ oder „markiere das“ bearbeitet werden. Doch all diese Befehle muss der Nutzer erst einmal auswendig lernen und dann auch präzise anwenden. Wer dafür nicht die notwendige innere Ruhe und Disziplin aufbringt, weil er vielleicht eine insgesamt unruhige Persönlichkeit ist oder sich vielleicht auch sonst im Umgang mit Technik etwas schwer tut, der sollte noch einmal darüber nachdenken, ob ein Spracherkennungsprogramm für ihn wirklich die richtige Lösung ist. Wer auf eine versierte Fachkraft zurückgreifen kann, der weiß, dass er sich um Sprachbefehle und Satzzeichen nicht kümmern muss, sondern seinen Gedanken in seinem natürlichen Redefluss freien Lauf lassen und sich ganz auf den Inhalt seines Textes konzentrieren kann. Punkt, Komma, Strich finden quasi von selbst in den Text.

Ein Programm zur Spracherkennung muss vom Anwender zunächst trainiert werden – und zwar von ihm persönlich. Es muss mit der spezifischen Aussprache des Nutzers vertraut gemacht werden, um den Text richtig erfassen zu können. Diese Trainingsphase verlangt dem ohnehin stressgeplagten Verfasser einiges an Geduld und Zeit ab, die nicht jeder aufbringen kann.

Jedes Spracherkennungssystem erfordert eine deutliche und gleichmäßige Aussprache. Das Verschlucken von Lauten am Wortende bedeutet für ein Spracherkennungsprogramm beim gegenwärtigen Entwicklungsstand eine schlechtere Erkennungsquote. Wer also nicht sehr deutlich spricht, eine sehr stark von Stimmungsschwankungen abhängige Aussprache besitzt oder das Sprechen eines starken Dialektes gewohnt ist, kann ein Spracherkennungssystem nur bedingt oder überhaupt nicht einsetzen.

Des Weiteren kann in der täglichen Praxis beobachtet werden, dass die Genauigkeit aller gängigen Programme zur Spracherkennung zunimmt, wenn der Sprecher eine deutliche Pause zwischen den einzelnen Wörtern macht. Dank einer Verbesserung der entsprechenden Systeme hat die Quote der richtig erkannten Worttrennungen zwar auch bei einer stark fließenden Sprache zugenommen, dennoch liefern kurze Sprechpausen der Software weiterhin wichtige Informationen für die richtige Worterkennung. Denjenigen, die normalerweise sehr schnell sprechen, ist daher zu empfehlen, sich beim Arbeiten mit der Spracherkennung vom gewohnten Redefluss zu lösen und langsamer zu sprechen.

Wer also den Erwerb eines Systems zur Spracherkennung in Erwägung zieht, sollte nicht zuletzt überprüfen, ob er auch die ganz persönlichen Voraussetzungen mitbringt, die für den erfolgreichen Einsatz einer Spracherkennungssoftware unerlässlich sind.

Weitere Grenzen der Spracherkennung

Ein Spracherkennungsprogramm auf derzeitigem Entwicklungsstand kann im Gegensatz zum Menschen nicht mitdenken. In jeder Sprache existieren eine Reihe sog. Homophone. Hierbei handelt es sich um Wörter, welche bei gleicher Aussprache unterschiedlich geschrieben werden. Am Anfang ihrer Entwicklung konnten Spracherfassungssysteme diese Wörter kaum unterscheiden. Inzwischen wurden statistische Verfahren entwickelt, welche aus dem Sinnzusammenhang auf die richtige Schreibweise schließen lassen. Auf diese Weise lässt sich mit einem professionellen Programm ein „das“ in der Regel korrekt vom „dass“ trennen. Wie gut dies funktioniert, hängt vom jeweils gewählten Spracherkennungssystem ab.

Es gibt aber durchaus Sätze, in welchen unterschiedliche Schreibweisen möglich sind, zwischen denen jedoch ein erheblicher Bedeutungsunterschied besteht. „Ich habe in St. Petersburg liebe Genossen.“ und „Ich habe in St. Petersburg Liebe genossen.“ ist ein in diesem Zusammenhang gern zitiertes Beispiel, das die Problematik eindrücklich aufzeigt. Auch der Unterschied zwischen „mehr“ und „Meer“ ist nicht in allen Fällen eindeutig. Der Nutzer eines Systems zur Spracherkennung muss daher unbedingt Zeit für die kritische Prüfung des von ihm gesprochenen Textes auf die inhaltlich richtige Umsetzung einkalkulieren.

Teilweise wird ein Vorteil der Diktiersoftware darin gesehen, dass Diktate immer und überall, also auch unterwegs, verfasst und später vom Diktierprogramm eine Transkription angefertigt werden kann. Spracherkennungssysteme leisten dies tatsächlich, jedoch sollte bedacht werden, dass externe Geräusche (z.B. Hintergrundgeräusche im Zug, Vogelgezwitscher, aber auch Geräusche von Kopiergeräten oder Druckern) die Erkennungsquote deutlich vermindern.

Interviews können gegenwärtig überhaupt nicht automatisiert transkribiert werden. Daran scheitert derzeit selbst das beste Spracherkennungsprogramm.

Gern übernehmen wir die redaktionelle Fertigstellung von Ihnen diktierter und durch Ihr Spracherkennungssystem transkribierter Texte.

Download des Beitrags "Spracherkennungssysteme – Fluch oder Segen?"

Zurück

Kommentare

Einen Kommentar schreiben

Nachrichten Archiv

2018

Zurück