Das Wichtigste in Kürze
  • Spracherkennungssoftware kann Ihre Stimme über ein Mikrophon digitalisieren und in einen Fließtext umwandeln. So können Sie z.B. ein ganzes Buch diktieren, ohne Ihre Hände dazu zu verwenden.
  • Ob für kurze Notizen oder die Masterarbeit: Spracherkennung funktioniert sehr schnell und kann Ihnen Fehler und Zeit ersparen. Buchstabendreher oder falsche Formatierungen kommen fast nie vor.
  • Mit dem richtigen Sprachprogramm können Sie sogar Ihren PC über Sprachbefehle durch das Internet steuern. Was beim Smartphone schon Standard ist, funktioniert beim PC nicht weniger effektiv.

„Rede mit Siri wie mit einem Freund und Siri kann dir helfen, Dinge zu erledigen – wie Nachrichten zu verschicken oder jemand anzurufen.“

apple.com (29.08.2016)
Über die Funktion von iOS – Siri

Es ist so weit: Wir kommunizieren mit den Maschinen. Was früher noch nach Science-Fiction klang, ist heute Realität. 62% der Apple-User benutzen den Sprachassistenten Siri inzwischen regelmäßig bei der Fahrt im Auto.

Sprachsteuerung in Form eines Diktierprogramms begegnet uns oft im Alltag:

  • Das Smartphone hilft beim Erstellen der Einkaufsliste.
  • Das Navi kann per Spracherkennung programmiert werden.
  • Die Spielekonsole hört auf Ihre Stimme.

Die Kommunikation mit der Technik kann man argwöhnisch betrachten – praktisch ist sie allemal. Schreibfehler werden minimiert, das Arbeitstempo wird erhöht und die Hände können anderweitig eingesetzt werden. Die Meinungen sind zwiegespalten: die einen sehen viele Chancen in dieser Entwicklung, die anderen befürchten eine zunehmende Abhängigkeit von der Technik. Einen interessanten Artikel zu diesem Thema finden Sie hier.

In unserem Spracherkennungssoftware-Vergleich 2020 möchten wir Ihnen erklären, worauf Sie achten müssen, wenn Sie die beste Spracherkennungssoftware kaufen wollen.

1. Spracherkennungssoftware: Ein Blick hinter die Kulissen

1.1. Was kann eine Spracherkennungssoftware?

Eine Spracherkennungssoftware ist ein Programm, das Ihre gesprochenen Worte erkennen und zeitgleich digitalisieren kann. Diverse Spracherkennungssoftware-Tests helfen dabei dieses Programm möglichst Benutzerfreundlich zu gestalten. Die Spracherkennung läuft dabei meist über ein Headset oder ein separates Mikrofon, in das Sie sprechen. Die Software hilft Ihnen z.B. beim:

  • Brainstorming: Sprechen Sie einfach die Gedanken aus, die Ihnen gerade durch den Kopf schwirren: seien es Träume, Ideen oder Pläne. Sie müssen noch nicht einmal einen Finger krümmen, denn die Software übernimmt das Aufschreiben wie von Geisterhand.
  • Diktieren: Sie haben einen konkreten Text im Kopf oder auf dem Papier? Erzählen Sie ihn der Diktiersoftware, um ihn in kurzer Zeit als digitalisiertes Dokument auf dem Computer zu haben.
  • Arbeiten: Gerade in Berufen, in denen viele Mails verfasst, Berichte geschrieben oder Dokumente mit Text gefüllt werden müssen, kann eine Spracherkennungssoftware zum idealen Helfer werden. Selbst versierte Schreibkräfte kommen nicht an die Geschwindigkeit eines Spracherkennungsprogramms heran.

Die Steuerung des PCs über Sprache ist natürlich gewöhnungsbedürftig, kann die Arbeit aber enorm erleichtern. Sie müssen nicht mehr jedes Wort einzeln tippen, bekommen einen Text in der gleichen Zeit etwa dreimal schneller fertig und müssen dabei nicht einmal am Schreibtisch sitzen.

1.2. Wer entwickelt Spracherkennungssoftware bzw. Spracherkennungsprogramme?

Fakten zum Unternehmen Nuance
  • 14.000 Mitarbeiter
  • Niederlassungen in 35 Ländern
  • Unternehmenssitz in Massachusetts, USA
  • Umsatz von 2 Milliarden US-Dollar im Jahr

(Quelle: www.nuance.de)

Wer ein Spracherkennungsprogramm benutzt, wird vermutlich ein Produkt des amerikanischen Herstellers Nuance verwenden. Schließlich steckt die Software dieses Unternehmens hinter den meisten Spracherkennungsprogrammen. Gerade die Nuance-Marke Dragon NaturallySpeaking hat sich sowohl im privaten als auch im wirtschaftlichen Bereich als eines der beliebtesten Produkte durchgesetzt.

Sogar Apple hat für Siri auf Nuance zurückgegriffen, wie auch viele Hersteller von Navigationssystemen oder Smart-TVs.

Siri: Apple wäre nicht Apple, wenn das Unternehmen nicht auch im Bereich der Spracherkennung forschen würde. Die nächste Siri-Version soll mit einer eigenen Spracherkennungssoftware ausgestattet werden. Näheres zu diesem Thema finden Sie hier.

1.3. Wer braucht Spracherkennungssoftware?

Ein Programm zur Spracherkennung aus unserem Spracherkennungssoftware-Vergleich kann für jeden nützlich sein, der mit digitalisierten Texten arbeitet:

  • Schüler, Studenten, Lehrer, Dozenten
  • Sekretäre, Journalisten, Redakteure
  • Beamte, Juristen, Manager
  • Ärzte, Personalleiter etc.

Zwar lassen sich Texte auch per Hand eintippen, doch die Verbesserungen im Bereich der Spracherkennung machen den Einsatz von Software immer attraktiver. Während zu Beginn der Entwicklung von Spracherkennungssoftware noch viele Worte falsch verstanden wurden, bewerben Hersteller ihre Produkte nunmehr mit einer Zuverlässigkeit von 99%.

Eine zuverlässige Spracherkennungssoftware nimmt Ihnen das mühsame Schreiben von Texten ab und verhindert mitunter unliebsame Rechtschreibfehler. Schließlich sind Buchstabendreher, vergessene Kommata oder ausgelassene Worte Phänomene, die in der gesprochenen Sprache nicht oder zumindest nur sehr selten vorkommen.

Lernen durch Hören: Nicht nur auditive Lerntypen profitieren vom Hören und Sprechen. Wenn Sie besonders gut lernen, indem Sie hören, sollten Sie bei Ihrem persönlichen Spracherkennungssoftware-Testsieger auf die Vorlesefunktion achten. So können Sie Ihrem PC nicht nur sagen, was er schreiben soll, sondern ihn das Ganze auch noch vorlesen lassen.

2. Kaufberatung: Welche Funktionen sollte eine Spracherkennungssoftware haben?

In unserem Spracherkennungssoftware-Vergleich 2020 ging es unter anderem um die verschiedenen Funktionen, mit denen die Programme ausgestattet worden sind. Die folgende Übersicht zeigt Ihnen, was bei Spracherkennungssoftware-Tests wichtig ist und soll Ihnen dabei helfen zu entscheiden, auf welche Elemente Sie nicht verzichten möchten.

Kategorie Funktion
Kompatibilität Die Kompatibilität des Spracherkennungsprogramms mit anderen Programmen, wie z.B. Word oder OpenOffice, ist gerade für die Textverarbeitung relevant. Wenn Sie also einen längeren Text mit Hilfe der Spracherkennung erstellt haben, möchten Sie womöglich noch einige Worte via Tastatur ergänzen und können dies – dank vorhandener Kompatibilität – problemlos erledigen.

sehr wichtig, sollte bei keiner Software fehlen

Textbearbeitung Das Kernstück der Software ist die Generierung bzw. Bearbeitung von Text mit der eigenen Stimme. Verwechseln Sie dabei nicht Spracherkennung mit Texterkennung, denn letztere (auch OCR-Software genannt) dient der Digitalisierung von gescannten Texten. Die Textbearbeitung setzt sich zusammen aus dem Diktieren von Worten sowie der Navigation via Sprachbefehl.

sehr wichtig, muss jedes Programm ermöglichen

Vorlesen Einige Spracherkennungsprogramme sind mit einer Vorlese-Funktion ausgestattet. Diese ermöglicht es Ihnen, sich den geschriebenen Text vom Programm mit verschiedenen Stimmen vorlesen zu lassen – ähnlich wie es bei Siri der Fall ist.

wichtig, wenn Sie z.B. Texte transkribieren wollen

Headset Für die Verwendung der Spracherkennung ist ein Mikrofon obligatorisch, denn sonst kann das Programm Ihre Stimme nicht erkennen. Aus diesem Grund sind bei einigen Programmen Headsets bereits im Preis inbegriffen. Leider haben diese Produkte oft eine schlechte Qualität. Wir empfehlen Ihnen, ein Marken-Headset aus unserem Headset-Vergleich zu kaufen.

unverzichtbar, um das Programm verwenden zu können

Das Mikrofon als Schnittstelle: Die Bedeutung des richtigen Mikrofons ist für die Verwendung von Spracherkennungssoftware besonders wichtig. Im nächsten Kapitel erklären wir Ihnen, worauf es wirklich ankommt.

3. Ist das Mikrofon die Verbindung zwischen Mensch und Maschine?

3.1. Tipps zur Auswahl

Wenn Sie ein Mikrofon kaufen möchten, haben Sie eine große Auswahl an Möglichkeiten:

  • Kondensator-Mikrofon: Dieser Typ von Mikrofon wird von Sängern, Radiomoderatoren und professionellen YouTube-Stars verwendet. Es hat eine hohe Klangqualität und filtert störende Umgebungsgeräusche sehr gut heraus. Dafür müssen Sie Kopfhörer zusätzlich erwerben, falls Sie Ihre Stimme gut hören möchten.
  • Stereo- oder Mono-Headset: Mikrofon und Kopfhörer in einem! Der Vorteil eines guten Headsets liegt auf der Hand, doch oftmals liefern die Hersteller nur mittelmäßige Produkte und vernachlässigen die montierten Mikrofone.
  • Wireless-Headset: Diese Art von Headset funktioniert ganz ohne Kabelverbindung. Sie können sich bequem auf das Sofa legen und reden – Ihr PC empfängt Ihre Stimme via Funk oder Bluetooth (falls Ihr PC keine Bluetooth-Funktion besitzt, können Sie ganz einfach mit einem Bluetooth-Adapter nachhelfen).

Wählen Sie ein Mikrofon, das Ihren Ansprüchen gerecht wird. Wer den Geldbeutel schonen will, bekommt mit einem einfachen Headset ein gutes Produkt für wenig Geld. Gute Kondensator-Mikrofone kosten deutlich mehr, liefern dafür aber auch exzellente Qualität in Zusammenarbeit mit einer guten Diktiersoftware ab. Wer gerne Beweglich bleibt, ist dagegen mit einem Bluetooth-Headset gut bedient.

3.2. Tipps zur Anwendung

  • Spracherkennung funktioniert inzwischen schnell und erstaunlich flüssig. Nicht ohne Grund nennt Nuance sein Programm NaturallySpeaking, was in der Übersetzung etwa: natürliches Sprechen bedeutet. Setzen Sie den Cursor Ihrer Maus auf die zu bearbeitende Seite und warten Sie, bis Sie die blinkende Schreibmarke sehen. Ist dies der Fall, können Sie einfach lossprechen, ohne sich Gedanken um die Geschwindigkeit des Programms zu machen. Im Gegenteil: Je flüssiger und deutlicher Sie sprechen, desto besser kann die Software die Interpunktion entschlüsseln. Bemühen Sie sich nicht künstlich langsam zu reden, aber bemühen Sie sich um eine klare und deutliche Aussprache.
  • Fehler sind nicht zu vermeiden und gerade günstige Spracherkennungssoftware kann Sie oftmals falsch verstehen. In diesem Fall ist von großem Vorteil, sich mit der sprachgesteuerten Bearbeitung zu beschäftigen. Wenn Sie z.B. Dragon NaturallySpeaking von Nuance benutzen, können Sie mit den Worten: „Korrigier XYZ“ das von Ihnen genannte Wort korrigieren lassen (das ist nur eines von vielen Beispielen, mehr erfahren Sie in Kapitel 4).
  • Sprachsteuerung geht inzwischen weit über die bloße Ein- und Ausgabe von Text hinaus. Sie können Ihren Windows oder Mac PC ohne Maus oder Tastatur bedienen. Sagen Sie: „Durchsuche Google nach XYZ“ und schon erhalten Sie ein Suchergebnis; sagen Sie: „Drücke F5“ und das Programm wird die entsprechende Taste für Sie drücken; sagen Sie: „Mikrofon ausschalten“ und das Mikrofon wird ausgeschalten.
  • Moderne Spracherkennungssoftware lernt sogar dazu: Wenn Sie häufig bestimmte Wortkombinationen gebrauchen, wird die Software dies erahnen und Sie viel besser verstehen lernen. Dies steigert die Produktivität gegenüber dem gewöhnlichen Tippen enorm.

4. Wird man durch die Spracherkennungssoftware Dragon verstanden?

Die wohl bekannteste Software für Spracherkennung wird vom Unternehmen Nuance produziert. Sie wird unter verschiedenen Namen vertrieben, wie z.B.:

  • Dragon
  • Dragon Speak
  • Dragon Naturally
  • Dragon Naturally Speaking oder
  • Dragon NaturallySpeaking

Die Dragon Spracherkennung für Windows 10 ist eine der derzeit effektivsten Softwares und erreicht im Einsatz die Qualität eines Diktiergerätes. Hier sehen Sie die Vor- und Nachteile von Dragon NaturallySpeaking auf einen Blick:

    Vorteile
  • umfangreiche Funktionen, ein Diktat erledigt sich schnell und intuitiv
  • die Spracherkennungssoftware (für Mac & Windows 10) lässt sich über eine Vielzahl von Befehlen steuern
    Nachteile
  • im Vergleich zu einer Spracherkennungssoftware als Freeware ist Dragon recht teuer

Allgemeine Befehle für die Spracherkennungssoftware Dragon

Egal ob Sie die Spracherkennungssoftware auf dem Mac oder auf Windows benutzen: die Sprachbefehle bleiben immer gleich. Schließlich arbeiten Sie mit Sprachbearbeitungsprogrammen, deren grundlegende Elemente – wie Zeilen, Absätze und Satzanfänge – immer gleich bleiben. Einige wichtige Befehle, die auch bei einem Spracherkennungssoftware-Test geprüft werden, um beim Arbeiten Zeit zu sparen, haben wir für Sie zusammengetragen:

Thema gesprochener Befehl
Zahlen In einem Text kommen häufig Zahlen vor. Wenn Sie Ihrem Spracherkennungsprogramm das Wort „Drei“ diktieren, wird in Ihrem Fließtext auch „Drei“ stehen. Sagen Sie zuvor jedoch „schreib Drei“ wird im Text eine „3“ erscheinen. Sagen Sie stattdessen „römisch Zweitausend“ wird das Spracherkennungsprogramm „MM“ schreiben.
Einheiten Die korrekte Angabe von Einheiten stellt gerade bei wissenschaftlichen Arbeiten nicht selten eine Hürde dar, denn die Werte müssen immer einheitlich geschrieben werden. Spracherkennungssoftware nimmt Ihnen hier die Arbeit ab: Sagen Sie dem Programm einfach „ein Meter dreißig“ und es wird „1,30 m“ mitsamt Leerzeichen aufschreiben.
Navigation Sie benutzen zwar keine Maus, doch Ihre Stimme kann sie kurzerhand ersetzen. Sagen Sie „Cursor vor XYZ“ und die Schreibmarke springt an die entsprechende Stelle; sagen Sie „Maus Rechtsklick“ und die Funktion des Rechtsklicks wird ausgeführt. Dergestalt intuitiv verläuft die gesamte Navigation: „Drücke Eingabetaste“, „Neue Zeile“, „Gehe zum Zeilenanfang“.
Nuance: Mehr zur Steuerung von Nuance Dragon NaturallySpeaking erfahren Sie hier.

5. Windows, Mac oder Android: Entscheidet das Betriebssystem?

Windows

Wenn es um Spracherkennungssoftware für Windows geht, können Sie sich zwischen Nuance und Linguatec entscheiden. Ob dabei Dragon NaturallySpeaking oder Voice Pro das bessere Programm ist, lässt sich nicht leicht beantworten. Während Voice Pro die günstigere Alternative mit zuverlässigem Ergebnis ist, muss man für Dragon grundsätzlich mehr Geld bezahlen – erhält dafür jedoch eine Software mit besserer Übersichtlichkeit und schnellerer Verarbeitung von Text.

Stiftung Warentest: Im Januar 2004 hat sich die Stiftung Warentest mit Spracherkennungssoftware auseinandergesetzt. Zu dieser Zeit hat sich Linguatec Voice Pro 10 gegen Nucance Dragon NaturallySpeaking 7 in puncto Spracherkennung durchgesetzt. Inzwischen hat Nuance deutlich nachgebessert und dürfte in einem weiteren Test besser abschneiden.

Mac

Nuance produziert mit Dragon for Mac auch Spracherkennungssoftware für Mac-Nutzer. Sie können allerdings (falls Sie über Mac OS X verfügen), auch die Apple-Spracherkennungssoftware als Freeware nutzen. Gehen Sie dazu wie folgt vor:

  1. Navigieren Sie über das Apple-Menü und Systemeinstellungen zu „Diktat & Sprache“.
  2. Wenn Sie einen Text von Ihrem Mac erkennen lassen wollen, wählen Sie „Diktat“.
  3. Wählen Sie bei Bedarf erweiterte Diktierfunktionen aus oder entsprechende Dialekte.
  4. Setzen Sie die Eingabemarke auf das Textfeld, wählen Sie anschließend „Bearbeiten“ und „Diktat starten“.

Jetzt können Sie Ihrem Mac einen beliebigen Text diktieren, der anschließend im Textfeld erscheinen wird.

Android

Wer Spracherkennungssoftware für Android sucht, der wird zunächst auf die Google-Spracherkennung stoßen und in diesem Zusammenhang auf Google Now. Wie genau Google Now funktioniert und wie Sie damit kurze Nachrichten diktieren können, sehen Sie im folgenden Video.

Leider sind Android-Apps oftmals nur für kurze Sprachnachrichten oder Notizen bzw. Memos ausgelegt – umfassende Texte lassen sich damit nur schwerlich erstellen. Eine Alternative ist das (ebenfalls von Nuance produzierte) Swype Keyboard. Diese kostenpflichtige App dient zwar eigentlich zur schnelleren Eingabe von Buchstaben, weist jedoch auch eine zusätzliche Spracherkennungsfunktion für Android auf. Mehr zu diesem Thema erfahren Sie hier.

Linux

Spracherkennungssoftware für Linux steht den Ubuntu-Usern zur Verfügung. Unter den unscheinbaren Namen Simon und Sirius finden Sie zwei Open-Source-Programme für Ihr Linux-Betriebssystem.

Insbesondere die Sirius-Spracherkennungssoftware für Linux erregt nicht nur aufgrund des Namens Aufsehen. Die Entwickler der University of Michigan versuchen eine Open-Source-Alternative zu Siri zu entwickeln und haben dabei große Fortschritte im Bereich der Spracherkennung gemacht. Näheres zu Sirius erfahren Sie im folgenden Video:

6. Fragen und Antworten rund um das Thema Spracherkennungssoftware

6.1. Welche Spracherkennungssoftware empfiehlt Chip.de?

Die Redaktion von Chip.de hat in einem Spracherkennungssoftware Test im Januar 2015 Dragon NaturallySpeaking Premium mit der Note: Sehr Gut ausgezeichnet. Folgendes Fazit zieht Chip.de:

„Insgesamt hat NaturallySpeaking einmal mehr bewiesen, dass es in Sachen Spracherkennung/-steuerung den Standard setzt.“

CHIP Redaktion (01/2015)
(Internet-Computermagazin)

6.2. Gibt es Spracherkennungssoftware für Ärzte?

Ja, denn gerade Ärzte müssen viele Ihrer Arbeitsschritte dokumentieren und für jeden Patienten individuelle Akten anlegen. Diese Arbeit ist mühsam und verringert die Zeit, in der sich der behandelnde Arzt seinem Patienten widmen kann. Aus diesem Grund gibt es Spracherkennungssoftware im Medizin-Bereich, z.B. von Nuance, die eine Dragon-Version speziell für Mediziner herausgebracht haben. Näheres zu dieser Diktatsoftware finden Sie hier.

6.3. Kann Spracherkennungssoftware von Menschen mit Behinderung eingesetzt werden?

Ja, hier liegt eine der größten Stärken von Spracherkennungssoftware. Wer einen Computer weder mit Maus noch mit Tastatur problemlos bedienen kann, der profitiert umso mehr von der Navigation via Sprachbefehl. Lediglich ein Mikrofon ist notwendig und selbst Menschen mit Behinderungen können einen PC verwenden oder Texte verfassen und ins Internet stellen.

6.4. Wie funktioniert die Spracherkennung unter Windows 10?

Windows 10 und das Siri-Pendant Cortana können ebenfalls über Sprachsteuerung und ohne separate Sprachsoftware verwendet werden. Dazu müssen Sie nur folgende Schritte befolgen:

  1. Über das Windows-Symbol in der Taskleiste gelangen Sie ins Startmenü – dort klicken Sie einfach auf die Cortana-Kachel.
  2. In der Navigationsleiste am linken Rand des Fensters gibt es ein Buch-Symbol, über das Sie persönliche Einstellungen vornehmen können. Aktivieren Sie z.B. die Funktion „Hey Cortana“, können Sie sie mit eben diesem Sprachbefehl aktivieren.
  3. Anschließend können Sie mit Cortana via Mikrofon kommunizieren. Fragen Sie das Programm z.B. ob Sie einen Regenschirm brauchen werden, erhalten Sie Informationen über das aktuelle Wetter. Auch das Surfen im Internet geht so viel schneller. Sagen Sie: „Suche in Google nach einem Rezept für Focaccia!“ und Cortana wird das für Sie übernehmen.

Natürlich müssen Sie bedenken, dass Cortana zur vereinfachten Verwendung von Windows konzipiert worden ist – nicht etwa, um seitenweise Text zu produzieren. Dafür sollten Sie sich ein Programm aus unserem Spracherkennungssoftware-Vergleich aussuchen und mit einem guten Kondensator-Mikrofon arbeiten.

Laptop-Mikrofon: Für die Verwendung von Cortana können Sie auch Ihr Laptop-Mikrofon verwenden und müssen nicht etwa ein neues Headset kaufen. Über den Gerätemanager können Sie beim Unterpunkt „Audioeingänge und -ausgänge“ nachsehen, ob Ihr Gerät über ein Mikrofon verfügt. Selbiges hilft zwar bei der Kommunikation mit Cortana, weist aber oftmals eine minderwertige Qualität auf.

Bildnachweise: (chronologisch bzw. nach der Reihenfolge der im Kaufratgeber verwendeten Bilder sortiert)