"Siri" als praxistaugliches Diktiergerät Brauchbare Spracherkennung mit "Siri"

Not macht erfinderisch: Als ein Redaktionskollege kürzlich wegen seiner Sehnenscheiden-Entzündung eine Tastatur-Zwangspause einlegen musste, machte er sich auf die Suche nach einer Spracherkennungs-Software. Auf diesem Gebiet soll es in den letzten Jahren ja bemerkenswerte Fortschritte gegeben haben. Einsatzzweck: Erfassung zusammenhängender alltagssprachlicher Fließtexte.

Der erste Versuch war leider ein Reinfall: Die eingebaute Spracherkennung von Windows 8.1 erwies sich trotz
geduldigem Durchlaufen des Lernprogramms sowie Verwendung unterschiedlicher Mikrofone und Headsets als völlig untauglich. Als er bereits mit der Anschaffung kommerzieller Diktier-Software liebäugelte, wies ihn ein Bekannter halb scherzhaft auf die iPhone-/iPad-Sprachassistentin "Siri" hin: Deren inhaltliche "Gesprächskompetenz" ist zwar seit eh und je Ziel öffentlicher Häme und Veralberung (woran Apple mit seiner anzüglichen "Dein-Wunsch-ist-ihm-Befehl"-Kampagne nicht ganz unschuldig ist). Die eigentliche Spracherkennung sei jedoch erheblich besser als ihr Ruf. 
Siri Beispiel


Und tatsächlich: Gleich das erste Siri-Notizdiktat war ein eindrucksvoller Volltreffer. Einfach auf das Mikrofon-Symbol links neben der Leertaste getippt, zwei, drei Sätze gesprochen und dann auf "Fertig" getippt. Und schon wird das Gesprochene in Text umgewandelt – und zwar wirklich sehr ordentlich! Nicht nur, dass nahezu alle Wörter richtig erkannt werden: Selbst die Groß- und Kleinschreibung stimmt meistens – wohlgemerkt ganz ohne Lernphase! Und erst recht ohne überakzentuierte Artikulation im Stil eines Radio- oder Fernsehsprechers (wie sie von der Windows-Spracherkennung empfohlen wird!) 


Wer sich darüber hinaus mit ein paar eingängigen Diktierkonventionen vertraut macht (z. B. Satzzeichen, Sonderzeichen und Währungsangaben), kann die iPhone-/Siri-Connection ohne Weiteres als (semi-)professionelles Diktiergerät verwenden. Falls Sie ein iPhone oder iPad mit Siri-Spracherkennung besitzen (ab iPhone 4S / iPad 3), probieren Sie es ruhig einmal aus.

Als Texterfassungs-Umgebungen bieten sich vor allem Notiz-, E-Mail- und Messaging-Apps an. Rohtexte zur Weiterverarbeitung in einem Windows-Textprogramm lassen sich auf dem iPhone / iPad zum Beispiel als Notizen erfassen, die dann per E-Mail an den PC geschickt werden. Wer die Zwischenablage seines Smartphones oder Tablets ohnehin mit dem PC verbunden hat (z. B. per VNC-Client-/Server), kann den Rohtext auf diesem Weg sogar direkt an den PC übertragen.

Noch ein paar Hinweise hinterher: 

  • Das Siri-Diktiergerät funktioniert nur, wenn eine Internetverbindung vorhanden ist.
  • Sensible Daten, vor allem solche, die dem gesetzlichen Datenschutz unterliegen, sollten Sie Siri nicht anvertrauen: Sämtliche Eingaben werden an Rechenzentren in den USA übertragen, dort konvertiert und wieder zurückgeschickt.
  • In den iPhone- / iPad-Einstellungen können Sie im Bereich "Allgemein" > "Siri" die Reaktionsweise der Spracherkennung an Ihre Bedürfnisse anpassen. Auf diese Weise unterdrücken Sie bei Bedarf das gelegentlich nervige Sprach-Feedback oder wählen eine männliche Stimme aus.
  • Am besten diktieren Sie satz- oder absatzweise: So vermeiden Sie es, die Spracherkennung zu überfordern oder durch eingehende Anrufe wichtige Passagen zu verlieren.
  • Einen faltbaren "Spickzettel" mit den wichtigsten Siri-Diktierkonventionen finden Sie beim iPhone-Ticker.


Noch ein Alternativ-Tipp zum Schluss: Falls Sie mit einem Android-Smartphone unterwegs sind, probieren Sie ruhig einmal die Google-Spracherkennung aus. Deren Ergebnisse sind zwar noch nicht ganz so gut wie die von Siri: Aber dafür klappt hier bereits die Offline-Spracherkennung ganz ordentlich. Und wie gesagt: Auf diesem Gebiet ist viel in Bewegung.