Best Practices für Sprachanweisungen und Spracherkennung
Verwirrung und Falscherkennung reduzieren
Talkman-Geräte nutzen eine TTS (Text-to-Speech)-Engine, die Geschriebenes auf bestimmte Weise interpretiert. Wenn die Geräte Silben oder Wörter so aussprechen, dass Ihre Mitarbeiter diese nur schwer verstehen, können Sie die Anweisungsformulierungen und Listenelementwerte in Ihren VoiceForm-Dateien entsprechend bearbeiten.
Die folgenden Best Practices sollen Ihnen dabei helfen, Geräteanweisungen möglichst eindeutig zu formulieren.
Zusätzlich kann es auch vorkommen, dass Techniker Probleme haben, die Sprachanwendung dazu zu bringen, die von ihnen gesprochenen Listenelemente zu verstehen. Jedes Spracherkennungssystem erfordert ein gewisses Wiederholen oder Trainieren von Wörtern, damit es die Aussprache und den Tonfall des Sprechers verstehen kann.
Die folgenden Tipps helfen, die Zahl der Fehl- und Nichterkennungen zu reduzieren.
Abkürzungen
TTS (Text-to-Speech)-Engines sprechen Abkürzungen zwar in der Regel korrekt aus, aber aufgrund der grammatischen Besonderheiten des Deutschen (und anderer Sprachen) wird möglicherweise nicht in allen Fällen die für den jeweiligen Kontext korrekte Form gewählt. Daher empfiehlt es sich, Abkürzungen zur Sicherheit auszuschreiben. So sollte beispielsweise "1." je nach Kontext als "erstens", "erster", "erstes", "erste", "ersten" oder "erstem" geschrieben werden.
Wenn Sie für Geräteanweisungen ein Display verwenden, empfiehlt es sich, die Abkürzungen im Taskpaket als phonetische Ersetzungen auszuschreiben, statt die Anweisungen im VoiceForm zu bearbeiten, was zu Lesbarkeitsproblemen führen kann.
Großbuchstaben
Verwenden Sie Großbuchstaben, wenn die Buchstaben einzeln gesprochen werden sollen. Wenn Sie allerdings Leerzeichen zwischen den Buchstaben eingeben, werden diese laut Buchstabieralphabet gesprochen. "EPS" beispielsweise wird als "eh peh es" gesprochen, während "E P S" als "Emil Paula Samuel" gesprochen wird.
Zeichensetzung
- Wenn Sie Pausen in Ihre Anweisungen einfügen möchten, setzen Sie ein oder mehrere Kommas. So können Sie z.B. Anweisungen aus mehreren Hauptsätzen gliedern und damit verständlicher machen.
- Wenn Sie möchten, dass die Anweisung wie eine Frage an den Techniker klingen soll, schließen Sie sie mit einem Fragezeichen ab.
- Wenn ein Wort mit einem Bindestrich geschrieben wird, wird der Bindestrich in der Regel mitgesprochen. Es empfiehlt sich daher, das Wort so zu schreiben, dass kein Bindestrich enthalten ist. So wird beispielsweise das Wort "T-Stück" als "teh bindestrich stück" gesprochen. Ohne Bindestrich, also als "T Stück" geschrieben, lautet die Sprachausgabe "Theodor Stück".
Wörter, die sich reimen
Vermeiden Sie Wörter in Ihren Listenelement-Antwortoptionen, die ähnlich klingen und miteinander verwechselt werden können. Kleine Unterschiede bei der Aussprache, wie beispielsweise bei "Fach" und "Dach", können Probleme bei der Erkennung machen.
Natürliche Sprache
Verwenden Sie beim Schreiben von Anweisungsformulierungen und "Mehrfachauswahl aus Liste"-Anweisungen Alltagssprache. Einträge, die aus Datenbanken, von Papierformularen oder aus Dropdown-Menüs stammen, müssen möglicherweise so umgeschrieben werden, dass sie einfacher zu sprechen und zu verstehen sind.
Länge von Anweisungen
Anweisungen sollten kurz sein und auf den Punkt kommen. Ausschweifende und sich wiederholende Antworten werden von den Technikern als störend und den Arbeitsfluss behindernd empfunden.
Falls Techniker trotz kurz gehaltener Formulierung und entsprechendem Training mit einer Anweisung nicht klar kommen, empfiehlt es sich unter Umständen, eine längere Hilfeansage zu schreiben. Wenn der Techniker dann den Befehl "Details" sagt, wird ihm der Inhalt der Anweisung erläutert.
Verwenden Sie längere Anweisungen nur dann, wenn diese in Zuweisungen selten vorkommen und es wahrscheinlich ist, dass die Techniker weitere Informationen benötigen.
Separate Datenerfassung
Widerstehen Sie der Versuchung, mithilfe von VoiceNote-Aufnahmen und -Transkriptionen zusammenhängende Inspektionsbeobachtungen miteinander zu kombinieren. Separate Anweisungen und Antworten erbringen deutlich klarere und eindeutigere Daten. Wenn die Sprachanwendung konkrete Fragen stellt und pro Inspektionstask eine Antwort aufzeichnet, erhalten Sie einen Datensatz, der einfach interpretiert, gemeldet und geprüft werden kann.
Beispiel:
Anweisung: Notizen zum Zustand der Sitze, Gurte, Sitzverstellungen und Sitzlehnenverstellungen aufnehmen.
Antwort: "Bereit." [Ton] "Fahrersitzbezug mit Riss, Gurt Beifahrersitz abgenutzt, Sitzlehnenverstellungen normal, Sitzlehnenverstellung Fahrersitz defekt, Sitzlehnenverstellung Beifahrersitz blockiert."
Ändern in:
Anweisung: Ist der Fahrersitz beschädigt?
Antwort: "Ja"
Anweisung [Bedingung bei "Ja"-Antwort]: Sitzzustand?
Gültige Antworten: Abgenutzt, Zerrissen, Verschmutzt, Kaputt
Anweisung: Ist der Beifahrersitz beschädigt?
Antwort: "Nein"
Anweisung: Ist der Gurt auf Fahrerseite beschädigt?
Antwort: "Nein"
Anweisung: Ist der Gurt auf Beifahrerseite beschädigt?
Antwort: "Ja"
Anweisung [Bedingung bei "Ja"-Antwort]: Zustand Gurt?
Gültige Antworten: Abgenutzt, Ausgefranst, Verschmutzt, Funktioniert nicht
usw.
Ja/Nein-Antworten
Wenn eine Anweisung nur zwei Antwortmöglichkeiten hat, empfiehlt es sich, die Anweisung als Ja/Nein-Frage zu formulieren. Dies erleichtert nicht nur das Antworten, sondern verbessert auch die Spracherkennungsleistung, da die Techniker in ihren Sprachvorlagen die Wörter "Ja" und "Nein" auf jeden Fall trainieren.
Beispiel:
Anweisung: Zustand Schalldämpfer?
Gültige Antworten: Beschädigt, Normal
Ändern in:
Anweisung: Ist der Schalldämpfer beschädigt?
Gültige Antworten: Ja, Nein
Die Sprachsoftware auf Talkman-Geräten beachtet die Regeln zur Zeichensetzung. Verwenden Sie daher Fragezeichen nur dann, wenn eine Ja/Nein-Antwort erwartet wird.
Längenbeschränkungen
Legen Sie Längenbeschränkungen fest, insbesondere für die Eingabe von Werten, wenn die erwartete Antwort eine bestimmte Mindest- oder Höchstzahl von Wörtern oder Zeichen haben soll. Bei Festlegung dieser Parameter kann es nicht passieren, dass die Sprachanwendung irgendwelche Nebengeräusche als Eingaben interpretiert und damit den Arbeitsfluss verzögert.
Bestätigung der Eingabe
Techniker, die einem Talkman-Gerät antworten, können Fehler machen, und in lauten Umgebungen können Nebengeräusche fälschlicherweise für Spracheingaben gehalten werden.
Während einige Eingaben, wie beispielsweise Datumsangaben oder Ja/Nein-Antworten, automatisch validiert werden können, sollten andere Eingaben am besten durch den Techniker bestätigt werden.
Legen Sie als Wert für den Parameter Bestätigen, der für die meisten Anweisungstypen verfügbar ist, „wahr“ fest, wenn die Sprachanwendung die Techniker auffordern soll, ihre Eingabe zu bestätigen. Wenn keine Bestätigung erfolgen muss, legen Sie „falsch“ fest. Berücksichtigen Sie bei der Entscheidung, ob Sie diesen Parameter auf "wahr" setzen sollen, Ihre Antworten auf die folgenden Fragen:
- Lässt sich die Eingabe oder das Eingabeformat automatisch validieren?
- Haben die Techniker ohne eine solche Bestätigung die Chance mitzubekommen, dass die Eingabe nicht korrekt erkannt wurde?
- Wiegt die Gewissheit, dass Einträge korrekt erkannt wurden, etwaige Produktivitätseinbußen auf?
Bedenken Sie bei Ihren Überlegungen, dass das Gerät die Anweisungen auch dann wiederholt, wenn der Parameter "Bestätigen" für Anweisungen zur Mehrfachauswahl aus einer Liste deaktiviert ist. So kann der Techniker Fehler hören und mit dem Befehl "Letzten Eintrag rückgängig machen" die Einträge korrigieren.
Stimmigkeit bei der Datentypfestlegung
Achten Sie beim Definieren eines Schritts mit einem Werteintrag darauf, dass Ihre Einträge für die Parameter Ergebnisdatentyp und Zeichen nicht im Konflikt zueinander stehen.
Für die meisten Schritte, bei denen ein Wert eingetragen werden muss, sollte als Datentyp "Zeichenfolge" festgelegt werden, damit eine Kombination von Zeichen akzeptiert wird. Wenn das Schrittergebnis allerdings in einer Bedingungsaussage verwendet wird, bei der eine mathematische Berechnung stattfindet, sollten Sie als Datentyp "Ganzzahl" festlegen.
Wenn Sie den Datentyp auf "Ganzzahl" festlegen, dann aber nur Buchstaben zulassen, hören die Techniker möglicherweise den Fehler "Ungültiger Zahlenwert". Außerdem könnten die Antwortdaten als inkongruent gespeichert werden, was sowohl die Bedingungsauswertung als auch die Integrität Ihrer exportierten Daten beeinträchtigen kann.
Stimmigkeit bei der Formulierung
Verwenden Sie für Anweisungen, die Techniker häufig hören, stets dieselbe Formulierung. Wenn die Techniker beispielsweise aufgefordert werden, VoiceNotes einzugeben, nutzen Sie durchgängig die Formulierung "Notiz aufzeichnen", statt verschiedene Formulierungen, wie "Kommentar eingeben" oder "Nachricht sprechen" usw., zu verwenden.
Das gilt auch für Listenelemente, die Techniker häufig sprechen. Wenn beispielsweise "fehlt" ein häufiges Listenelement zur Beschreibung des Fakts ist, dass ein Motorteil nicht vorhanden ist, dann verwenden Sie in anderen Listengruppen keine Synonyme wie "nicht gefunden", "nicht vorhanden" oder "abwesend".
Wörter, die oft zusammen gesprochen werden
Beim Erstellen von Anweisungen wird Ihnen möglicherweise auffallen, dass Techniker häufig bestimmte Wörter in derselben Reihenfolge sagen sollen. Wenn diese Wörter immer und ohne Pause zusammen gesprochen werden, empfiehlt es sich, diese in das eingebettete Training aufzunehmen, um deren Erkennung zu verbessern.
Wenn die Techniker zum ersten Mal ihre Sprachvorlagen trainieren, werden sie aufgefordert, die Ziffern 0 bis 9 in Dreiergruppen zu sprechen, wie z. B.: „Eins Zwei, Eins, Drei Neun Drei“. Durch dieses Training wird sichergestellt, dass die Spracherkennungs-Engine beim Eingeben von Ziffern ohne Pause weiß, wie diese Wörter klingen, wenn sie hintereinander weg auftreten.
Sie können die Liste für das eingebettete Training aktualisieren, indem Sie Ihr Taskpaket in VoiceConsole bearbeiten und es dann neu auf die Geräte laden.
Phonetische Schreibweise
Wenn Sie feststellen, dass das Gerät Wörter in Anweisungen falsch ausspricht oder dass Antworten häufig falsch verstanden werden, versuchen Sie, diese Wörter in VoiceConsole so zu schreiben, wie sie gesprochen werden (phonetische Schreibweise). Ersetzen Sie, falls nötig, beispielsweise "Software" durch "Softwähr" oder "Host" durch "Houst".
VORGEHENSWEISE:
Navigieren Sie in der VoiceConsole-Benutzeroberfläche zu Taskpakete, wählen Sie das entsprechende Taskpaket aus und klicken Sie auf den Aktionslink Ausgewähltes Taskpaket bearbeiten.
Öffnen Sie die Registerkarte Phonetische Sub. und fügen Sie eine Zeile mit dem Wort und dessen phonetischer Entsprechung hinzu.
Formulierungen für Anweisungen für Inspektionsschritte, Hilfetexte oder Listenelemente sollten nicht durch phonetische Schreibweisen ersetzt werden. Diese Formulierungen werden auf den von den Talkman-Geräten bedienten Webseiten angezeigt, wo Wörter in phonetischer Schreibweise als Schreibfehler erscheinen und Ihre Techniker möglicherweise verwirren würden.
Erstmaliges oder erneutes Trainieren von Wörtern
Wenn die Techniker Schwierigkeiten haben, weil Geräte bestimmte Wörter nicht verstehen, können sie diese trainieren und sie ihren eigenen Sprachvorlagen hinzufügen. Dazu müssen sie über die Tasten des Talkman-Geräts das Menü aufrufen und dort die Option "Wort erneut trainieren" wählen. Neu trainierte Wörter werden automatisch zur Vorlage des Technikers hinzugefügt.
Wenn ein Standardbefehl erneut trainiert werden soll, muss sich der Techniker in einer Anweisung in dem Dialog befinden, in dem dieser Befehl vorkommt. Der Zugriff auf das Gerätemenü darf erst erfolgen, nachdem das Gerät mit dem Sprechen der Anweisung fertig ist. Andernfalls kann es passieren, dass das Wort nicht in der Liste mit den erneut zu trainierenden Wörtern erscheint.
Verwandte Themen