音声プロンプトと認識のベストプラクティス
混乱と誤認識を削減する
Talkman端末は記述された言葉を特定の方法で解釈する音声合成(TTS)エンジンを使用しています。端末による音節や単語の発話の仕方が作業員にわかりにくい場合、VoiceFormファイルのプロンプトフレーズやリストアイテム値を変更することによりこの問題を解決できます。
ベストプラクティスに従うことにより端末プロンプトに関わる 混乱 を低減することができます。
さらに、技術者が発話するリストアイテムを音声アプリケーションに理解させるのが難しいケースもあります。どのような音声認識システムにおいても、人間の発音や抑揚を理解させるため、多少の繰り返しや単語のトレーニングは必要です。
次のような点に注意することで、 誤認識 の数を減らすことができます。
省略形
音声合成エンジン(TTS)はたいていのケースで省略形を正しく発音できますが、音の通りに記述することでより適切に発話させることができます。たとえば、1stはfirstと記述するほうがよいでしょう。
端末プロンプトに表示装置を使用する場合には、VoiceFormでプロンプトを編集した結果読みにくくなるよりも、作業パッケージで発音置き換えを使用して省略形の発音を指定することを検討してください。
大文字
文字として発音させたい場合には大文字を使用します。ただし、文字の間にスペースがあると、フォネティックコードで読み上げられます。たとえば、APUは "ehe pea you" と発音されますが、A P U と記述すると、"alpha papa unicorn" と発音されます。
句読点
- カンマは文の中に短い間をあけるために使用します。プロンプトが切れ目のない文に聞こえる際に使用します。
- 技術者に対する質問として発音させたい場合には疑問符を使用します。
- ハイフンの入った言葉は通常 "dash" と発音されますので、発音の通りに記述したほうがよい場合もあります。たとえば、 T-Wheel は "tee dash wheel" と発音されます。ハイフンを入れずにT Wheel と記述すると "tango wheel" と発音されます。
発音が似た単語
リストアイテム応答オプションでは発音が似ていて混同しやすい単語は避けてください。たとえば、"door" と "floor" のような発音のわずかな違いは認識上の問題の原因となる場合があります。
自然な話し言葉
プロンプトのフレーズや複数リスト選択アイテムは話し言葉で記述します。データベースや紙の帳票、ドロップダウンメニューなどにあった既存のエントリは、話しやすく理解しやすいフレーズに書き直す必要があるかもしれません。
プロンプトの長さ
プロンプトは短く、ポイントを押さえたものにします。プロンプトがごちゃごちゃと繰り返しの多い場合、技術者は聞きづらいと感じ、作業が遅くなります。
短いプロンプトにし、システムのトレーニングを行った後でも技術者の混乱がある場合には、技術者が "詳細" コマンドを発した際のヘルプメッセージを長くして指示を明確化することを検討してください。
作業の中でそのプロンプトがあまり頻繁に発生せず、技術者がより多くの情報を必要とする場合にのみ、長いプロンプトを使用してください。
データ収集を分ける
VoiceNotesの録音と文字起こしに、関連する複数の検査の情報を含めたくなりがちですが、それは避けてください。プロンプトと応答を分けることにより、はっきりとした明確なデータが作成できます。音声アプリケーションが具体的な質問をし、検査作業1つに対して1つの応答を録音することにより、理解、報告、監査がしやすいデータを構築することができます。
例:
プロンプト: シート、シートベルト、シート位置調整、バックレスト調整の状態についてノートを録音してください。
応答: "OK" [トーン] "運転席に裂けあり、助手席シートベルトが摩耗、シート位置調整は正常、運転席バックレスト調整は割れあり、助手席バックレスト調整は動かない。"
次のように変更:
プロンプト: 運転席の損傷はありますか?
応答: "はい"
プロンプト[応答 "はい" の条件]:シートの状態は?
有効な応答:摩耗, 裂け, 汚れ, 破損
プロンプト: 助手席の損傷はありますか?
応答: "いいえ"
プロンプト: 運転席シートベルトの損傷はありますか:
応答: "いいえ"
プロンプト: 助手席シートベルトの損傷はありますか:
応答: "はい"
プロンプト[応答 "はい" の条件]:シートベルトの状態は?
有効な応答:摩耗, 切れ, 汚れ, 故障
その他
はい/いいえの答え
プロンプトに対する可能な応答が2種類しかない場合、はい/いいえの質問で記述することを検討してください。この形式は応答をシンプルにするだけでなく、 "はい" と "いいえ" は技術者が必ず音声テンプレートでトレーニングするものであるため音声認識のパフォーマンスも向上します。
例:
プロンプト: マフラーの状態は?
有効な応答:損傷,正常
次のように変更:
プロンプト: マフラーは損傷していますか?
有効な応答:はい,いいえ
Talman端末で実行中の音声ソフトウェアは句読点ルールに従うため、はい/いいえの応答を求める場合は疑問符を使用してください。
最小および最大長
期待される応答の最小あるいは最大単語数あるいは文字数が知られている場合、特に値の入力については長さ条件を使用してください。これらのパラメータを設定すると、音声アアプリケーションは余分な挿入を受け入れず次のプロンプトに素早く移ることができます。
入力の確認
Talkman端末に応答する技術者が間違えるケース、また雑音の多い環境では、音が言葉と間違われて入力される(挿入と呼びます)ことがあります。
日付やはい/いいえの応答など一部の入力は自動的に検証することができますが、その他の入力は技術者が確認するのが最適です。
ほとんどのプロンプトタイプに使用できる 確認 パラメータに対しては、値を "True" に設定し、音声アプリケーションが技術者にエントリの確認を求めるように設定するか、"False" に設定し確認をスキップすることができます。この値を設定する前に次を検討してください:
- 入力または入力のフォーマットを自動的に検証できるかどうか
- 確認を使用せずに入力が正しく認識されなかったことが技術者にわかるかどうか
- 正しい入力を確認することと生産性の低下のトレードオフ
複数リスト選択プロンプトに対して確認パラメータがオフに設定されている場合でも、端末は応答をエコーして技術者に返しますので、技術者は "やり直し" コマンドを使用してエントリを修正出来る点に注意してください。
データ型の一貫性
ステップと値入力を定義する際、結果データ型と文字パラメータが競合しないようにしてください。
ほとんどの値入力は各種文字の組み合わせを受け入れるよう文字列データ型に設定します。ただし、ステップの結果を算術演算を行う条件文に使用する場合には、データ型を整数に設定してください。
データ型を整数に設定してアルファベットのみの入力を許可する一貫性のない設定を行うと、技術者には "無効な数値入力" エラーが返されることがあります。さらに、応答データが不一致として保存され、条件文の評価とエクスポートデータの両方に影響を及ぼす恐れがあります。
一貫したフレーズ
技術者が頻繁に聞くプロンプトに対しては、同じ言い方になるようにしてください。たとえば、技術者にVoiceNoteを残すよう指示する場合、一貫して "ノートを録音" というフレーズを使い、"コメントを残す" や "メッセージを言ってください" などと様々な言い方にならないようにします。
同様に、技術者が頻繁に発話するリストアイテムについても、一貫性をもって作成してください。たとえば、エンジンのあるパーツが存在しないことを示すのによく使用するリストアイテムが "ない"であった場合、他のリストグループでも "見つからない" や "紛失" や "不足" などの同義の言葉を使用しないようにします。
よく一緒に使用する単語
プロンプトを作成する際、技術者から期待される応答が特定の単語を同じ順序で使用することが多いケースがあります。これらの単語が区切りなしで常に一緒に使用される場合、これらを組み込みトレーニングに追加することにより認識率を向上させることを検討してください。
技術者が音声テンプレートを最初にトレーニングする際、ゼロから9までの数字を3つ続けて言うよう指示されます。例えば次のようになります:one two one, three nine three このトレーニングは、間を空けずに数字を読み上げても、認識エンジンが続けて言った場合の聞こえ方に慣れているようにするためです。
VoiceConsoleで作業パッケージを編集し、その作業パッケージを端末に再度読み込むことにより組み込みトレーニングリストを更新することができます。
発音定義
端末がプロンプトに含まれる単語の発音を間違えている、あるいは応答の誤認識が多い場合、VoiceConsoleでその表記をを発音に基づいたものにすることを試してください。たとえば、 "oi" を "oy" に置き換える、あるいは "o" を "uh" に置き換えられる場合があります。
方法:
VoiceConsole GUI で作業パッケージを表示し、適切な作業パッケージを選択して選択した作業パッケージを編集するアクションリンクをクリックします。
編集ページで、発音置き換えタブを開き、行を追加して単語と発音を入力します。
検査ステップのプロンプト、ヘルプ、あるいはリストアイテムフレーズを発音に基づく表記に変更しないでください。これらのフレーズはTalkman端末から作成されるWebページに表示されるため、発音に基づく表記にすると入力ミスのように見えて技術者が混乱する恐れがあります。
単語のトレーニングまたは再トレーニング
技術者が、端末が特定の単語を理解しないという問題に遭遇した場合、これらの単語のトレーニングを行って自分の音声テンプレートに追加することができます。Talkmanのボタンを使って端末メニューにアクセスし、"発音の再トレーニング" オプションを選択します。新たにトレーニングされた単語は自動的に技術者のテンプレートに追加されます。
標準コマンドの再トレーニングを行う場合、そのコマンドが使用可能なダイアログのプロンプトにおいて、端末がそのプロンプトを発話した 後 で端末メニューにアクセスする必要があります。そうでない場合、当該単語が再トレーニング単語リストに含まれていない場合があります。
関連トピック