端末の発話ルール
Vocollect 音声合成(TTS)エンジンは単語やデータ文字列をどのように発音するかを定義します。Vocollect音声端末が発話する言語それぞれに独自のエンジンが使用されますが、すべての言語でTTSがサポートするルールがいくつか存在します。以下の内容は、端末が文字、単語、フレーズをどのように発話するかの一般的ルールを説明したものです。これらのルールはVocollect Talkman端末のパフォーマンスに基づくものであり、他の端末の音声認識ではこれとは異なる場合があります。
- Talkman端末はプロンプトの読み上げに標準のフォネティックルールを使用しています。一部の単語はフォネティックルールに沿っていないため、正しく発音されません。端末が単語の発音を間違えている場合、単語を音の通りに綴ってください(たとえば“height”ではなく “hite” を使用するなど)。
- Talkmanはすべて大文字の単語、たとえばUSAなどは略語として読み上げます。プロンプトのフレーズを記述する際、大文字の間にスペースを入れないでください(U S Aではなく、USA)。
- Talkman端末は、すべて大文字の略語の間にスペースがある場合、フォネティックコードを使って読み上げます。たとえば、文字の間に “M P H” のようにスペースが入っている場合、端末は“Mike, Papa, Hotel,” と読み上げますが、“MPH” の場合には、“M, P, H” と読み上げます。
- Talkman端末は、ピリオド、疑問符、感嘆符の有無によってプロンプトの発音を変えることができます。
- プロンプトにカンマが含まれていると、Talkman端末はわずかに間隔をあけます。連続したカンマを使用すると間隔が長くなります。2つカンマを使用すると間隔がすこし長くなり、さらにカンマを追加すると 50 ミリ秒ずつ追加されます。間隔をあける場合には、カンマをスペースなしで入力してください。
- Talkman端末は特殊文字を認識しません。ドル記号のような特殊文字は記号を使わずに記述します($5ではなく、5 dollars)。ただしその文字に発音置き換えが設定されている場合を除きます。
フレーズ | 発音 | 適用されるルール |
---|---|---|
ABC | "ehe bee see" | 大文字であるため、端末はこの文字列を略語のように読み上げます。つまり、文字列に含まれる文字が1つずつ読まれます。 |
A B C | "alpha bravo charlie" (または同等のフォネティックコード) | この例でも大文字が使用されています。しかし、各文字の間にスペースがあるため、端末はそれぞれの文字に対応するフォネティックコードを読み上げます。 |
abc | "abk" | この例では、文字の間にスペースはなく、大文字にもされていません。端末はこのような場合単語としての読み上げを試みます。 |
24 | "twenty-four" | |
a b c | "ehe bee see" | これらの例では、各文字の間にスペースがあることから端末は文字列内のそれぞれの文字を読み上げます。アルファベットが小文字であるため、端末は"alpha bravo charlie" ではなく各文字を単語として読み上げます。 |
2 4 | "two four" |