文字起こしサーバの設定
システム要件
文字起こしサーバを実行するシステムに対し、Honeywellは以下のハードウェアおよびオペレーティングシステム要件を推奨します。
- 64-bit Windows Server 2012 または 64-bit Windows 7
- 2.5Ghz CPU コア x1
- 最初の文字起こしサーバインスタンスに対して12GB RAM、追加の文字起こしサーバインスタンス1つ毎に4GB RAM追加
初期セットアップ
- 最新バージョンのJava 8 JREをダウンロードし既定のセットアッププロンプトを使ってインストールします。
- 最新の Tomcat 7をダウンロードしインストールします。インストーラを使ってWindowsサービスを作成します。Tomcatのインストールディレクトリは
CATALINA_HOME
です。 TranscriptionServerReleaseR1.6.zip
を任意の場所に解凍します。これにより\transcription_server-1.6フォルダーが作成されます。このフォルダーをTS_HOME
として参照します。設定時間を短縮するため Honeywellは C:\ ドライブの使用を推奨します。
- %TS_HOME%\TranscriptionServer\WEB-INF\クラスをシステムのPATH環境変数に追加します。
- Zipパッケージに含まれる次のインストーラを実行します:
- vcredist_x64.exe – C++ runtime
- w_ccompxe_redist_intel64_2015.4.221.msi
文字起こしモデル
文字起こしサーバの "モデル" とは文字起こしサーバが音声入力から文字起こしをするために使用する、言語とドメインの組み合わせを指します。例:
- 英語(米国)のニュース放送から録音された音声を文字起こししたいとします。この場合モデルの言語は英語(米国)、ドメインはニュース放送となります。
- あるいは、スペイン語(ラテン)のトラック輸送関連の音声から文字起こしをしたいとします。この場合のモデルの言語はスペイン語(ラテン)、ドメインはトラック輸送となります。
業界言語モデル
現在次の業界言語モデルが用意されています:
ドメイン | 言語 |
---|---|
汎用 | 英語(US) |
汎用 | フランス語(カナダ) |
汎用 | ドイツ語 |
汎用 | ラテンアメリカスペイン語 |
航空宇宙 | 英語(US) |
トラック輸送 | 英語(US) |
トラック輸送 | フランス語(カナダ) |
トラック輸送 | ラテンアメリカスペイン語 |
文字起こしサーバの設定
サポートしたいモデルそれぞれに対して、個別のインスタンスの文字起こしサーバが必要です。ある言語の文字起こしスループットを改善したい場合、1つの言語に対して複数のサーバインスタンスを設定することも可能です。次のステップに従って1つのモデルインスタンスを設定します。
- context.xmlファイルを%CATALINA_HOME%\conf\Catalina\localhostに作成します。各モデル用のcontext.xmlファイルの例はディストリビューションに含まれています。文字起こしサーバのインスタンスが1つしか必要ない場合、サンプルファイルをそのままコピーします。
それ以外の場合、ファイルをコピーして名前を変更します。 たとえば、複数のインスタンスを設定するにはenUS_Generic_1.6_m2_1.xmlをenUS_Generic_1.6_m2_1.xmlとenUS_Generic_1.6_m2_2.xmlにコピーします。 - 上記のステップ3で
C:\
に解凍しなかった場合には、各ファイルを編集してdocBase、modelFolder、uDataFolder、waveFile属性をTS_HOME
に変更します。たとえば、docBase="C:\TranscriptionServerReleaseR1.6"
をdocBase="<your TS_HOME location>"
にします。 - Tomcatサービスを再起動します。
- 各インスタンスが指定されたURLで応答していることを確認します。
例: ブラウザにhttp://yourhostname/enUS_Generic_1.6_m1
と入力します。enUS_Generic_1.6_m2
の部分がステップ1で設定したxmlファイルです。ここでは、Tomcatが既定の80番ポートでリッスンするよう設定したと仮定しています。そうでない場合、選択したポートをURLに含めてください。サーバから次のような応答が返ってくるはずです:
要求された数のインスタンスを実行するためのRAM要件をサーバが満たしていることを確認してください。
<transcription> <id>0</id> <creationTimestamp>2016-10-13T14:57:10.519Z</creationTimestamp> </transcription>
次に、 文字起こしサービスエンドポイントの設定で説明されている手順でVoiceCheckサーバからこの文字起こしサーバへの接続を設定します。