文字起こしサーバの設定

システム要件

文字起こしサーバを実行するシステムに対し、Honeywellは以下のハードウェアおよびオペレーティングシステム要件を推奨します。

  • 64-bit Windows Server 2012 または 64-bit Windows 7
  • 2.5Ghz CPU コア x1
  • 最初の文字起こしサーバインスタンスに対して12GB RAM、追加の文字起こしサーバインスタンス1つ毎に4GB RAM追加

初期セットアップ

  1. 最新バージョンのJava 8 JREをダウンロードし既定のセットアッププロンプトを使ってインストールします。
  2. 最新の Tomcat 7をダウンロードしインストールします。インストーラを使ってWindowsサービスを作成します。TomcatのインストールディレクトリはCATALINA_HOMEです。
  3. TranscriptionServerReleaseR1.6.zip を任意の場所に解凍します。これにより\transcription_server-1.6フォルダーが作成されます。このフォルダーをTS_HOMEとして参照します。

    設定時間を短縮するため Honeywellは C:\ ドライブの使用を推奨します。

  4. %TS_HOME%\TranscriptionServer\WEB-INF\クラスをシステムのPATH環境変数に追加します。
  5. Zipパッケージに含まれる次のインストーラを実行します:
    • vcredist_x64.exe – C++ runtime
    • w_ccompxe_redist_intel64_2015.4.221.msi

文字起こしモデル

文字起こしサーバの "モデル" とは文字起こしサーバが音声入力から文字起こしをするために使用する、言語とドメインの組み合わせを指します。例:

  • 英語(米国)のニュース放送から録音された音声を文字起こししたいとします。この場合モデルの言語は英語(米国)、ドメインはニュース放送となります。
  • あるいは、スペイン語(ラテン)のトラック輸送関連の音声から文字起こしをしたいとします。この場合のモデルの言語はスペイン語(ラテン)、ドメインはトラック輸送となります。

業界言語モデル

現在次の業界言語モデルが用意されています:

ドメイン言語
汎用英語(US)
汎用フランス語(カナダ)
汎用ドイツ語
汎用ラテンアメリカスペイン語
航空宇宙英語(US)
トラック輸送英語(US)
トラック輸送フランス語(カナダ)
トラック輸送ラテンアメリカスペイン語

文字起こしサーバの設定

サポートしたいモデルそれぞれに対して、個別のインスタンスの文字起こしサーバが必要です。ある言語の文字起こしスループットを改善したい場合、1つの言語に対して複数のサーバインスタンスを設定することも可能です。次のステップに従って1つのモデルインスタンスを設定します。

  1. context.xmlファイルを%CATALINA_HOME%\conf\Catalina\localhostに作成します。各モデル用のcontext.xmlファイルの例はディストリビューションに含まれています。文字起こしサーバのインスタンスが1つしか必要ない場合、サンプルファイルをそのままコピーします。
    それ以外の場合、ファイルをコピーして名前を変更します。 たとえば、複数のインスタンスを設定するにはenUS_Generic_1.6_m2_1.xmlenUS_Generic_1.6_m2_1.xmlenUS_Generic_1.6_m2_2.xmlにコピーします。
  2. 要求された数のインスタンスを実行するためのRAM要件をサーバが満たしていることを確認してください。

  3. 上記のステップ3でC:\に解凍しなかった場合には、各ファイルを編集してdocBase、modelFolder、uDataFolder、waveFile属性をTS_HOMEに変更します。たとえば、docBase="C:\TranscriptionServerReleaseR1.6"docBase="<your TS_HOME location>"にします。
  4. Tomcatサービスを再起動します。
  5. 各インスタンスが指定されたURLで応答していることを確認します。

    : ブラウザにhttp://yourhostname/enUS_Generic_1.6_m1と入力します。enUS_Generic_1.6_m2の部分がステップ1で設定したxmlファイルです。ここでは、Tomcatが既定の80番ポートでリッスンするよう設定したと仮定しています。そうでない場合、選択したポートをURLに含めてください。サーバから次のような応答が返ってくるはずです:
<transcription> <id>0</id> <creationTimestamp>2016-10-13T14:57:10.519Z</creationTimestamp> </transcription>

次に、 文字起こしサービスエンドポイントの設定で説明されている手順でVoiceCheckサーバからこの文字起こしサーバへの接続を設定します。