IPA「日本語ディクテーション基本ソフトウェア」について
日本語ディクテーション基本ソフトウェアとは
実行キットには動作に必要な最小限のものしか含まれていません.一方で,実際に音声認識アプリを開発する場合には,対象に合わせたモデルの調節,あるいは新規に作成する必要があります.
そのような日本語の音声認識システムの研究および開発を支援する目的で,標準的な言語モデル・音響モデル,ならびにモデル作成を支援するツールが,Juliusとともに<「日本語ディクテーション基本ソフトウェア」プロジェクト('97〜'99年度)で開発されました。
- 大語彙連続音声認識プログラム Julius-3.1
- 音韻モデル(triphone, monophone, PTM triphone HMM)
- 言語モデル(新聞記事から学習した20,000語, 60,000語),発音辞書
- 形態素解析・読み付与プログラム (Chasen-2.02+ipadic2.1, Chawan-2.06, etc.)
- 単語認識率算出プログラム
- 話者適応ツール,言語モデル圧縮ツール
なお,このツールキットについても無償で提供されております.
julius@kuis.kyoto-u.ac.jp
Last modified: Tue Jul 18 02:53:15 JST 2000