3. 「日本語ディクテーション基本ソフトウェア」開発プロジェクト 大語彙連続音声認識システムに必要なもの: 大量のデータベースからモデルを学習 新聞記事数年分,数GB以上のテキスト 数百人の読み上げ音声+全書き起こし 高度な認識アルゴリズム(プログラム) →1研究機関で全部作るのは大変 ↓ 日本語の大語彙連続音声認識の研究・開発のための オープンな基本開発プラットフォームを作ろう