4 ツール

音声対話コーパスの書き起こしテキストは、あくまでも文字であり、音声の細かな特徴(韻律、調子など)や、発話のタイミングなどを表現することが難しい。この点から、TEIのようなより表現力のある記述法が提案されているが、このような表現は一般に複雑になりやすく直観的な対話の把握が困難となる。書き起こしテキストでよく分からない特徴などの調査は最終的に音声を聞くことになる。

そこで、本WGでは、京都大学の協力により開発された、音声データの再生ツールと書き起こしデータから容易に対応する音声データを聞くことができるブラウジングツールをCD-ROMに入れた。

音声再生ツールは、CD-ROM中にある左右チャンネルに分離している音声ファイルを一般のワークステーションでモノラルあるいはステレオ再生を可能とするものである。

また、ブラウジングツールは、「1行1ファイル書き起こし」テキストから動的にHTML(Hyper Text Markup Language)を生成し、WWWのブラウザを使うことによって、テキストをマウスでクリックするだけで、その文に対応する音声ファイルをモノラルあるいはステレオで再生できる。また、Vol.2,3にはauファイル(8bit, 8kHz, -law)に変換された音声ファイルと京大のツールで生成されたHTMLファイル(ただし、テキストからのポインタはauファイルを指している) も同時に収録してある。これは、音が少し悪く、ステレオで両チャンネルを同時に聞くことはできないが、一般のパソコンなどでもWWWのブラウザで、ほとんど準備なしでブラウズできるため、おおよその見当をつけるのに適している。

これらのツールによって、これまでかなりの労力を要した「実際の音を聞いて判断する」という作業が容易になり、研究者はより本質的な考察に時間をかけることが可能となる。

Next: 5 音声コーパスの将来 Up: PASDコーパス - 重点領域模擬対話音声コーパス - Previous: (b) 1行1文音声対応書き起こし(*.sp)

Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997