4 ツール

音声対話コーパスの書き起こしテキストは、あくまでも文字であり、音声の細 かな特徴(韻律、調子など)や、発話のタイミングなどを表現することが難しい。 この点から、TEIのようなより表現力のある記述法が提案されているが、この ような表現は一般に複雑になりやすく直観的な対話の把握が困難となる。書き 起こしテキストでよく分からない特徴などの調査は最終的に音声を聞くことに なる。

そこで、本WGでは、京都大学の協力により開発された、音声データの再生ツー ルと書き起こしデータから容易に対応する音声データを聞くことができるブラ ウジングツールをCD-ROMに入れた。

音声再生ツールは、CD-ROM中にある左右チャンネルに分離している音声ファイ ルを一般のワークステーションでモノラルあるいはステレオ再生を可能とする ものである。

また、ブラウジングツールは、「1行1ファイル書き起こし」テキストから動的 にHTML(Hyper Text Markup Language)を生成し、WWWのブラウザを使うことに よって、テキストをマウスでクリックするだけで、その文に対応する音声ファ イルをモノラルあるいはステレオで再生できる。また、Vol.2,3にはauファイ ル(8bit, 8kHz, tex2html_wrap_inline180 -law)に変換された音声ファイルと京大のツールで生成され たHTMLファイル(ただし、テキストからのポインタはauファイルを指している) も同時に収録してある。これは、音が少し悪く、ステレオで両チャンネルを同 時に聞くことはできないが、一般のパソコンなどでもWWWのブラウザで、ほと んど準備なしでブラウズできるため、おおよその見当をつけるのに適している。

これらのツールによって、これまでかなりの労力を要した「実際の音を聞いて 判断する」という作業が容易になり、研究者はより本質的な考察に時間をかけ ることが可能となる。


next up previous
Next: 5 音声コーパスの将来 Up: PASDコーパス - 重点領域模擬対話音声コーパス - Previous: (b) 1行1文音声対応書き起こし(*.sp)

Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997