3.2 音声ファイルの仕様

音声データのフォーマットは以下の規則に従う。

音声ファイルに関しては、かなりの機関で統一されている。この仕様を満たし ていないのは、自由対話でLとRの発話がかなり重なっており、同じところで切 れなかった機関などである。

音声ファイル名は以下の規則に従う。英字に関してはすべて小文字とする。

 対話番号(7桁)+チャンネル記号(1桁).分割ファイル番号

cccmmmm[lr].nnn

ここで、

ccc: 収録機関コード

mmmm: 対話連番号

[lr]: チャネル(l:左,r:右)の記号

nnn: 分割ファイル番号

である。

(例)筑波大学の3番目の対話中の2つ目に切り出した音声の

右チャンネルのデータファイル名:tsu0003r.002


next up previous
Next: 3.3 書き起こしテキストの仕様 Up: 3 音声対話コーパスの仕様 Previous: 3.1 名前の規則

Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997