音声データのフォーマットは以下の規則に従う。
音声ファイルに関しては、かなりの機関で統一されている。この仕様を満たし ていないのは、自由対話でLとRの発話がかなり重なっており、同じところで切 れなかった機関などである。
音声ファイル名は以下の規則に従う。英字に関してはすべて小文字とする。
対話番号(7桁)+チャンネル記号(1桁).分割ファイル番号cccmmmm[lr].nnn
ここで、
ccc: 収録機関コード
mmmm: 対話連番号
[lr]: チャネル(l:左,r:右)の記号
nnn: 分割ファイル番号
である。
(例)筑波大学の3番目の対話中の2つ目に切り出した音声の
右チャンネルのデータファイル名:tsu0003r.002