本WGでは〈〉の項目を取り上げることとした。
- 1.
- 対話環境:〈1〉人間=人間〈2〉人間=機械(WoZ 方式を含む)〈3〉電話
対話(4)放送
- 2.
- 対話様式:〈1〉自由対話〈2〉模擬対話〈3〉テキストの読み上げ
- 3.
- 対話形態:〈1〉対面〈2〉非対面
- 4.
- コーパス形態:〈1〉音声〈2〉テキスト
- 5.
- 対話言語:〈1〉共通語(2)方言(3)外国人との対話(4)外国語
- 6.
- 非言語情報:〈1〉なし(2)図表(地図、時刻表等)
- 7.
- 文字転写:〈1〉漢字かな混じり〈2〉かな〈3〉ローマ字
- 8.
- タグ情報:(1)文節(2)単語〈3〉間投詞〈4〉冗長語(あいづち、いい淀み、言い直し)〈5〉割り込み〈6〉発話の重なり〈7〉ポーズ(8)雑音〈9〉非言語情報(笑い等)
- 9.
- 品詞分類:〈1〉名詞〈2〉動詞〈3〉形容詞〈4〉形容動詞〈5〉副詞〈6〉連体詞〈7〉接続詞〈8〉感動詞〈9〉数詞〈10〉助詞〈11〉助動詞〈12〉接頭辞〈13〉接尾辞
- 10.
- 音声との対応:〈1〉ポーズ(呼気段落)〈2〉冗長語〈3〉割り込み〈4〉発話の重なり(5)非言語情報(笑い等)
- 11.
- 録音環境:〈1〉防音室〈2〉静かな室(3)事務室(4)計算機室(騒音環境)
- 12.
- 収録媒体:〈1〉DAT(2)8mmMT(直接AD変換)
- 13.
- マイクロホン:〈1〉接話型〈2〉卓上(手持ち)型
- 14.
- 低域フィルタ:遮断周波数、遮断周波数での減衰(dB)、減衰率(dB/Oct)、位相特性、等を明記
- 15.
- AD変換:量子化精度(16ビット、12ビット等)を明記
- 16.
- 標本化周波数:〈1〉16kHz(2)20kHz(3)24kHz(4)22kHz
- 17.
- ビデオ情報:〈1〉ビデオ撮影なし(2)ビデオ撮影あり
- 18.
- 配布媒体:CD-ROM
- 19.
- 対話者の音声はできる限り分離して2チャンネルに収録すること
- 20.
- 対話の長さ:3分程度以上任意
- 21.
- 対話の数:任意
- 22.
- 対話者数:全体で男女約半数づつが望ましい
- 23.
- タスクの例:観光案内、地理案内、空港案内、グルメ案内、交通案内、買いもの、テレフォンショッピング、料理、病気、税金、慶弔、お喋り、日常業務、教師と生徒、質問応答、セミナー、インタビュー、重点領域研究会の発表
- 24.
- テキストコーパス:Newsネットワーク、Email 等の利用、卒論、修論、博論、重点領域研究発表資料
Next: 付録C 各CD-ROMの概要
Up: 付録B アンケート項目
Previous: (1)音声言語コーパスに関するアンケート
Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997