1 はじめに

音声研究を進める上で音声データが必要なことは言うまでもない。その音声デー タは、多種多様(性別・年齢・方言・人数等)であることが求められる。従来は 各研究者が、必要に応じて音声データを収録し、保管・利用していた。音声研 究が進歩するにつれて処理可能なデータ量が増大し、そのため用意すべきデー タ量が大幅に増してきた。最近では、特に統計的手法の発達により大量の音声 データがシステムの学習のために必要とされるようになった。[1-4] 一方、 音声情報処理システムの研究・開発を行うためには、分析・合成・認識の各種 の手法を適切に比較・評価することが必要とされる。これを行う方法としては 現在のところ、共通の音声データを用いてこれらの処理を行い、その結果を比 較するという方法以外は知られていない。このようなことから、共通利用可能 な各種・大量の音声データを収録し、保管・公開することは研究・開発過程で の利用および認識システムの性能評価の両面から求められている。このような 目的に利用される音声データを一般に音声データベースあるいは音声コーパス と呼んでいる。音声情報処理の分野では 「音声データベース」というときに は、データベースシステムよりも「大量の音声データの集積」そのものを指す ことが多い。そのため最近では、それを意味する「音声コーパス」を使うよう になった。音声コーパスの必要性やその意義については近年広く認められるよ うになってきた。[5-8]

本重点領域研究を遂行する上でも音声対話コーパスは必須という立場に立ち、 コーパスワーキンググループ(以下、WGとする)が設けられた。本WGの目的は、 これから発展するであろう音声対話研究の基礎的なデータとして活用できる、 ある程度の規模のコーパスを構築することである。本WGのメンバーと活動 概要を付録Aに示す。


next up previous
Next: 2 音声対話コーパスの概要 Up: PASDコーパス - 重点領域模擬対話音声コーパス - Previous: PASDコーパス - 重点領域模擬対話音声コーパス -

Tatsuya Kawahara
Wed May 14 21:30:55 JST 1997